Задание для самостоятельной работы
Имеется информация о результатах работы 16 фирм по следующим показателям (см. рис.26):
y – объем реализации (млн. руб.);
x1 – расходы на рекламу (млн. руб.);
x2 – цена собственной продукции;
x3 – цена продукции фирмы-конкурента;
x4 – инвестиции (в процентах к предыдущему году).
Провести корреляционно – регрессионный анализ этой информации в соответствии с рассмотренным тренировочным примером. Для этого:
1. Проанализировать описательную статистику (см. рис.27).
2. Проанализировать матрицу парных коэффициентов корреляции (см. рис.28)
3. Проанализировать в сравнительном анализе с предыдущей матрицей матрицу частных коэффициентов корреляции (см. рис.29).
4. Проанализировать точность уравнения полной регрессии (см. рис.30).
5. Проанализировать точность уравнения пошаговой регрессии (см. рис.31) и проинтерпретировать его коэффициенты.
81915322389500
6. Основываясь на отчете о пошаговой регрессии в ППП Statistica (рис.31), проведите сравнительный анализ степени влияния оставшихся в регрессии переменных на зависимую переменную по коэффициентам регрессии в натуральном масштабе и по стандартизованным коэффициентам регрессии. Поясните результаты анализа исходя из смысла этих коэффициентов.
635013906500
-3175701421000-1905344233500
Решение
Анализ описательной статистики
Стандартные отклонения (standard deviation) равны:
Sy=67,6788, Sx1 =4,75387, Sx2=0,884473, Sx3=0,885061, Sx4=4,51248;
коэффициенты вариации (coeff. of variation):
Vy=21,7267%, Vx1=51,0826%, Vx2=5,55181%, Vx3=5,1986%, Vx4=4,20793%.
Минимальные значения:
- y (минимальный объем реализации) - 183 млн. руб.;
- x1 (минимальные расходы на рекламу) – 3,8 млн. руб.;
- x2 (минимальная цена собственной продукции) – 14,8 руб.;
- x3 (минимальная цена продукции фирмы-конкурента) – 15,8 руб.;
- x4 (минимальные инвестиции) – 98,4% к предыдущему году.
Максимальные значения:
- y (максимальный объем реализации) – 384,0 млн. руб.;
- x1 (максимальные расходы на рекламу) – 19,8 млн. руб.;
- x2 (максимальная цена собственной продукции) – 18,1 руб.;
- x3 (максимальная цена продукции фирмы-конкурента) – 18,5 руб.;
- x4 (максимальные инвестиции) – 112,9% к предыдущему году.
Средние значения (average):
- yср=311,5 млн. руб.;
- x1ср=9,30625 млн. руб.;
- x2ср=15,9313 руб.;
- x3ср = 17,025 руб.;
- x4ср =107,238% к предыдущему году.
Таким образом, стандартные отклонения x1 и x4 почти в 5 раз больше, чем стандартные отклонения x2 и x3. А коэффициент вариации для переменной x1 почти в десять раз больше, чем коэффициенты вариации остальных факторных переменных и в 2,35 раз больше коэффициента вариации переменной y. Это объясняется тем, что, анализируемые показатели имеют разные единиц измерения (млн. руб., руб., %). Потому более реальное представление о сравнительной мере рассеяния дает коэффициент вариации. Для одинаковых единиц измерения эти два показателя дают сходную информацию: единицы измерения переменных x2 и x3 – руб.
2. Анализ матрицы парных коэффициентов корреляции
В матрице парных коэффициентов корреляции столбец x4, отсутствует, но в силу симметрии его можно заменить четвертой строкой.
Анализ матрицы парных коэффициентов корреляции показывает, что:
- значимой являются только переменная x4, для которой расчетный уровень значимости 0,0000 меньше 0,05 (для переменных x1, x2 и x3 расчетные уровни значимости больше 0,05);
- мультиколлинеарность между независимыми переменными отсутствует, т
. наибольший коэффициент корреляции между независимыми переменными rx1x2= 0,5856< 0,8, но он превышает тесноту связи x1 с y и x2 с y. В связи с этим для улучшения разрабатываемой модели необходимо исключить из ее структуры факторы x1 и x2, как малоинформативные и недостаточно статистически надежные.
3. Сравнительный анализ матрицы парных коэффициентов корреляции и матрицы частных коэффициентов корреляции.
Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух переменных, чем коэффициенты парной корреляции, т.к. исключают парную зависимость от воздействия других переменных. Сравнительный анализ матрицы парных коэффициентов корреляции и матрицы частных коэффициентов корреляции показывает, что чистая связь между y и x1 и y и x2 ослабла (между y и x2 вообще стала отрицательной), а между y и x3 и y и x4 наоборот усилилась. Коэффициент частной корреляции между y и x4 по-прежнему остается наибольшим. Можно заключить, что объем реализации продукции практически не зависит от цены собственной продукции и находится в обратно пропорциональной зависимости. Анализ коэффициентов частной корреляции подтвердили тот факт, что самым значимым фактором оказался x4 - инвестиции (в процентах к предыдущему году).
4. Анализ точности уравнения полной регрессии
Уравнение полной регрессии имеет вид:
y=-1267,71+2,7039x1-2,75716x2+16,3339x3+12,308x4.
Дисперсионный анализ регрессии показывает, что уравнение регрессии значимо (р-величина статистики Фишера равна 0,002, т.е. меньше 0,05).
В нижней части таблицы приводятся коэффициент детерминации R-squared в процентах. Коэффициент множественной детерминации (R-squared) (R2=84,3028%) и исправленный коэффициент детерминации (R-squared (adjusted for d.f.)) (Radj2=78,5947%) показывают, что уравнение регрессии довольно точно описывает зависимость объема реализации (y) от остальных переменных, т.к. 84,30% вариации зависимой переменной y учтено в модели и обусловлено вариацией включенных факторов.
Исправленный коэффициент детерминации R2=78,5947% меньше неисправленного