Эконометрический анализ на основе модели многофакторной регрессии
Требуется:
1. Рассчитать параметры линейного уравнения множественной регрессии, пояснить экономический смысл коэффициентов регрессии.
2. Найти:
- парные коэффициенты корреляции;
- коэффициент множественной корреляции;
- множественный коэффициент детерминации;
- скорректированный коэффициент детерминации;
- частные коэффициенты корреляции и детерминации;
- коэффициенты эластичности;
- стандартизированные коэффициенты регрессии.
Пояснить смысл найденных коэффициентов.
3. Проверить значимость коэффициентов регрессии и уравнения регрессии в целом на уровне значимости 𝛼 = 0,05. Найти среднюю ошибку аппроксимации.
4. Протестировать модель на мультиколлинеарность каждого фактора с остальными (критерий Фишера)
5. Сделать вывод о целесообразности введения второго фактора в модель.
6. Провести тест Голдфелда – Квандта на наличие гомоскедастичности остатков фактора Xj, имеющего наибольшую долю влияния на зависимую переменную Y
Решение
Изучается зависимость индекса человеческого развития Y от факторов: X4 – валовое накопление, % к ВВП; X6 – ожидаемая продолжительность жизни при рождении 1997 г., число лет.
1. Определим параметры уравнения y=a+b1x1+b2x2 из системы уравнений:
&y=n⋅a+b1⋅x1+b2⋅x2&yx1=ax1+b1⋅x12+b2⋅x1x2&yx2=ax2+b1⋅x1x2+b2⋅x22
Построим таблицу:
i Yi X4i X6i X4^2 X6^2 YX4 YX6 X4X6
1 0,905 20,6 75,7 424,36 5730,49 18,64 68,51 1559,42
2 0,545 25,2 62,6 635,04 3918,76 13,73 34,12 1577,52
3 0,894 20,7 78 428,49 6084,00 18,51 69,73 1614,60
4 0,900 17,5 78,2 306,25 6115,24 15,75 70,38 1368,50
5 0,740 18,5 67,6 342,25 4569,76 13,69 50,02 1250,60
6 0,932 19,7 79 388,09 6241,00 18,36 73,63 1556,30
7 0,701 42,4 69,8 1797,76 4872,04 29,72 48,93 2959,52
8 0,744 23,0 68,4 529,00 4678,56 17,11 50,89 1573,20
9 0,921 20,2 77,9 408,04 6068,41 18,60 71,75 1573,58
10 0,927 25,2 78,1 635,04 6099,61 23,36 72,40 1968,12
11 0,802 22,4 72,5 501,76 5256,25 17,96 58,15 1624,00
12 0,774 22,7 66,6 515,29 4435,56 17,57 51,55 1511,82
13 0,927 18,1 76,7 327,61 5882,89 16,78 71,10 1388,27
14 0,721 20,1 68,8 404,01 4733,44 14,49 49,60 1382,88
15 0,913 17,3 76,8 299,29 5898,24 15,79 70,12 1328,64
Сумма 12,35 333,60 1096,70 7942,28 80584,25 270,08 910,87 24236,97
Среднее 0,82 22,24 73,11 529,49 5372,28 18,01 60,72 1615,80
&12,35=15a+333,60b1+1096,70b2&270,08=333,60a+7942,28b1+24236,97b2&910,87=1096,70a+24236,97b1+80584,25b2
Решив систему с помощью матричных функций MS Excel, получим оценки параметров:
a=-0,529, b1=-0,003, b2=0,019
Уравнение регрессии имеет вид: Y=-0,529-0,003X4+0,019X6
С увеличением валового накопления капитала на 1% от ВВП и неизменной ожидаемой продолжительности жизни при рождении индекс человеческого развития в среднем снижается на 0,003 единиц. При увеличении ожидаемой продолжительности жизни при рождении на год и неизменном валовом накоплении капитала индекс человеческого развития в среднем увеличивается на 0,019 единиц.
2. Найдем парные коэффициенты корреляции, используя функцию Excel «КОРРЕЛ»:
r(Y,X4)=-0,45
r(Y,X6)=0,95
r(X4,X6)=-0,34
Связь между признаками Y, X4 умеренная, обратная, между признаками Y, X6 тесная прямая, между признаками X4, Х6 умеренная, обратная.
Вычислим множественный коэффициент корреляции:
Ryx1x2=ryx12+ryx22-2ryx1ryx2rx1x21-rx1x22
Ryx1x2=(-0,45)2+(0,95)2-2∙0,95(-0,45)(-0,34)1-(-0,34)2=0,96
Множественный коэффициент корреляции равен 0,96, следовательно, связь между индексом человеческого развития и группой признаков тесная. При этом множественный коэффициент корреляции незначительно превышает коэффициент парной корреляции r(Y,X6)=0,95, следовательно, вклад фактора Х4 в модель незначителен.
Найдем множественный коэффициент детерминации:
Ryx1x22=0,962=0,92
Совместное влияние признаков объясняет 92% вариации значения индекса человеческого развития.
Определим с корректированный (нормированный) коэффициент детерминации:
Rскор2=1-n-1n-k1-Ryx1x22=1-15-115-31-0,92=0,91
Скорректированный коэффициент детерминации значительно выше, чем коэффициент детерминации парной модели, следовательно, качество модели улучшилось после добавления второго фактора.
Найдем частные коэффициенты корреляции:
ryx1|x2=ryx1-ryx2rx1x2(1-ryx22)(1-rx1x22)=-0,45-0,95⋅(-0,34)(1-0,952)(1-(-0,34)2)=-0,45
ryx2|x1=ryx2-ryx1rx1x1(1-ryx12)(1-rx1x12)=0,95-(-0,45)⋅(-0,34)(1-(-0,45)2)(1-(-0,34)2)=0,95
Частные коэффициенты корреляции практически не отличаются (с учетом округления) от парных, следовательно, каждый из факторов не оказывает влияния на характер силы другого фактора с результативным признаком.
Найдем частные коэффициенты детерминации:
ryx1|x22=-0,452=0,20
ryx2|x12=0,952=0,90
Модель зависимости только от фактора Х4 объясняет 20% вариации признака Y, от фактора Х6 – 90% вариации признака Y.
Найдем коэффициенты эластичности:
Эi=bi⋅XiY
Э(X4)=-0,003⋅22,240,82=-0,08
ЭX6=0,019⋅73,110,82=1,72
С увеличением валового накопления капитала на 1% и неизменной ожидаемой продолжительности жизни при рождении индекс человеческого развития в среднем снижается на 0,08%
. При увеличении ожидаемой продолжительности жизни при рождении на 1% и неизменном валовом накоплении капитала индекс человеческого развития в среднем увеличивается на 1,72%.
Найдем стандартизированные коэффициенты регрессии:
βyx1(x2)=ryx1-ryx2rx1x21-rx1x12=-0,45-0,95⋅(-0,34)1-(-0,34)2=-0,15
βyx2(x1)=ryx2-ryx1rx1x11-rx1x12=0,95-(-0,45)⋅(-0,34)1-(-0,34)2=0,90
Скорректированный коэффициент регрессии при факторе Х6 по модулю больше, чем при факторе Х4, следовательно, влияние фактора Х6 (ожидаемая продолжительность жизни) на индекс человеческого развития сильнее, чем фактора Х4 (валовое накопление капитала).
3. Проверим значимость тренда. Расчетное значение F-критерия Фишера для модели множественной регрессии: F=R21-R2⋅n-m-1m=0,911-0,91⋅15-2-12=67,73
Критическое значение F-критерия Фишера при уровне значимости 0,05 и степенях свободы 2 и 15-2-1=12 равно 4,26. Т.к. расчетное значение F-критерия Фишера превышает критическое значение, нулевая гипотеза отклоняется, т.е. модель признается значимой на уровне значимости 0,05.
Проверим значимость коэффициентов регрессии. Воспользуемся t-критерием Стьюдента. Рассчитаем оценки признака Y, подставив в уравнение регрессии наблюдаемые значения факторов X4, Х6.
Расчетное значение t-критерия Стьюдента равно отношению коэффициента к его средней ошибке