Анализируется объем Y сбережений домохозяйства за 10 лет. Предполагается, что его размер yi в текущем году i зависит от величины yi-1 располагаемого дохода X1 в предыдущем году и от величины X2i реальной процентной ставки X2 в рассматриваемом году. Статистические данные представлены в таблице:
Год 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
X1, тыс. у.е. 100 110 140 150 160 160 180 200 230 250 260
X2 % 2 2 3 2 3 4 4 3 4 5 5
Y, тыс. у.е. 20 25 30 30 35 38 40 38 44 50 55
Необходимо:
а) по МНК оценить коэффициенты линейной регрессии;
б)оценить статистическую значимость найденных эмпирических коэффициентов регрессии b0, b1, b2;
в)построить 95%-е доверительные интервалы для найденных коэффициентов;
г)вычислить коэффициент детерминации R2 и оценить его статистическую значимость при α = 0,05;
д)определить, какой процент разброса зависимой переменной объясняется данной регрессией;
е)сравнить коэффициент детерминации R2 со скорректированным коэффициентом детерминации R2;
ж)вычислить статистику DW Дарбина–Уотсона и оценить наличие автокорреляции;
з)сделать выводы по качеству построенной модели;
и) определить, увеличивается или уменьшается объем сбережений с ростом процентной ставки; будет ли ответ статистически обоснованным;
к) спрогнозировать средний объем сбережений в 1991 году, если предполагаемый доход составит 270 тыс. у.е., а процентная ставка будет равна 5,5.
Решение
Все предварительные расчеты представлены в таблице 1.
Таблица 1 – Расчет параметров уравнения регрессии по МНК
год x1 x2 yi
x12 x22 x1 x2 x1 yi
x2 yi
2000 100,00 2,00 20,00 10 000,00 4,00 200,00 2 000,00 40,00
2001 110,00 2,00 25,00 12 100,00 4,00 220,00 2 750,00 50,00
2002 140,00 3,00 30,00 19 600,00 9,00 420,00 4 200,00 90,00
2003 150,00 2,00 30,00 22 500,00 4,00 300,00 4 500,00 60,00
2004 160,00 3,00 35,00 25 600,00 9,00 480,00 5 600,00 105,00
2005 160,00 4,00 38,00 25 600,00 16,00 640,00 6 080,00 152,00
2006 180,00 4,00 40,00 32 400,00 16,00 720,00 7 200,00 160,00
2007 200,00 3,00 38,00 40 000,00 9,00 600,00 7 600,00 114,00
2008 230,00 4,00 44,00 52 900,00 16,00 920,00 10 120,00 176,00
2009 250,00 5,00 50,00 62 500,00 25,00 1 250,00 12 500,00 250,00
2010 260,00 5,00 55,00 67 600,00 25,00 1 300,00 14 300,00 275,00
2000 1 940,00 37,00 405,00 370 800,00 137,00 7 050,00 76 850,00 1 472,00
Сумма 176,36 3,36 36,82 33 709,09 12,45 640,91 6 986,36 133,82
Среднее 100,00 2,00 20,00 10 000,00 4,00 200,00 2 000,00 40,00
год ∑(xi1 - x1)2 ∑(xi2 - x2)2 ∑(yi - ӯ)2 ∑(xi1 - x1)(xi2 - x2) ∑(xi1 - x1)(yi - ӯ) ∑(xi2 - x2)( yi - ӯ)
2000 5 831,40 1,86 282,85 104,13 1 284,30 22,93
2001 4 404,13 1,86 139,67 90,50 784,30 16,12
2002 1 322,31 0,13 46,49 13,22 247,93 2,48
2003 695,04 1,86 46,49 35,95 179,75 9,30
2004 267,77 0,13 3,31 5,95 29,75 0,66
2005 267,77 0,40 1,40 -10,41 -19,34 0,75
2006 13,22 0,40 10,12 2,31 11,57 2,02
2007 558,68 0,13 1,40 -8,60 27,93 -0,43
2008 2 876,86 0,40 51,58 34,13 385,21 4,57
2009 5 422,31 2,68 173,76 120,50 970,66 21,57
2010 6 995,04 2,68 330,58 136,86 1 520,66 29,75
2000 28 654,55 12,55 1 087,64 524,55 5 422,73 109,73
Сумма 2 604,96 1,14 98,88 47,69 492,98 9,98
Среднее 5 831,40 1,86 282,85 104,13 1 284,30 22,93
Используя данные таблицы 1, по МНК вычисляем коэффициенты регрессии по формулам:
b1=(xi1-x1)(yi-y)×(xi2-x2)2-(xi2-x2)(yi-y)×(xi1-x1)(xi2-x2)(xi1-x1)2(xi2-x2)2-((xi1-x1)(xi2-x2))2;b2=(xi2-x2)(yi-y)×(xi1-x1)2-(xi1-x1)(yi-y)×(xi1-x1)(xi2-x2)(xi1-x1)2(xi2-x2)2-((xi1-x1)(xi2-x2))2;b0=y-b1x1-b2x2.
В нашем случае получаем значения коэффициентов b1 и b2:
b1=5 422,73×12,55-109,73×524,5528 654,55×12,55-(524,55)2=10 496,3984 461,9=0,1243;
b2=109,73×28 654,55-5 422,73×524,5528 654,55×12,55-(524,55)2=299 770,7584 461,9=3,5492.
Подставляя найденные коэффициенты b1 и b2 во второе уравнение, получаем:
b0=36,82-0,1243×176,36-3,5492×3,36=2,9731.
Таким образом, получено следующее уравнение множественной линейной регрессии: Ŷ = 2,9731 + 0,1243Х1 + 3,5492Х2
.
Расчет ошибок регрессии произведем в таблице 2.
Таблица 2 – Расчет ошибок регрессии
Год Y Ŷ ei
ei2 ei – ei-1 (ei – ei-1)2
2000 20,00 22,50 - 2,50 6,26
-
2001 25,00 23,74 1,26 1,58 3,76 14,12
2002 30,00 31,02 - 1,02 1,05 - 2,28 5,19
2003 30,00 28,72 1,28 1,65 2,31 5,32
2004 35,00 33,51 1,49 2,22 0,21 0,04
2005 38,00 37,06 0,94 0,89 - 0,55 0,30
2006 40,00 39,54 0,46 0,21 - 0,49 0,24
2007 38,00 38,48 - 0,48 0,23 -0,94 0,88
2008 44,00 45,76 - 1,76 3,09 - 1,28 1,63
2009 50,00 51,79 - 1,79 3,22 -0,04 0,00
2010 55,00 53,04 1,96 3,85 3,76 14,12
Сумма 405,00 405,17 ≈ 0 24,24 - 41,83
Среднее 36,82 36,83
- - -
Проанализируем статистическую значимость коэффициентов регрессии, предварительно рассчитав их стандартные ошибки. Дисперсия регрессии вычисляется по формуле:
S2=ei2n-m-1; S=S2.
В нашем случае получаем следующий результат:
S2=24,2411-2-1=3,03; S=3,03=1,7407.
Стандартные ошибки коэффициентов регрессии определяются по следующим формулам с использованием данных таблицы 1 и дисперсии регрессии:
Sb0=1n+x12(xi2-x2)2+x22(xi1-x1)2-2x1x2(xi1-x1)(xi2-x2)(xi1-x1)2(xi2-x2)2-((xi1-x1)(xi2-x2))2×S2
Sb1=S2(xi1-x1)2×(1-rx1x22); Sb2=S2(xi2-x2)2×(1-rx1x22).
Как видим из представленных выше формул, для определения стандартных ошибок коэффициентов регрессии необходимо определить значение межфакторного коэффициента корреляции, пользуясь следующей формулой:
rx1x2= x1x2-x1×x2x12-x12×x22-x22;
Получаем,
rx1x2=640,91-176,36×3,3633 709,09-176,362×12,45-3,362=48,340451,0514×1,077=0,879.
Значение коэффициента межфакторной корреляции демонстрирует наличие коллинеарности факторов.
Определим стандартные ошибки коэффициентов регрессии:
Sb0=111+176,362×12,55+3,362×28 654,55-2×176,36×3,36×524,5528 654,55×12,55-(524,55)2×3,03=111+390340,76248+323 498,40768-621 664,7673684 461,9×3,03=3,5821=1,8927.
Sb1=3,0328 654,55×(1-0,8792)=0,0005=0,0216.
Sb2=3,0312,55×(1-0,8792)=1,0619=1,0305.
Таким образом, ошибки коэффициентов регрессии составили:
Sb0=1,8927; Sb1=0,0216;Sb2=1,0305.
Оценим статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента при а = 0,05.
Критическое значение для а/2 = 0,05/2 = 0,025 и v = n – m – 1 = 11-2-1=8 составило: t крит=2,7515.
Наблюдаемые значения для коэффициентов регрессии определим с использованием следующих формул:
tb0=b0Sb0; tb1=b1Sb1;tb2=b2Sb2.
В нашем случае получаем:
tb0=2,97311,8927=1,5708;tb1=0,12430,0216=5,7546;tb2=3,54921,0305=3,4441.
Таким образом, сравнивая наблюдаемые значения с критическим получаем, что коэффициент регрессии b0 статистически незначим, а коэффициенты b1 и b2 статистически значимы.
Для определения границ доверительных интервалов для коэффициентов регрессии используем следующую формулу:
b-t крит×Sb<b<b+t крит×Sb
2,9731-2,7515×1,8927<b0<2,9731+2,7515×1,8927
0,1243-2,7515×0,0216<b1<0,1243+2,7515×0,0216
3,5492-2,7515×1,0305<b2<3,5492+2,7515×1,0305
Таким образом, доверительные интервалы для коэффициентов регрессии составят:
-2,2347<b0<8,1809;0,0649<b1<0,1837;0,7138<b2<6,3846.
Для определения качества построенного уравнения определим коэффициент детерминации по формуле:
R2=1-ei2(yi-y)2.
R2=1-24,241 087,64=0,9777
Значение коэффициента детерминации указывает на хорошее качество подбора построенного уравнения регрессии, так как оно описывает 97,77% исходных данных