Проведено бюджетное обследование 24 случайно выбранных домохозяйств. Оно дало следующие результаты (в ден. ед.):
Домохозяйство Накопления, у Доход, х1
Стоимость имущества, х2
1 15,2 45,8 41,7
2 35,1 73,4 27,9
3 15,6 25,5 31
4 23,4 78,8 70,8
5 31,8 74 43,5
6 13,4 43,6 61,6
7 27,2 66,9 65,1
8 15,9 33,6 29,3
9 19,9 24,9 35,8
10 31,2 61,7 37
11 35 74,9 35,1
12 15,2 45,8 41,7
13 22,4 68,6 67,4
14 35,4 29 49,7
15 28,3 79,8 69,4
16 13 52,4 73,4
17 17,1 44,1 40,4
18 24,6 55,1 22,9
19 21,3 39,1 28,2
20 24,6 46,4 27,5
21 36,1 78,2 48,3
22 31,1 75,4 43,9
23 25,9 62,5 51,3
24 22,4 68,6 67,4
Требуется:
1. Построить корреляционное поле между накоплениями и доходом. Выдвинуть гипотезу о тесноте и виде зависимости между накоплениями и доходом.
2. Оценить тесноту линейной связи между накоплениями и доходом с надежностью 0,9.
3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости накоплений от дохода.
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы.
5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,9.
6. Для домохозяйства с доходом 45 ден. ед. дать точечный и интервальный прогноз накоплений с надежностью 0,9.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии для зависимости накоплений от дохода и стоимости имущества. Пояснить экономический смысл его параметров.
8. Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы.
9. Найти коэффициенты парной и частной корреляции. Проанализировать их.
10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
11. С помощью F-критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9.
12. Для домохозяйства с доходом 45 ден. ед. и стоимостью имущества 30 ден. ед. дать точечный и интервальный прогноз накоплений с надежностью 0,9 .
13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
Решение
Построим корреляционное поле между накоплениями (у) и доходом (х1).
Рис. 1. Корреляционное поле х1у
Мы видим, что в основном с ростом х1 значение признака у растет, то есть между х1 и у существует прямая связь. Кроме того, точки располагаются вдоль прямой линии, то есть можно выдвинуть гипотезу о линейном виде зависимости между накоплениями и доходом вида:
2. Оценим тесноту линейной связи между накоплениями и доходом с надежностью 0,9. Рассчитаем коэффициент линейной корреляции:
Вспомогательные суммы:
x1 y x1*x1 x1*y y*y
45,8 15,2 2097,64 696,16 231,04
73,4 35,1 5387,56 2576,34 1232,01
25,5 15,6 650,25 397,8 243,36
78,8 23,4 6209,44 1843,92 547,56
74 31,8 5476 2353,2 1011,24
43,6 13,4 1900,96 584,24 179,56
66,9 27,2 4475,61 1819,68 739,84
33,6 15,9 1128,96 534,24 252,81
24,9 19,9 620,01 495,51 396,01
61,7 31,2 3806,89 1925,04 973,44
74,9 35 5610,01 2621,5 1225
45,8 15,2 2097,64 696,16 231,04
68,6 22,4 4705,96 1536,64 501,76
29 35,4 841 1026,6 1253,16
79,8 28,3 6368,04 2258,34 800,89
52,4 13 2745,76 681,2 169
44,1 17,1 1944,81 754,11 292,41
55,1 24,6 3036,01 1355,46 605,16
39,1 21,3 1528,81 832,83 453,69
46,4 24,6 2152,96 1141,44 605,16
78,2 36,1 6115,24 2823,02 1303,21
75,4 31,1 5685,16 2344,94 967,21
62,5 25,9 3906,25 1618,75 670,81
68,6 22,4 4705,96 1536,64 501,76
Сумма 1348,1 581,1 83196,93 34453,76 15387,13
Среднее 56,171 24,213 3466,539 1435,573 641,130
σ2 311,376 54,885
σ 17,646 7,408
Получаем:
То есть связь между х1 и у – прямая, умеренная (коэффициент линейной корреляции положителен и больше 0,5).
Проверим гипотезу о значимости коэффициента корреляции, для этого определим значение критерия:
Критическое значение критерия Стьюдента при k = n – 2 = 22 и α = 0,1 равно 1,72. Поскольку оно меньше фактического, делаем вывод о значимости линейного коэффициента корреляции.
3. Рассчитаем коэффициенты линейного уравнения регрессии для зависимости накоплений от дохода.
Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК) решается следующая система относительно a и b:
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
Подставляем:
0,2426
10,586.
Уравнение линейной регрессии:
4. Проверим статистическую значимость параметров уравнения регрессии с надежностью 0,9.
Оценка значимости коэффициентов регрессии с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
; .
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Вспомогательные данные:
(x1-x1sr)^2 yteor
y (y-yteor)^2
107,5576 21,697 15,2 42,212
296,8384 28,393 35,1 44,986
940,7102 16,772 15,6 1,374
512,0716 29,703 23,4 39,726
317,8732 28,538 31,8 10,638
158,03 21,163 13,4 60,270
115,1114 26,816 27,2 0,148
509,45 18,737 15,9 8,051
977,8754 16,627 19,9 10,714
30,56984 25,554 31,2 31,873
350,7754 28,757 35 38,978
107,5576 21,697 15,2 42,212
154,48 27,228 22,4 23,313
738,2632 17,621 35,4 316,079
558,3296 29,945 28,3 2,708
14,22044 23,298 13 106,054
145,709 21,285 17,1 17,511
1,147041 23,953 24,6 0,418
291,419 20,072 21,3 1,509
95,47244 21,843 24,6 7,603
485,2768 29,557 36,1 42,807
369,7544 28,878 31,1 4,937
40,05624 25,749 25,9 0,023
154,48 27,228 22,4 23,313
Сумма 7473,03 581,113 581,1 877,456
Находим:
;
;
;
.
Сравнивая фактическое и критическое (табличное) значения t-статистики - tтабл и tфакт - принимаем или отвергаем гипотезу Но
. Табличное значение -критерия для числа степеней свободы n – 2 = 22 и α = 0,1составит 1.72. Оно меньше обеих фактических значений критериев, следовательно они статистически надежны с уровнем надежности 0,1.
Доверительный интервал для параметров регрессии:
для b - ;
для a - .
5. Коэффициент детерминации - квадрат коэффициента корреляции:
Оценим статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера:
,
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости , у нас оно равно 2,95 при = 0,1 и к1 = 1, к2 = 24 – 2 = 22.
Поскольку Fтабл < Fфакт, то Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
6. Для домохозяйства с доходом 45 ден. ед. дадим точечный прогноз:
Определим интервальный прогноз накоплений с надежностью 0,9.
Вычисляется средняя стандартная ошибка прогноза :
,
где
Строится доверительный интервал прогноза:
; ;
где .
Уровень значимости =0,1:
tтабл = 1,72;
= 1,72*6,497 = 11,175;
; ; .
7. Рассчитаем коэффициенты линейного уравнения множественной регрессии для зависимости накоплений от дохода и стоимости имущества.
Ищем модель в виде:
Поиск параметров осуществляется по методу наименьших квадратов, который приводит к матричному уравнению:
Тут А, Х,Y,- матрицы.
- транспонирована к Х.
Их явный вид (использована программа Excel):
1 45,8 41,7
15,2
1 73,4 27,9
35,1
1 25,5 31
15,6
1 78,8 70,8
23,4
1 74 43,5
31,8
1 43,6 61,6
13,4
1 66,9 65,1
27,2
1 33,6 29,3
15,9
1 24,9 35,8
19,9
1 61,7 37
31,2
1 74,9 35,1
35,0
X = 1 45,8 41,7 Y = 15,2
1 68,6 67,4
22,4
1 29 49,7
35,4
1 79,8 69,4
28,3
1 52,4 73,4
13,0
1 44,1 40,4
17,1
1 55,1 22,9
24,6
1 39,1 28,2
21,3
1 46,4 27,5
24,6
1 78,2 48,3
36,1
1 75,4 43,9
31,1
1 62,5 51,3
25,9
1 68,6 67,4
22,4
24 1348,1 1110,3
XT*X = 1348,1 83196,93 65073,14
1110,3 65073,14 57255,17
0,6007 -0,0056 -0,0053
(XT*X)-1 = -0,0056 0,0002 -0,0001
-0,0053 -0,0001 0,0002
581,1
15,5787
XT*Y = 34453,76 B = 0,3124
26593,99
-0,1926
Получили уравнение множественной регрессии:
8