Проведено бюджетное обследование 18 случайно выбранных домохозяйств. Оно дало следующие результаты (в ден. ед.).
Таблица 1
Домохозяйство Накопления, y Доход, x1 Стоимость имущества, x2
1 16,6 44,3 47,7
2 41,2 82,7 34,9
3 6,4 27,4 33,9
4 28,3 70,7 65,7
5 29,5 72,5 44,3
6 30,8 39,7 58,1
7 22,9 68,4 64,6
8 23,7 28,0 33,9
9 14,3 29,6 36,0
10 21,1 72,6 60,8
11 9,8 26,2 56,3
12 29,7 82,4 70,0
13 13,7 52,1 74,8
14 20,7 46,1 35,8
15 28,8 55,4 31,3
16 13,6 33,6 29,8
17 23,2 47,6 27,9
18 36,8 73,8 46,3
Требуется:
1. Построить корреляционное поле между накоплениями и доходом. Выдвинуть гипотезу о тесноте и виде зависимости между накоплениями и доходом.
2. Оценить тесноту линейной связи между накоплениями и доходом с надежностью 0,9.
3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости накоплений от дохода.
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы.
5. Рассчитать коэффициент детерминации. С помощью F-критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,9.
6. Для домохозяйства с доходом 69,1 ден. ед. дать точечный и интервальный прогноз накоплений с надежностью 0,9.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии для зависимости накоплений от дохода и стоимости имущества. Пояснить экономический смысл его параметров.
8. Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы.
9. Найти коэффициенты парной и частной корреляции. Проанализировать их.
10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
11. С помощью F-критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9.
12. Для домохозяйства с доходом 69,1 ден. ед. и стоимостью имущества 45 ден. ед. дать точечный и интервальный прогноз накоплений с надежностью 0,9.
13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
Решение
1. Построим корреляционное поле между накоплениями и доходом (рис. 1).
Рис. 1. Корреляционное поле
По корреляционному полю можно предположить прямую линейную зависимость между накоплениями и доходом вида:
2. Оценим тесноту линейной связи между накоплениями и доходом с помощью коэффициента корреляции:
,
где , , , .
Вспомогательные расчеты проведем в таблице (табл. 2).
Таблица 2
Вспомогательные расчеты для коэффициента корреляции
№ y x1 yx1
1 16,6 44,3 275,56 1962,49 735,38
2 41,2 82,7 1697,44 6839,29 3407,24
3 6,4 27,4 40,96 750,76 175,36
4 28,3 70,7 800,89 4998,49 2000,81
5 29,5 72,5 870,25 5256,25 2138,75
6 30,8 39,7 948,64 1576,09 1222,76
7 22,9 68,4 524,41 4678,56 1566,36
8 23,7 28 561,69 784,00 663,60
9 14,3 29,6 204,49 876,16 423,28
10 21,1 72,6 445,21 5270,76 1531,86
11 9,8 26,2 96,04 686,44 256,76
12 29,7 82,4 882,09 6789,76 2447,28
13 13,7 52,1 187,69 2714,41 713,77
14 20,7 46,1 428,49 2125,21 954,27
15 28,8 55,4 829,44 3069,16 1595,52
16 13,6 33,6 184,96 1128,96 456,96
17 23,2 47,6 538,24 2265,76 1104,32
18 36,8 73,8 1354,24 5446,44 2715,84
Сумма 411,1 953,1 10870,73 57218,99 24110,12
Среднее 22,84 52,95 603,93 3178,83 1339,45
По таблице 2 получаем:
Коэффициент корреляции попадает в интервал от 0,7 до 0,9, что говорит о наличии сильной линейной связи.
Проверим значимость коэффициента корреляции на уровне значимости 0,1. Для этого рассчитаем значения выражения:
Находим критическое значение критерия Стьюдента по таблице критических точек: .
Т.к. условие выполняется, то коэффициент парной корреляции статистически значим, т.е. они существенно отличается от нуля. Таким образом, линейную связь между признаками можно считать установленной.
3. Рассчитаем коэффициенты линейного уравнения регрессии для зависимости накоплений от дохода с помощью метода наименьших квадратов из системы:
По данным таблицы 2 получаем:
Решая систему, получаем линейное уравнение .
Таким образом, с ростом доходов на единицу накопления в среднем возрастают на 0,347, а при нулевом доходе составляют 4,471.
4. Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 – не равно) на уровне значимости α = 0,1.
Проверим статистическую значимость параметров уравнения регрессии с помощью t-критерия Стьюдента:
,
где – средняя квадратическая стандартная ошибка коэффициента регрессии :
; ,
где – стандартная ошибка регрессии:
.
Вспомогательные расчеты для расчета стандартных ошибок регрессии проведем в таблице 3.
Таблица 3
Вспомогательные расчеты для стандартных ошибок регрессии
№ y x1
1 16,6 44,3 19,84 -3,24 10,49
2 41,2 82,7 33,16 8,04 64,66
3 6,4 27,4 13,98 -7,58 57,39
4 28,3 70,7 29,00 -0,70 0,48
5 29,5 72,5 29,62 -0,12 0,01
6 30,8 39,7 18,24 12,56 157,69
7 22,9 68,4 28,20 -5,30 28,07
8 23,7 28 14,18 9,52 90,56
9 14,3 29,6 14,74 -0,44 0,19
10 21,1 72,6 29,66 -8,56 73,20
11 9,8 26,2 13,56 -3,76 14,13
12 29,7 82,4 33,06 -3,36 11,26
13 13,7 52,1 22,54 -8,84 78,22
14 20,7 46,1 20,46 0,24 0,06
15 28,8 55,4 23,69 5,11 26,12
16 13,6 33,6 16,13 -2,53 6,38
17 23,2 47,6 20,98 2,22 4,92
18 36,8 73,8 30,07 6,73 45,27
Сумма 411,1 953,1 411,10 0,00 669,10
По данным таблицы 3 получаем:
,
тогда:
;
;
Сравнивая расчетное и критическое значения (, ), делаем вывод, что с вероятностью 90% коэффициент статистически не значим, а коэффициент – статистически значим.
Определим доверительные интервалы для коэффициентов по формуле:
.
Подставляя данные, получаем:
Таким образом, с вероятностью 90% при росте доходов на 1 накопления увеличатся от 0,210 до 0,484, а при нулевом доходе составят от –3,276 до 12,217.
5
. Коэффициент детерминации для данного уравнения равен , т.е. на 54,8% изменение суммы накоплений зависит от изменения дохода и на 45,2% – от иных факторов, не включенных в модель.
Проверим гипотезу H0 о значимости уравнения регрессии, т.е. равенстве коэффициента детерминации нулю (при альтернативе H1 – не равно) на уровне значимости α = 0,1.
С помощью F-критерия Фишера оценим статистическую значимость уравнения регрессии по формуле:
.
В данном случае получаем:
Находим критическое значение критерия Фишера по таблице критических точек: .
Т.к. условие выполняется, то с вероятностью 90% коэффициент детерминации значимо отличается от нуля и уравнение в целом статистически значимо.
6. Для домохозяйства с доходом 69,1 ден. ед. дадим точечный прогноз уровня накопления:
Определим доверительный интервал прогнозного значения по формуле
где – среднеквадратическая ошибка прогноза:
Подставляя данные, получаем:
Таким образом, с вероятностью 90% при уровне доходов 69,1 накопления составят от 16,631 до 40,251.
7. Рассчитаем коэффициенты множественного линейного уравнения регрессии с помощью метода наименьших квадратов из системы:
Вспомогательные расчеты для множественной регрессии приведены в таблице 4.
Таблица 4
Вспомогательные расчеты для коэффициентов множественной регрессии
№ y x1 x2
1 16,6 44,3 47,7 735,38 791,82 1962,49 2275,29 2113,11
2 41,2 82,7 34,9 3407,24 1437,88 6839,29 1218,01 2886,23
3 6,4 27,4 33,9 175,36 216,96 750,76 1149,21 928,86
4 28,3 70,7 65,7 2000,81 1859,31 4998,49 4316,49 4644,99
5 29,5 72,5 44,3 2138,75 1306,85 5256,25 1962,49 3211,75
6 30,8 39,7 58,1 1222,76 1789,48 1576,09 3375,61 2306,57
7 22,9 68,4 64,6 1566,36 1479,34 4678,56 4173,16 4418,64
8 23,7 28,0 33,9 663,60 803,43 784,00 1149,21 949,20
9 14,3 29,6 36,0 423,28 514,80 876,16 1296,00 1065,60
10 21,1 72,6 60,8 1531,86 1282,88 5270,76 3696,64 4414,08
11 9,8 26,2 56,3 256,76 551,74 686,44 3169,69 1475,06
12 29,7 82,4 70,0 2447,28 2079,00 6789,76 4900,00 5768,00
13 13,7 52,1 74,8 713,77 1024,76 2714,41 5595,04 3897,08
14 20,7 46,1 35,8 954,27 741,06 2125,21 1281,64 1650,38
15 28,8 55,4 31,3 1595,52 901,44 3069,16 979,69 1734,02
16 13,6 33,6 29,8 456,96 405,28 1128,96 888,04 1001,28
17 23,2 47,6 27,9 1104,32 647,28 2265,76 778,41 1328,04
18 36,8 73,8 46,3 2715,84 1703,84 5446,44 2143,69 3416,94
Сумма 411,1 953,1 852,1 24110,12 19537,15 57218,99 44348,31 47209,83
Среднее 22,8 53,0 47,3 1339,5 1085,4 3178,8 2463,8 2622,8
По данным таблицы 4 получаем:
Решая систему, получаем .
Таким образом, с ростом доходов на единицу накопления в среднем возрастают на 0,407, с ростом стоимости имущества на единицу – сокращаются на 0,193, а при нулевом доходе составляют 10,444.
8