Множественная регрессия и корреляция
Имеются данные по ряду стран. Исходные данные (таблица 3).
Таблица 3
Исходные данные
страна Продолжительность жизни при рождении, лет (у) численность населения, обслуживаемого одним врачом, чел (x1) валовый внутренний продукт на душу населения, тыс. долл. (x2)
1 2 3 4
Россия 65,90 230,00 9,50
Австрия 77,10 298,00 24,10
Белоруссия 67,90 230,00 7,10
Великобритания 77,20 590,00 21,50
Германия 77,40 295,00 24,50
Норвегия 78,70 350,00 29,50
Финляндия 77,20 340,00 22,40
Франция 78,20 370,00 25,10
Турция 69,30 820,00 7,40
Узбекистан 70,30 326,00 3,50
США 76,90 395,00 34,30
Япония 81,50 556,00 31,10
Требуется:
Определите парные и частные коэффициенты корреляции. Сделайте выводы.
Постройте линейное уравнение множественной регрессии и поясните смысл его параметров. Рассчитайте скорректированный коэффициент детерминации.
Проверьте значимость уравнения регрессии на 95% уровне.
Рассчитайте коэффициенты эластичности. Дайте их интерпретацию.
Постройте 95% доверительные интервалы для коэффициентов регрессии. Проверьте значимость каждого из коэффициентов.
Решение
Рассчитаем средние значения переменных и проведем вспомогательные вычисления, которые представим в таблице 4.
На основании данных таблицы 4 определим парные коэффициенты корреляции.
rx1y=x1-x1(y-y)x1-x1²×(y-y)²=1 251,10328 566,00×276,96=0,131;
rx2y=x2-x2(y-y)x2-x2²×(y-y)²=515,291 196,70×276,96=0,895;
rx1x2=x1-x1x2-x2x1-x1²×x2-x2²=189,40328 566,00×1 196,70=0,010.
Значение парного коэффициента корреляции свидетельствует о сильной линейной связи между переменными у и x2. Связь между x1 и y существенно слабее. Кроме того, теснота связи между x1 и x2 почти отсутствует. Таким образом, можно сделать предварительное заключение, что численность населения, обслуживаемого одним врачом (x1), существенно не влияют на продолжительность жизни при рождении (у).
Рассчитаем частные коэффициенты корреляции:
rx1y/x2=rx1y-rx2y×rx1x21-rx2y2(1-rx1x22)=0,131-0,895×0,010(1-0,8952)(1-0,0102)=0,275;
rx2y/x1=rx2y-rx1y×rx1x21-rx1y2(1-rx1x22)=0,895-0,131×0,010(1-0,1312)(1-0,0102)=0,902;
rx2x1/y=rx1x2-rx1y×rx2y1-rx1y2(1-rx2y2)=0,010-0,131×0,895(1-0,1312)(1-0,8952)=-0,244.
Наиболее тесно связаны у и x2. Другие взаимосвязи существенно слабее.
Таблица 4
Результаты вычислений
страна у x1
x2
(y-y)
(x1-x1)
(x2-x2)
(y-y)²
(x1-x1)² (x2-x2)² (y-y)×(x1-x1)
y-y
×
(x2-x2)
x1-x1
×
(x1-x1)
1 2 3 4 10 11 12 13 14 15 16 17 18
Россия 65,90 230,00 9,50 - 8,90 - 170,00 - 10,50 79,21 28 900,00 110,25 1 513,00 93,45 1 785,00
Австрия 77,10 298,00 24,10 2,30 - 102,00 4,10 5,29 10 404,00 16,81 - 234,60 9,43 - 418,20
Белоруссия 67,90 230,00 7,10 - 6,90 - 170,00 - 12,90 47,61 28 900,00 166,41 1 173,00 89,01 2 193,00
Великобритания 77,20 590,00 21,50 2,40 190,00 1,50 5,76 36 100,00 2,25 456,00 3,60 285,00
Германия 77,40 295,00 24,50 2,60 - 105,00 4,50 6,76 11 025,00 20,25 -273,00 11,70 - 472,50
Норвегия 78,70 350,00 29,50 3,90 - 50,00 9,50 15,21 2 500,00 90,25 -195,00 37,05 - 475,00
Финляндия 77,20 340,00 22,40 2,40 - 60,00 2,40 5,76 3 600,00 5,76 - 144,00 5,76 -144,00
Франция 78,20 370,00 25,10 3,40 - 30,00 5,10 11,56 900,00 26,01 -102,00 17,34 -153,00
Тарция
69,30 820,00 7,40 - 5,50 420,00 - 12,60 30,25 176 400,00 158,76 -2 310,00 69,30 - 5 292,00
Узбекистан 70,30 326,00 3,50 - 4,50 - 74,00 - 16,50 20,25 5 476,00 272,25 333,00 74,25 1 221,00
США 76,90 395,00 34,30 2,10 -5,00 14,30 4,41 25,00 204,49 - 10,50 30,03 - 71,50
Япония 81,50 556,00 31,10 6,70 156,00 11,10 44,89 24 336,00 123,21 1 045,20 74,37 1 731,60
сумма 897,60 4 800,00 240,00 0,00 - 0,00 276,96 328 566,00 1 196,70 1 251,10 515,29 189,40
среднее 74,80 400,00 20,00 0,00 - 0,00 23,08 27 380,50 99,73 104,26 42,94 15,78
Построим линейное уравнение множественной регрессии
Для начала вычислим среднеквадратическое отклонение признаков:
σy=(y-y)²n=276,9612=4,804;
σx1=(x1-x1)²n=238 56612=165,471;
σx2=(x2-x2)²n=1 196,7012=9,986.
Далее определяем параметры линейной множественной регрессии:
b1=σyσx1×rx1y-rx2y×rx1x2rx1x22=4,804165,471×0,131-0,895×0,0100,0102=0,004;
b2=σyσx2×rx2y-rx1y×rx1x2rx1x22=4,8049,986×0,895-0,131×0,0100,0102=0,430;
a=y-b1×x1-b2×x2=74,80-0,004×400-0,430×20=64,775.
Таким образом, получим уравнение множественной регрессии:
ŷ = 64,775 + 0,004 ×x1 + 0,430×x2.
Уравнение регрессии показывает, что при увеличении численности населения, обслуживаемого одним врачом на 1 чел