В таблице даны статистические данные о расходах на питание (у, у.е.), душевом доходе (x1’ у.е.) и размере семьи (х2, чел.) для семи групп семей.
Найти матрицу коэффициентов парной корреляции.
Провести анализ целесообразности включения факторов в уравнение множественной регрессии.
Построить уравнение множественной регрессии (в виде линейной функции).
Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции.
Проверить значимость найденной регрессионной модели.
Таблица 3 - Исходные данные
Y 431 621 860 1070 1315 1363 1515
X1 606 1510 2570 3580 4595 5850 7060
X2 1,65 2,3 2,85 3,5 3,65 3,9 4,15
Решение
Матрица парных коэффициентов корреляции R.
Число наблюдений n = 7. Число независимых переменных в модели равно 2, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (7 х 4).
Матрица A, составленная из Y и X
1 431 606 1.65
1 621 1510 2.3
1 860 2570 2.85
1 1070 3580 3.5
1 1315 4595 3.65
1 1363 5850 3.9
1 1515 7060 4.15
Транспонированная матрица.
1 1 1 1 1 1 1
431 621 860 1070 1315 1363 1515
606 1510 2570 3580 4595 5850 7060
1.65 2.3 2.85 3.5 3.65 3.9 4.15
Матрица XTX.
7 7175 25771 22
7175 8338121 31951571 24738.15
25771 31951571 127248761 93213.15
22 24738.15 93213.15 74.14
Полученная матрица имеет следующее соответствие:
∑n ∑y ∑x1 ∑x2
∑y ∑y2 ∑x1 y ∑x2 y
∑x1 ∑yx1 ∑x1 2 ∑x2 x1
∑x2 ∑yx2 ∑x1 x2 ∑x2 2
Таблица 3.1 – Расчет средних величин
Признаки x и y ∑xi ∑yi ∑xi*yi
Для y и x1 25771 3681.571 7175 1025 31951571 4564510.143
Для y и x2 22 3.143 7175 1025 24738.15 3534.021
Для x1 и x2 22 3.143 25771 3681.571 93213.15 13316.164
Таблица 3.2 – Дисперсии и среднеквадратические отклонения
Признаки x и y
Для y и x1 4624426.245 140535.143 2150.448 374.88
Для y и x2 0.714 140535.143 0.845 374.88
Для x1 и x2 0.714 4624426.245 0.845 2150.448
Найдем парные коэффициенты корреляции по формуле:
ryx1 = 4564510.143-3681.571*10252150.448*374.88=0.981
ryx2 = 3534.021-3.143*10250.845*374.88=0.987
rx1x2 = 13316.164-3.143*3681.5710.845*2150.448=0.961
Матрица парных коэффициентов корреляции R принимает вид:
- y x1 x2
y 1 0.9811 0.9869
x1 0.9811 1 0.9607
x2 0.9869 0.9607 1
Определим вектор оценок коэффициентов регрессии
. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTYК матрице с переменными Xj добавляем единичный столбец:
1 606 1.65
1 1510 2.3
1 2570 2.85
1 3580 3.5
1 4595 3.65
1 5850 3.9
1 7060 4.15
Матрица Y
431
621
860
1070
1315
1363
1515
Матрица XT
1 1 1 1 1 1 1
606 1510 2570 3580 4595 5850 7060
1.65 2.3 2.85 3.5 3.65 3.9 4.15
Умножаем матрицы, (XTX)
XT X = 7 25771 22
25771 127248761 93213,15
22 93213,15 74,14
В матрице, (XTX) число 7, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X.
Умножаем матрицы, (XTY)
XT Y = 7175
31951571
24738,15
Находим обратную матрицу (XTX)-1
(XT X) -1 = 8,542 0,0016 -4,552
0,0016 0 -0,00098
-4,552 -0,00098 2,596
Вектор оценок коэффициентов регрессии равен
Y(X) = 8,542 0,0016 -4,552
0,0016 0 -0,00098
-4,552 -0,00098 2,596
* 7175
31951571
24738,15
= -52,756
0,046
255,742
Уравнение регрессии принимает вид:
Y = -52,76 + 0,05X1 + 255,74X2
Определим частные коэффициенты корреляции по формулам:
ryx1/x2 = 0.981-0.987*0.961(1-0.9872)*(1-0.9612)=0.736
Теснота связи сильная.
ryx2/x1 = 0.987-0.981*0.961(1-0.9812)*(1-0.9612)=0.826
Теснота связи сильная.
rx1x2/y = 0.961-0.981*0.987(1-0.9812)*(1-0.9872)=-0.241
Теснота связи низкая