По результатам построения модели множественной регрессии требуется:
рассчитать стандартизованные коэффициенты регрессии четырьмя способами (1 – слайд 21, 2, 3 – 25, 4 – рассчитать нормированные отклонения ty, tx1и tx2, применить инструмент «Регрессия» пакета «Анализа данных») записать уравнение регрессии в стандартизованном виде (слайд 23), дать интерпретацию бета-коэффициентов;
рассчитать средние коэффициенты эластичности (слайд 26) дать их интерпретацию бета-коэффициентов;
сравнить факторы по силе влияния на результат;
рассчитать и проанализировать частные коэффициенты эластичности (слайд 28), определить предприятия с наибольшей эластичностью факторов;
рассчитать частные коэффициенты детерминации (слайд 29), разложить множественный коэффициент детерминации как их сумму, дать их интерпретацию. Разложить множественный коэффициент детерминации с учетом системного эффекта. Сравнить две схемы разложения.
X2 X1 Y
0.4 5 266 4317.8
0.7 2 874 3667.2
0.8 9 307 4528.3
0.8 10 702 4941.3
0.9 4 579 3943.4
1.0 8 743 4386.5
1.0 4 794 4239.7
1.1 2 697 2237.3
1.3 5 370 3880.7
1.3 10 969 6350.1
1.4 6 827 5130,5
1.4 2 602 3472,4
1.4 7 291 4365,7
1.5 3 454 5641,8
1.5 14 916 6699,9
1.6 4 198 4434,7
1.6 4 757 3899,1
1.7 3 860 5203,7
1.8 1 381 3848,7
1.8 5 295 4695,8
1.9 8 895 4991,7
2.0 2 239 4213,5
2.0 5 687 6249,3
2.1 6 919 5555,5
2.1 3 268 7034,7
2.2 11 642 5859,4
2.3 5 801 6976,0
2.4 10 001 8745,4
2.4 4 374 3684,4
2.5 9 706 5214,9
2.8 9 959 7435,3
2.8 7 526 4992,0
3.0 18 669 6106,4
3.2 14 379 8925,6
3.3 9 405 6011,6
3.4 7 480 7053,2
3.6 9 063 7262,2
3.8 10 844 8294,0
4.1 34 558 7558,6
6.2 12 371 5389,5
9.4 5 991 5903,5
328 658
223341.5
Нужно полное решение этой работы?
Решение
Оценка уравнения регрессии
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTY
К матрице с переменными Xj добавляем единичный столбец:
1 5266 0.4
1 2874 0.7
1 9307 0.8
1 10702 0.8
1 4579 0.9
1 8743 1
1 4794 1
1 2697 1.1
1 5370 1.3
1 10969 1.3
1 6827 1.4
1 2602 1.4
1 7291 1.4
1 3454 1.5
1 14916 1.5
1 4198 1.6
1 4757 1.6
1 3860 1.7
1 1381 1.8
1 5295 1.8
1 8895 1.9
1 2239 2
1 5687 2
1 6919 2.1
1 3268 2.1
1 11642 2.2
1 5801 2.3
1 10001 2.4
1 4374 2.4
1 9706 2.5
1 9959 2.8
1 7526 2.8
1 18669 3
1 14379 3.2
1 9405 3.3
1 7480 3.4
1 9063 3.6
1 10844 3.8
1 34558 4.1
1 12371 6.2
1 5991 9.4
Матрица Y
4317.8
3667.2
4528.3
4941.3
3943.4
4386.5
4239.7
2237.3
3880.7
6350.1
5130.5
3472.4
4365.7
5641.8
6699.9
4434.7
3899.1
5203.7
3848.7
4695.8
4991.7
4213.5
6249.3
5555.5
7034.7
5859.4
6976
8745.4
3684.4
5214.9
7435.3
4992
6106.4
8925.6
6011.6
7053.2
7262.2
8294
7558.6
5389.5
5903.5
Матрица XT
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
5266 2874 9307 10702 4579 8743 4794 2697 5370 10969 6827 2602 7291 3454 14916 4198 4757 3860 1381 5295 8895 2239 5687 6919 3268 11642 5801 10001 4374 9706 9959 7526 18669 14379 9405 7480 9063 10844 34558 12371 5991
0.4 0.7 0.8 0.8 0.9 1 1 1.1 1.3 1.3 1.4 1.4 1.4 1.5 1.5 1.6 1.6 1.7 1.8 1.8 1.9 2 2 2.1 2.1 2.2 2.3 2.4 2.4 2.5 2.8 2.8 3 3.2 3.3 3.4 3.6 3.8 4.1 6.2 9.4
Умножаем матрицы, (XTX)
EQ XT X = \b\bc\| (\a \al \co3 \hs3 (41;328659;92,5;328659;3936021259;853709,3;92,5;853709,3;310,91))
В матрице, (XTX) число 41, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Умножаем матрицы, (XTY)
EQ XT Y = \b\bc\| (\a \al \co1 \hs3 (223341,3;1980254273,3;545744,63))
Находим обратную матрицу (XTX)-1
EQ (XT X) -1 = EQ \b\bc\| (\a \al \co3 \hs3 (0,1;-5,0E-6;-0,0169;-5,0E-6;0;-1,0E-6;-0,0169;-1,0E-6;0,0108))
Вектор оценок коэффициентов регрессии равен
EQ Y(X) = EQ \b\bc\| (\a \al \co3 \hs3 (0,1;-5,0E-6;-0,0169;-5,0E-6;0;-1,0E-6;-0,0169;-1,0E-6;0,0108))·\b\bc\| (\a \al \co1 \hs3 (223341,3;1980254273,3;545744,63)) = EQ \b\bc\| (\a \al \co1 \hs3 (3846,515;0,122;275,406))
Уравнение регрессии (оценка уравнения регрессии)
Y = 3846.5147 + 0.1222X1 + 275.4063X2
Модель регрессии в стандартном масштабе
Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:
EQ tj = \f(xji-\x\to(xj);S(xj))
где хji - значение переменной хji в i-ом наблюдении.
EQ ty = \f(yi-\x\to(xj);S(y))
Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S.
Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:
ty = ∑βjtxj
Для оценки β-коэффициентов применим МНК. При этом система нормальных уравнений будет иметь вид:
rx1y=β1+rx1x2•β2 + ... + rx1xm•βm
rx2y=rx2x1•β1 + β2 + ... + rx2xm•βm
...
rxmy=rxmx1•β1 + rxmx2•β2 + ... + βm
Для наших данных (берем из матрицы парных коэффициентов корреляции):
0.542 = β1 + 0.308β2
0.426 = 0.308β1 + β2
Данную систему линейных уравнений решаем методом Гаусса: β1 = 0.454; β2 = 0.287;
Искомое уравнение в стандартизованном масштабе: ty=β1tx1+β2tx2
Расчет β-коэффициентов можно выполнить и по формулам:
EQ β1 = \f(ryx1-ryx2rx1x2;1-rx1x22) = EQ \f(0.542-0.426·0.308;1-0.3082) = 0.454
EQ β2 = \f(ryx2-ryx1rx1x2;1-rx1x22) = EQ \f(0.426-0.542·0.308;1-0.3082) = 0.287
Стандартизированная форма уравнения регрессии имеет вид:
ty = 0.454x1 + 0.287x2
Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:
EQ bj = β·\f(S(y);S(xj))
EQ a = \x\to(y) - ∑bj·\x\to(xj)
Кроме того, с помощью пакета анализа данных получили следующее решение:
Анализ параметров уравнения регрессии.
Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации
Для несмещенной оценки дисперсии проделаем следующие вычисления:
Несмещенная ошибка ε = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)
Y Y(x) ε = Y - Y(x) ε2 (Y-Yср)2 |ε : Y|
4317.8 4600.134 -282.334 79712.518 1275880.448 0.0654
3667.2 4390.476 -723.276 523127.488 3168929.681 0.197
4528.3 5204.07 -675.77 456664.657 844650.661 0.149
4941.3 5374.526 -433.226 187684.65 256085.368 0.0877
3943.4 4653.892 -710.492 504799.075 2261861.934 0.18
4386.5 5190.235 -803.735 645990.474 1125400.135 0.183
4239.7 4707.704 -468.004 219027.553 1458415.577 0.11
2237.3 4479.01 -2241.71 5025265.024 10304413.173 1.002
3880.7 4860.708 -980.008 960414.913 2454388.401 0.253
6350.1 5544.854 805.246 648421.146 814959.764 0.127
5130.5 5066.28 64.22 4124.175 100393.15 0.0125
3472.4 4550.024 -1077.624 1161273.627 3900422.686 0.31
4365.7 5122.977 -757.277 573468.151 1169964.084 0.173
5641.8 4681.671 960.129 921847.169 37811.277 0.17
6699.9 6082.222 617.678 381525.615 1568884.558 0.0922
4434.7 4800.122 -365.422 133533.147 1025457.553 0.0824
3899.1 4868.427 -969.327 939593.944 2397074.286 0.249
5203.7 4786.362 417.338 174170.994 59364.728 0.0802
3848.7 4510.992 -662.292 438630.187 2555677.923 0.172
4695.8 4989.246 -293.446 86110.83 564825.569 0.0625
4991.7 5456.674 -464.974 216200.857 207615.811 0.0931
4213.5 4670.913 -457.413 209226.292 1522382.813 0.109
6249.3 5092.227 1157.073 1338818.997 643125.758 0.185
5555.5 5270.306 285.194 81335.471 11696.686 0.0513
7034.7 4824.188 2210.512 4886365.118 2519683.894 0.314
5859.4 5874.954 -15.554 241.93 169786.208 0.00265
6976 5188.778 1787.222 3194161.785 2336774.551 0.256
8745.4 5729.52 3015.88 9095530.649 10877141.847 0.345
3684.4 5041.953 -1357.553 1842948.884 3107988.403 0.368
5214.9 5721.015 -506.115 256151.985 54032.436 0.0971
7435.3 5834.551 1600.749 2562398.077 3951950.051 0.215
4992 5537.261 -545.261 297309.037 207342.512 0.109
6106.4 6953.914 -847.514 718280.061 434348.51 0.139
8925.6 6484.797 2440.803 5957520.661 12098231.546 0.273
6011.6 5904.56 107.04 11457.511 318379.439 0.0178
7053.2 5696.884 1356.316 1839594.31 2578758.139 0.192
7262.2 5945.393 1316.807 1733980.99 3293684.949 0.181
8294 6218.096 2075.904 4309377.452 8103423.166 0.25
7558.6 9198.351 -1639.751 2688782.99 4457381.712 0.217
5389.5 7065.657 -1676.157 2809500.92 3346.481 0.311
5903.5 7167.379 -1263.879 1597391.362 208073.935 0.214
59711960.677 94450009.802 7.701
Средняя ошибка аппроксимации
EQ A = \f(∑|ε : Y|;n)·100% = \f(7.701;41)·100% = 18.78%
Оценка дисперсии равна:
se2=(Y-Y(X))T(Y-Y(X))=59711960.677
Несмещенная оценка дисперсии равна:
EQ s2 = \f(1;n-m-1)·se2 = \f(1;41 - 2 - 1)·59711960.677 = 1571367.3862
Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):
EQ S = \r(S2) = \r(1571367.3862) = 1253.542
Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-1
EQ k(x) = 1571367.39\b\bc\| (\a \al \co3 \hs3 (0,1;-5,0E-6;-0,0169;-5,0E-6;0;-1,0E-6;-0,0169;-1,0E-6;0,0108)) = EQ \b\bc\| (\a \al \co3 \hs3 (157490,359;-7,387;-26571,243;-7,387;0,00133;-1,464;-26571,243;-1,464;16979,627))
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е
. это элементы, лежащие на главной диагонали
EQ Sb0 = \r(157490.359) = 396.851
EQ Sb1 = \r(0.00133) = 0.0365
EQ Sb2 = \r(16979.627) = 130.306
Показатели тесноты связи факторов с результатом
Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат.
К таким показателям тесноты связи относят: частные коэффициенты эластичности, β–коэффициенты, частные коэффициенты корреляции.
Частные коэффициенты эластичности
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:
EQ Ei = bi·\f(\x\to(x)i;\x\to(y) )
Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.
EQ E1 = 0.122·\f(8016.073; 5447.35 ) = 0.18
Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.
EQ E2 = 275.406·\f(2.256; 5447.35 ) = 0.114
Частный коэффициент эластичности |E2| < 1. Следовательно, его влияние на результативный признак Y незначительно