Изучается зависимость результирующего показателя y от факторов и .
Требуется:
Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .
С помощью частных F-критериев Фишера и t-статистики Стьюдента оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .
По возможности составить уравнение линейной парной регрессии , оставив лишь один значащий фактор.
Вариант 5
y2 62 53,1 56,5 30,1 18,1 13,6 89,8 76,6 32,3 199 90,8 82,1 76,2 51,6
x1 0,23 0,43 0,26 0,43 0,38 0,42 0,3 0,37 0,34 0,23 0,41 0,41 0,22 0,24
x10 14257 22661 14903 12973 6920 5736 26705 28025 11049 45893 36813 33956 17016 12243
y2 Индекс снижения себестоимости продукции
x1 Трудоемкость единицы продукции
x10 Среднегодовой фонд заработной платы ППР.
Решение
N = 14 число наблюдений, m = 2 число объясняющих переменных.
Для упрощения записи формул переменную у2 обозначим через у, а переменные x1 и x7 – через x1 и x2, так как условие задачи задано в терминах x1, x2.
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
№
1 2 3 4 5 6 7 8 9 10
1 62 0,23 14257 14,26 883934 3279,11 0,0529 203262049 3844
2 53,1 0,43 22661 22,83 1203299 9744,23 0,1849 513520921 2819,61
3 56,5 0,26 14903 14,69 842019,5 3874,78 0,0676 222099409 3192,25
4 30,1 0,43 12973 12,94 390487,3 5578,39 0,1849 168298729 906,01
5 18,1 0,38 6920 6,88 125252 2629,6 0,1444 47886400 327,61
6 13,6 0,42 5736 5,71 78009,6 2409,12 0,1764 32901696 184,96
7 89,8 0,3 26705 26,94 2398109 8011,5 0,09 713157025 8064,04
8 76,6 0,37 28025 28,34 2146715 10369,25 0,1369 785400625 5867,56
9 32,3 0,34 11049 10,98 356882,7 3756,66 0,1156 122080401 1043,29
10 199 0,23 45893 45,77 9132707 10555,39 0,0529 2106167449 39601
11 90,8 0,41 36813 37,23 3342620 15093,33 0,1681 1355196969 8244,64
12 82,1 0,41 33956 33,66 2787788 13921,96 0,1681 1153009936 6740,41
13 76,2 0,22 17016 16,76 1296619 3743,52 0,0484 289544256 5806,44
14 51,6 0,24 12243 12,38 631738,8 2938,32 0,0576 149891049 2662,56
Сумма 931,8 4,67 289150 289,39 25616181 95905,16 1,6487 7862416914 89304,38
Ср. знач. 66,56 0,33 20653,6 20,67 1829727 6850,37 0,12 561601208,1 6378,9
Найдем средние квадратические отклонения признаков:
44,15
0,081
11620,29
Вычисление параметров линейного уравнения множественной регрессии.
Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , :
либо воспользоваться готовыми формулами:
;;
.
Рассчитаем сначала парные коэффициенты корреляции:
-0,430
0,887
-0,042
Находим
-215,851
0,003
70,242
Таким образом, получили следующее уравнение множественной регрессии:
Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:
-0,394
0,871
Т.е
. уравнение будет выглядеть следующим образом:
.
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что среднегодовой фонд заработной платы ППР оказывает большее влияние на индекс снижения себестоимости продукции, чем трудоемкость единицы продукции.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
-1,082
1,026
Т.е. увеличение только трудоемкости единицы продукции (от своего среднего значения) уменьшает в среднем индекс снижения себестоимости продукции на 1,082%, а увеличение только среднегодового фонда заработной платы на 1% увеличивает в среднем индекс снижения себестоимости продукции на 1,026%. Влияние обоих факторов примерно одинаково.
2. Коэффициенты парной корреляции мы уже нашли:
-0,430 средняя обратная связь
0,887 тесная прямая связь
-0,042 очень слабая связь
Они указывают на среднюю по тесноте связь фактора х1 с результатом, сильную по тесноте связь фактора х2 с результатом, а также совсем слабую межфакторную зависимость (факторы и не коллинеарны, т.к. -0,042 близко к нулю). При такой слабой межфакторной зависимости факторы исключать нет необходимости.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
-0,853
0,964
Коэффициент множественной корреляции определим через матрицу парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
Для матрицы размером 3 3 определитель находится по формуле треугольников:
r = 1 -0,430 0,887 =
-0,430 1 -0,042 0,887 -0,042 1
= 1 · 1 · 1 + 0,887 · (-0,430) · (-0,042) + (-0,430) · (-0,042) · 0,887 –
– 0,887 · 1 · 0,887 – (-0,430) · (-0,430) · 1 – 1 · (-0,042) · (-0,042) = 0,0580
r11 = 1 -0,042 = 1 – 0,0422 = 0,9983
-0,042 1
Коэффициент множественной корреляции
0,9705.
Аналогичный результат получим при использовании других формул:
.
Для вычисления остаточной дисперсии вычислим расчетные значения и значение в двух последних столбцах следующей таблицы:
№
1 62 0,23 14257 67,75 33,12
2 53,1 0,43 22661 52,38 0,51
3 56,5 0,26 14903 63,42 47,83
4 30,1 0,43 12973 20,34 95,31
5 18,1 0,38 6920 11,11 48,89
6 13,6 0,42 5736 -1,44 226,27
7 89,8 0,3 26705 93,82 16,16
8 76,6 0,37 28025 83,08 41,95
9 32,3 0,34 11049 33,40 1,21
10 199 0,23 45893 172,40 707,61
11 90,8 0,41 36813 103,51 161,58
12 82,1 0,41 33956 94,06 143,07
13 76,2 0,22 17016 79,04 8,06
14 51,6 0,24 12243 58,93 53,79
Сумма 931,8 4,67 289150 1585,37
Ср