По 8 предприятиям концерна изучается зависимость прибыли (тыс. руб.) y от выработки продукции на одного человека (единиц) x по данным, представленным в таблице. Построить линейное уравнение парной регрессии. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. Оценить статистическую значимость параметров регрессии и корреляции.
Номер предприятия Прибыль предприятия, тыс. руб., y Выработка продукции на одного человека, x
1 162 89
2 195 106
3 139 67
4 158 88
5 152 73
6 162 87
7 159 76
8 173 115
Решение
Определяем средние значения выработка продукции на одного человека и прибыли предприятия соответственно:
x=89+…+1158=87,625
y=162+…+1738=162,5
И составляем расчетную таблицу:
№ xi
yi
xi-x
yi-y
xi-xyi-y
xi-x2
yi-y2
Расчет. значения
1 89 162 1,375 -0,5 -0,6875 1,890625 0,25 163,652
2 106 195 18,375 32,5 597,1875 337,6406 1056,25 177,8946
3 67 139 -20,625 -23,5 484,6875 425,3906 552,25 145,2204
4 88 158 0,375 -4,5 -1,6875 0,140625 20,25 162,8142
5 73 152 -14,625 -10,5 153,5625 213,8906 110,25 150,2472
6 87 162 -0,625 -0,5 0,3125 0,390625 0,25 161,9764
7 76 159 -11,625 -3,5 40,6875 135,1406 12,25 152,7606
8 115 173 27,375 10,5 287,4375 749,3906 110,25 185,4348
∑ 701 1300
1561,5 1863,875 1862
По данным таблицы вычисляем параметр уравнения парной линейной корреляции – коэффициент регрессии:
b=ixi-xyi-yixi-x2=1561,51863,875≈0,8378
Тогда свободный член уравнения регрессии:
a=y-bx=162,5-0,8378∙87,625≈89,0878
Получили следующее уравнение регрессии:
y=0,8378x+89,0878
Графически:
Вычисляем коэффициент корреляции:
rxy=ixi-xyi-yixi-x2∙iyi-y2=1561,51863,875∙1862≈0,8382
Абсолютная величина коэффициента корреляции rxy>0,7 говорит о сильной связи между признаками, а положительное значение rxy>0 – о том, что между признаками имеется прямая зависимость.
Вычисляем среднюю ошибку аппроксимации и среднюю ошибку коэффициента регрессии по формулам:
A=iyi-yiyin∙100%
mb=iyi-yi2n-2ixi-x2
где yi – расчетное значение результативного признака.
Имеем:
№ yi
Расчетные значения, yi
yi-yi
yi-yiyi
yi-yi2
1 162 163,652 1,652 0,0102 2,7291
2 195 177,8946 -17,1054 0,0877 292,5947
3 139 145,2204 6,2204 0,0448 38,6934
4 158 162,8142 4,8142 0,0305 23,1765
5 152 150,2472 -1,7528 0,0115 3,0723
6 162 161,9764 -0,0236 0,0001 0,0006
7 159 152,7606 -6,2394 0,0392 38,9301
8 173 185,4348 12,4348 0,0719 154,6243
∑
0,2959 553,821
Тогда:
A=0,29598∙100%≈3,7%
mb=553,8218-2∙1863,875≈0,0495
Значение средней ошибки аппроксимации A<15% говорит о том, что построенная линейная модель хорошо аппроксимирует данные.
Зная среднюю ошибку оценки коэффициента регрессии, вычислим вероятность того, что нулевое значение коэффициента входит в интервал возможных с учетом ошибки значений