По имеющимся данным –
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры линейной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Оцените с помощью средней ошибки аппроксимации качество уравнения.
5. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.
7. Оцените статистическую значимость коэффициента регрессии и коэффициента корреляции.
8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня.
9. Оцените полученные результаты, оформите выполненное задание в виде отчета.
Вариант 5
В некоторой строительной компании имеются следующие данные о выработке за смену (у) и стаже работы рабочего (х):
Рабочий 1 2 3 4 5 6 7
Стаж, лет 1 3 5 7 9 10 12
Выработка, шт
10 12 16 15 20 24 28
Решение
По графику видно, что точки выстраиваются в некоторую прямую. Для удобства вычислений составим вспомогательную таблицу
x
y
x∙y
x2
y2
yx
y-yx
y-yx2
Ai,%
1 2 3 4 5 6 7 8 9 10
1 1 10 10 1 100 8,82 1,18 1,39 11,77
2 3 12 36 9 144 11,98 0,02 0,00 0,13
3 5 16 80 25 256 15,15 0,85 0,73 5,33
4 7 15 105 49 225 18,31 -3,31 10,95 22,06
5 9 20 180 81 400 21,47 -1,47 2,16 7,35
6 10 24 240 100 576 23,05 0,95 0,90 3,95
7 12 28 336 144 784 26,21 1,79 3,19 6,38
Итого 47 125 987 409 2485 125 0 19,31 56,98
Ср.знач
6,71 17,86 141 58,43 355 17,86 0 2,76 8,14
σ
3,65 6,01
σ2
13,35 36,12
Рассчитаем параметры линейного уравнения парной регрессии yx=a+b∙x
b=cov (x,y)σx2=x∙y-x∙yx2-x2=141-6,71∙17,8658,43-6,712=1,58
a=y-b∙x=17,86-1,58∙6,71=7,24
Получили уравнение парной регрессии yx=7,24+1,58∙x
. То есть с увеличением рабочего стажа на 1 год выработка за смену должна вырасти на 1,58 шт.
Уравнение линейной регрессии всегда дополняется показателем тесноты связи – линейным коэффициентом корреляции rxy
rxy=b∙σxσy=1,58∙3,656,01=0,961
Связь между компонентами Х и Y прямая весьма сильная (по шкале Чеддока)
Коэффициент детерминации rxy2=0,924 показывает, что уравнением регрессии объясняется 92,4% дисперсии результативного признака, а на долю прочих факторов приходится 7,6%.
Рассчитаем среднюю ошибку аппроксимации
A=1nyi-yxiyi∙100%=17∙56,98%=8,14%
Средняя ошибка аппроксимации меньше 10%, поэтому можно утверждать, что линия регрессии хорошо приближает исходные данные.
Оценим с помощью среднего коэффициента эластичности силу связи фактора с результатом.
Средний коэффициент эластичности для уравнения y=a+b∙x:
Эyx=f'x∙xy=b∙xa+b∙x=1,58∙6,717,24+1,58∙6,71=0,594%
Коэффициент эластичности показывает связь между фактором и результатом, т.е