Построить поле корреляции и сформулировать гипотезу о форме связи.
2. Рассчитать параметры уравнения линейной регрессии.
3. Оценить тесноту связи с помощью выборочных коэффициентов корреляции и детерминации.
4. Проверить значимость выборочного коэффициента корреляции и параметров линейной модели при уровне значимости α=0,05.
5. Дать с помощью среднего коэффициента эластичности сравнительную оценку силы связи факторного признака с результативным.
6. Оценить качество уравнения с помощью средней ошибки аппроксимации.
7. Оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера.
8. Сделать выводы.
Исследуйте зависимость результативного признака (Y) от факторного (X).
X
-2,8 -2,0 -2,1 -1,6 -1,8 -0,9 1,33 1,50 0,99 1,90 2,02 2,24 1,08 2,13
Y
1,19 1,27 1,97 2,13 2,82 2,95 3,01 3,35 3,47 3,62 3,91 4,04 4,34 4,56
Решение
1. Построить поле корреляции и сформулировать гипотезу о форме связи
Наносим точки (x;y) в системе координат и получаем поле корреляции. Проведем прямую линию, около которой сгруппированы построенные точки. Будем считать, что связь между x и y линейная.
2. Рассчитать параметры уравнения линейной регрессии
Для определения коэффициентов уравнения линейной парной регрессии составим расчетную таблицу:
№ x
y
x2
y2
xy
yi-y
(yi-y)2
1 -2,8 1,19 7,84 1,4161 -3,332 -1,8536 3,4358
2 -2,0 1,27 4 1,6129 -2,54 -1,7736 3,1457
3 -2,1 1,97 4,41 3,8809 -4,137 -1,0736 1,1526
4 -1,6 2,13 2,56 4,5369 -3,408 -0,9136 0,8347
5 -1,8 2,82 3,24 7,9524 -5,076 -0,2236 0,05
6 -0,9 2,95 0,81 8,7025 -2,655 -0,0936 0,0088
7 1,33 3,01 1,7689 9,0601 4,0033 -0,0336 0,0011
8 1,50 3,35 2,25 11,2225 5,025 0,3064 0,0939
9 0,99 3,47 0,9801 12,0409 3,4353 0,4264 0,1818
10 1,90 3,62 3,61 13,1044 6,878 0,5764 0,3322
11 2,02 3,91 4,0804 15,2881 7,8982 0,8664 0,7506
12 2,24 4,04 5,0176 16,3216 9,0496 0,9964 0,9928
13 1,08 4,34 1,1664 18,6624 4,6656 1,2764 1,6292
14 2,13 4,56 4,5369 20,7936 9,7128 1,5164 2,2995
Сумма
1,99 42,61 46,2703 144,5953 29,5198 -0,0004 14,9087
Среднее 0,1421 3,0436 3,3050 10,3282 2,1086 0 1,0649
Система нормальных уравнений примет вид:
14b+1,99a=3,04361,99b+46,2703a=29,5198
Решение системы дает следующие результаты:
a=y∙x-y∙xx2-x2=2,1086-3,0436∙0,14213,3050-(0,1421)2=1,67593,2848=0,5102
b=y-a∙x=3,0436-0,5102∙0,1421=2,971
Уравнение линейной парной регрессии запишется:
y=0,5102x+2,971
По полученному уравнению можно сделать вывод, что при увеличении факторного признака X на единицу увеличится в среднем на 0,5102% значение результативного признака Y
3. Оценить тесноту связи с помощью выборочных коэффициентов корреляции и детерминации
Вычислим средние квадратические отклонения результативного и факторного признаков:
σx=Dx=x2-x2=3,3050-(0,1421)2=3,2848=1,8124
σy=Dy=y2-y2=10,3282-(3,0436)2=1,0647=1,0318
rx/y=a∙σxσy=0,5102∙1,81241,0318=0,8962=89,62%
rx/y=x∙y-x∙yσx∙σy=2,1086-3,0436∙0,14211,8124∙1,0318=0,8962=89,62%
По значению коэффициента корреляции согласно шкале Чеддока делаем вывод о том, что связь между результативным признаком (Y) и фактором (X) – высокая.
Составим расчетную таблицу:
№ x
y
y
yi-y
yi-yyi
(yi-y)2
y-y
y-y2
1 -2,8 1,19 1,5424 0,3524 0,2962 0,1242 -1,5012 2,2535
2 -2,0 1,27 1,9506 0,6806 0,5359 0,4632 -1,093 1,1946
3 -2,1 1,97 1,8996 -0,0704 0,0357 0,005 -1,144 1,3088
4 -1,6 2,13 2,1547 0,0247 0,0116 0,0006 -0,8889 0,7902
5 -1,8 2,82 2,0526 -0,7674 0,2721 0,5888 -0,991 0,982
6 -0,9 2,95 2,5118 -0,4382 0,1485 0,192 -0,5318 0,2828
7 1,33 3,01 3,6496 0,6396 0,2125 0,4090 0,6060 0,3672
8 1,50 3,35 3,7363 0,3863 0,1153 0,1492 0,6927 0,4798
9 0,99 3,47 3,4761 0,0061 0,0018 0 0,4325 0,1871
10 1,90 3,62 3,9404 0,3204 0,0885 0,1026 0,8968 0,8042
11 2,02 3,91 4,0016 0,0916 0,0234 0,0084 0,958 0,9178
12 2,24 4,04 4,1138 0,0738 0,0183 0,0055 1,0702 1,1454
13 1,08 4,34 3,522 -0,798 0,1847 0,6368 0,4784 0,2289
14 2,13 4,56 4,0577 -0,5023 0,1101 0,2523 1,0141 1,0285
Сумма
1,99 42,61 42,6093
2,0547 2,9377
11,9707
Среднее 0,1421 3,0436
0,1468
Найдем коэффициент детерминации:
R2=SобъясSобщая=y-y2(yi-y)2=11,970714,9087=0,8029=80,29%
R2=1-(yi-y)2(yi-y)2=1-2,937714,9087=1-0,197=0,803=80,3%
Незначительное расхождение в вычислениях коэффициента детерминации наблюдается из-за погрешности округлений
4
. Проверить значимость выборочного коэффициента корреляции и параметров линейной модели при уровне значимости α=0,05
Вычислим расчетное значение t - критерия Стьюдента.
tr=rx/y∙n-21-(rx/y)2 =0,8962∙121-(0,8962)2 =6,9977
Сравним это значение с табличным (критическим):
tкрит=t0,05;12=2,18
Так как tr>tкрит, то найденный линейный коэффициент корреляции является статистически значимым.
Проведем оценку значимости параметров a и b уравнения линейной парной регрессии
Sост=(yi-y)2n-2=2,937712=0,4948
ma=Sостσx∙n-2=0,49481,8124∙12=0,0788 ta=ama=0,51020,0788=6,4746
mb=Sостn-2=0,494812=0,1428 tb=bmb=2,9710,1428=20,8053
Сравним эти значения с табличным (критическим):
tкрит=t0,05;12=2,18
ta>tкрит, tb>tкрит
Выполнение неравенств указывает на статистическую значимость параметров
5