Дана зависимость между признаками X и Y. Необходимо:
произвести все необходимые вычисления;
построить эмпирические линии регрессии и сделать первоначальные выводы о форме корреляционной связи;
определить величину коэффициента линейной корреляции и сделать выводы о форме корреляционной зависимости;
найти значение корреляционного отношения и сделать выводы о тесноте корреляционной связи;
с вероятностью 0,95 проверить гипотезу о статистической значимости эмпирических данных;
установить вид уравнения регрессии y на x и x на y в предположении прямой (расчет коэффициентов произвести двумя способами) регрессионной моделей;
с помощью величины средней ошибки аппроксимации и индекса детерминации оценить точность линейной модели;
произвести прогноз значения y по заданному значению x и спрогнозировать величину x по y.
х
y 6 16 26 36 46
10
5 3 8
20
6 3
9
30
2 2 4
8
40 9 7
16
50 1 8
9
10 17 8 12 3 50
x=50,5, y=51,2
Решение
1.Дополним таблицу необходимыми расчетными данными:
6 16 26 36 46 my
yjmyj
y2jmyj
10
5 3 8 80 800
20
6 3
9 180 3600
30
2 2 4
8 240 7200
40 9 7
16 640 25600
50 1 8
9 450 22500
mx
10 17 8 12 3 Σ=50 Σ=1590 Σ=59700
60 272 208 432 138 Σ=1110
360 4352 5408 15552 6348 Σ=32020
Найдем условные средние и построим эмпирическую линию регрессии на .
у6=9∙40+1∙5010=41, у16=2∙30+7∙40+8∙5017=43,53,
у26=6∙20+2∙308=22,50,
у36=5∙10+3∙20+4∙3012=19,7,
у16,5=3∙103=10.
Получим ряд из средних значений:
Хi 3 6,5 10 13,5 16,5
41 43,53 22,5 19,17 10
Построим эмпирическую линию регрессии на
Найдем условные средние и построим эмпирическую линию регрессии на .
х10=5∙36+3∙468=39,75, х20=6∙26+3∙369=29,33,
х30=2∙16+2∙26+4∙368=28,5,
х40=9∙6+7∙1616=10,38,
х50=1∙6+8∙169=14,89.
Получим ряд из средних значений:
уi 10 20 30 40 50
39,75 29,33 28,5 10,38 14,89
Построим эмпирическую линию регрессии Х на У:
На основании данных графиков можно предположить, что между переменными Х и У существует обратная связь, близкая к линейной.
3.определим величину коэффициента линейной корреляции и сделаем выводы о форме корреляционной зависимости.
В расчетной таблице получены одномерные распределения обеих случайных величин
. Теперь можно сосчитать средние значения, необходимые для расчета коэффициентов
x=1ni=15ximxi =111050=22,2, y=1nj=15yjmyj=159050=31,8,
x2=1ni=15x2imxi=3202050=640,4, y2=1nj=15y2jmyj=5970050==1194;
xy=1n i=15j=15nijxiyj=2864050=572,8.
Теперь определим выборочные дисперсии и средние квадратические
οтклонения:
σх2=х2-х2=640,4-22,22=147,56; σх=147,56=12,15;
σу2=у2-у2=1194-31,82=182,76; σy=182,76=13,52.
Тогда выборочный коэффициент корреляции
rв=ХУ-х∙уσxσу=572,8-22,2∙31,812,15∙13,52=-0,811.
Поскольку коэффициент корреляции отрицательный, то наблюдается обратная связь. Так как коэффициент корреляции по абсолютной величине удовлетворяет соотношению 0,7 < \r\ < 0,9, то связь считается сильной и форма зависимости прямолинейная.
4.найдем значение корреляционного отношения и сделаем выводы о тесноте корреляционной связи.
Для оценки тесноты связи корреляционной зависимости пользуются характеристикой, которая называется корреляционным отношением и вычисляется по формуле
,
где – межгрупповое среднее квадратическое отклонение;
– общее среднее квадратическое отклонение.
,
Вычислим общую среднюю, используя средние значения в каждой группе:
у=41∙8+43,53∙9+22,5∙8+19,7∙16+10∙950=26,1.
Вычислим межгрупповое среднее квадратическое отклонение:
sмежгр.=(41-26,1)2∙8+43,53-26,12∙9+22,5-26,12∙8+〖19,17-26,1)〗^2∙16+〖(10-26,1)〗^2∙950=8842,59850=13,306
.
sобщ.=(10-26,1)2∙8+20-26,12∙9+30-26,12∙8+〖40-26,1)〗^2∙16+〖(50-26,1)〗^2∙950=10762,550=14,671.
Тогда .
Так как корреляционное отношение по абсолютной величине удовлетворяет соотношению 0,7 < \\ < 0,9, то связь считается сильной.
5