Зависимость между показателями X и Y приведена в таблице:
Х 25 30 28 34 40 42 46 49 50 52
Y 41 40 38 37 37 35 32 33 32 29
1. Построить поле корреляции.
2. Полагая, что между X и Y имеет место линейная корреляционная связь, найти выборочное уравнение прямой линии регрессии
y-y0=rAσyσxx-x
и выборочный коэффициент корреляции rB.
3. Построить линию регрессии.
4. Сделать вывод о направлении и тесноте связи между показателями X и Y.
Решение
1) Построим диаграмму рассеяния, отметив в прямоугольной декартовой системе координат точки с координатами x, y- эмпирические данные.
По характеру расположения точек на диаграмме можно постороить линейную функцию.
2) Вычислим числовые характеристики величин X и Y: средние x, y; средние квадратические отклонения sx, sy, корреляционный момент Kxy, коэффициент корреляции rB.
Составим расчетную таблицу
i
xi
yi
xi2
yi2
xi*yi
1 25 41 625 1681 1025
2 30 40 900 1600 1200
3 28 38 784 1444 1064
4 34 37 1156 1369 1258
5 40 37 1600 1369 1480
6 42 35 1764 1225 1470
7 46 32 2116 1024 1472
8 49 33 2401 1089 1617
9 50 32 2500 1024 1600
10 52 29 2704 841 1508
∑ 396 354 16550 12666 13694
x=1ni=1nxi=39610=39.6
x2=1ni=1nxi2=1655010=1655
sx2=x2-x2=1655-39.62=86.84
sx=σx2=86.84≈9.32
y=1ni=1nyi=35410=35.4
y2=1ni=1nyi2=1266610=1266.6
sy2=y2-y2=1266.6-35.42=13.44
sy=σy2=13.44≈3.67
x*y=1ni=1nxiyi=1369410=1369.4
Kxy=x*y-x*y=1369.4-39.6*35.4=-32.44
rB=x*y-x*ysx*sy=-32.449.32*3.67=-0.95
Получаем выборочное уравнение прямой регрессии Y и X по формуле
y-y=rB*sysx*x-x
В нашем случае искомое уравнение имеет вид:
y-35.4=-0.95*3.679.32*x-39.6
y=-0.37x+50.21
Таким образом, расчеты подтвердили, что между показателями X и Y наблюдается положительная линейная корреляционная связь (связь обратная, так как rB≈-0.95<0), которую согласно таблице Чеддока можно считать весьма высокой (rB≈-0.95).
Для построения линии регрессии (прямой) найдем две точки