В таблице приведены наблюдаемые значения признаков X и Y. Требуется:
По данным, приведенным в таблице, вычислить числовые характеристики величин X и Y: среднее x, y; средние квадратические отклонения sx, sy, корреляционный момент Kxy, коэффициент корреляции rв.
Проверить значимость коэффициента корреляции.
Построить диаграмму рассеяния и по характеру расположения точек на диаграмме подобрать общий вид функции регрессии.
Найти эмпирические функции регрессии Y на X и X на Y и построить их графики.
X
60 90 150 80 110 120 70 130 100 140
Y
2,9 7,1 11,8 6,3 7,2 8,4 4,8 11,2 6,7 10,6
Решение
По данным, приведенным в таблице, вычислить числовые характеристики величин X и Y: среднее x, y; средние квадратические отклонения sx, sy, корреляционный момент Kxy, коэффициент корреляции rв.
n=10 – объем выборки.
Прежде чем вычислять основные статистические характеристики, составим таблицу, содержащую исходные данные и промежуточные вычисления (таблица).
№п/п
X
Y
X2
Y2
XY
1 2 3 4 5 6
1 60 2,9 3600 8,41 174
2 90 7,1 8100 50,41 639
3 150 11,8 22500 139,24 1770
4 80 6,3 6400 39,69 504
5 110 7,2 12100 51,84 792
6 120 8,4 14400 70,56 1008
7 70 4,8 4900 23,04 336
8 130 11,2 16900 125,44 1456
9 100 6,7 10000 44,89 670
10 140 10,6 19600 112,36 1484
Σi=110
1050 77 118500 665,88 8833
Используя полученные суммы по столбцам, вычислим статистические характеристики.
Выборочное средние
x=1nxi=105010=105
y=1nyi=7710=7,7
Дисперсии
sx2=x2-x2=11850010-1052=825
sy2=y2-y2=665,8810-7,72=7,298
Средние квадратические отклонения
sx=sx2=825≈28,7228
sy=sy2=7,298≈2,7015
Корреляционный момент
Kxy=xy-x∙y=883310-105∙7,7=74,8
Коэффициент корреляции
rв=Kxysx∙sy=74,828,7228∙2,7015≈0,964
Проверить значимость коэффициента корреляции.
Проверим значимость полученного выборочного коэффициента корреляции по t-критерию Стьюдента
. Наблюдаемое значения критерия
tнабл=rn-21-r2=0,964∙10-21-0,9642≈10,2542
По таблицам квантилей распределения Стьюдента по наиболее употребляемому в технике уровню значимости α=0,05 и числу степеней свободы v=n-2=10-2=8 находим критическое значение критерия Стьюдента
tкр=tα;v=t0,05;8=2,31
Так как tнабл=10,2542>tкр=2,31, то выборочный коэффициент корреляции значимо отличается от нуля.
Значения коэффициента корреляции rв≈0,964>0,9, то есть по таблице Чеддока связь между признаками X и Y весьма высокая.
Построить диаграмму рассеяния и по характеру расположения точек на диаграмме подобрать общий вид функции регрессии.
По приведенным данным стоим диаграмму рассеяния.
Для этого на плоскость xOy наносим 10 точек, координаты которых заданы в условии.
Из диаграммы рассеяния видно, что связь между признаками Y и X можно принять линейной.
Найти эмпирические функции регрессии Y на X и X на Y и построить их графики.
Находить уравнения прямых линий регрессии Y на X и X на Y будем в виде
yx=ρxyx+a и xy=ρyxy+b
соответственно