Используя приведенные в корреляционной таблице данные, требуется:
Найти числовые характеристики выборки – средние x, y; средние квадратические отклонения sx, sy; корреляционный момент Kxy, выборочный коэффициент корреляции rв.
Проверить значимость коэффициента корреляции.
Найти эмпирические функции регрессии yx, xy.
X
Y
3 5 7 9 11
40 4 1
60 1 3 3
80
2 7 4
100
4 8 1
120
4 8
Решение
Найти числовые характеристики выборки – средние x, y; средние квадратические отклонения sx, sy; корреляционный момент Kxy, выборочный коэффициент корреляции rв.
Дополним исходную таблицу частотами nyjи nxi
X
Y
3 5 7 9 11 nyj
40 4 1
5
60 1 3 3
7
80
2 7 4
13
100
4 8 1 13
120
4 8 12
nxi
5 6 14 16 9 n=50
Вычисление числовых характеристик для группированной выборки.
Выборочные средние
x=1nxinxi=1503∙5+5∙6+7∙14+9∙16+11∙9=15015+30+98+144+99=38650=7,72
y=1nyjnyj=15040∙5+60∙7+80∙13+100∙13+120∙12=150200+420+1040+1300+1440=440050=88
Выборочные дисперсии
sx2=1nxi2nxi-x2=15032∙5+52∙6+72∙14+92∙16+112∙9-7,722=15045+150+686+1296+1089-59,5984=326650-59,5984=5,7216
sy2=1nyj2nyj-y2=150402∙5+602∙7+802∙13+1002∙13+1202∙12-882=1508000+25200+83200+130000+172800-7744=41920050-7744=640
Выборочные средние квадратические отклонения
sx=sx2=5,7216≈2,392
sy=sy2=640≈25,2982
Выборочный корреляционный момент
Kxy=1nxynxy-x∙y=1503∙40∙4+5∙40∙1+3∙60∙1+5∙60∙3+7∙60∙3+5∙80∙2+7∙80∙7+9∙80∙4+7∙100∙4+9∙100∙8+11∙100∙1+9∙120∙4+11∙120∙8-7,72∙88=150480+200+180+900+1260+800+3920+2880+2800+7200+1100+4320+10560-679,36=3660050-679,36=52,64
Выборочный коэффициент корреляции
rв=Kxysx∙sy=52,642,392∙25,2982≈0,8699
Проверить значимость коэффициента корреляции.
Проверим значимость полученного выборочного коэффициента корреляции по t-критерию Стьюдента
. Наблюдаемое значение критерия
tнабл=rвn-21-rв2=0,8699∙50-21-0,86992≈12,2192
По таблице квантилей распределения Стьюдента по наиболее употребляемому в технике уровню значимости α=0,05 и числу степеней свободы v=n-2=50-2=48 находим критическое значение критерия Стьюдента
tкр=tα;v=t0,05;48=2,01
Так как tнабл=12,2192>tкр=2,01, то выборочный коэффициент корреляции значимо отличается от нуля.
По таблице Чеддока определяем, что связь между исследуемыми величинами X и Y высокая.
Для подтверждения линейной регрессионной зависимости между исследуемыми величинами X и Y построим диаграмму рассеяния