По сгруппированным данным корреляционной таблицы найти:
коэффициент корреляции и сделать вывод на основании его величины относительно тесноты линейной корреляционной связи между признаками X и Y,
уравнение прямой линии регрессии Y на X,
уравнение прямой линии регрессии X на Y,
построить корреляционное поле и нанести в нем полученные прямые регрессии.
X
Y
8 13 18 23 28 33 ny
5 3 4 1
8
10
6 7 9
22
15
52 8
60
20
3 4
7
25
1 2 3
nx
3 10 60 20 5 2 100
Решение
Коэффициент корреляции и сделать вывод на основании его величины относительно тесноты линейной корреляционной связи между признаками X и Y
n=100 – объем выборки.
Значения X и Y достаточно большие, равноотстоят, значит, можно перейти к более простым, условным вариантам U и V. В качестве условного нуля Cx возьмем варианту x=18, которая имеет наибольшую частоту; шаг hx=5. В качестве условного нуля Cy возьмем варианту y=15; шаг hy=5.
Составим корреляционную таблицу в условных вариантах, сохраняя частоты
U
V
-2 -1 0 1 2 3 ny
-2 3 4 1
8
-1
6 7 9
22
0
52 8
60
1
3 4
7
2
1 2 3
nx
3 10 60 20 5 2 100
Вычислим вспомогательные величины u, v, uv, σu*, σv*
u=1nnuu=1100-2∙3+-1∙10+0∙60+1∙20+2∙5+3∙2=1100-6-10+20+10+6=20100=0,2
v=1nnvv=1100-2∙8+-1∙22+0∙60+1∙7+2∙3=1100-16-22+7+6=-25100=-0,25
u2=1nnuu2=1100-22∙3+-12∙10+02∙60+12∙20+22∙5+32∙2=110012+10+20+20+18=80100=0,8
v2=1nnvv2=1100-22∙8+-12∙22+02∙60+12∙7+22∙3=110032+22+7+12=73100=0,73
uv=1nnuvuv=11003∙-2∙-2+4∙-2∙-1+1∙-2∙0+6∙-1∙-1+7∙-1∙0+9∙-1∙1+52∙0∙0+8∙0∙1+3∙1∙1+4∙1∙2+1∙2∙2+2∙2∙3=110012+8+6-9+3+8+4+12=44100=0,44
σu*= u2-u2=0,8-0,22=0,76≈0,872
σv*= v2-v2=0,73--0,252=0,6675≈0,817
Коэффициент корреляции
rв=uv-u∙vσu*∙ σv*=0,44-0,2∙-0,250,872∙0,817≈0,688
Величина выборочного коэффициента корреляции указывает на то, что линейная связь между признаками U и V, а значит и между X и Y существенная.
уравнение прямой линии регрессии Y на X
Вернемся к старым переменным X и Y
x=u∙hx+Cx=0,2∙5+18=19
y=v∙hy+Cy=-0,25∙5+15=13,75
σx*=σu∙hx=0,872∙5=4,36
σy*=σv∙hy=0,817∙5=4,085
Уравнение прямой линии регрессии Y на X имеет вид
yx-y=rвσy*σx*x-x
Найденные числовые характеристики подставим в формулу выше, раскроем скобки и приведем подобные слагаемые.
yx-13,75=0,688∙4,0854,36x-19
yx-13,75=0,6446x-19
Выборочное уравнение прямой линии регрессии Y на X имеет вид
yx=0,645x+1,503
уравнение прямой линии регрессии X на Y
Уравнение прямой линии регрессии X на Yимеет вид
xy-x=rвσx*σy*y-y
Найденные числовые характеристики подставим в формулу выше, раскроем скобки и приведем подобные слагаемые.
xy-19=0,688∙4,364,085y-13,75
xy-19=0,7343y-13,75
Выборочное уравнение прямой линии регрессии X на Y имеет вид
xy=0,734y+8,903
построить корреляционное поле и нанести в нем полученные прямые регрессии.
Изобразим точки xi, yi i=1,100 в декартовой системе координат