Исследование линейной корреляционной зависимости между случайными величинами.
Распределение 100 станков по времени непрерывной работы Y (ч) и количеству обработанных деталей X (шт):
yj
xi
Итого
5 10 15 20 25 30
10
20
30
40
50 3 5
4
4
7
2
35
10
5
8
8
6
3 8
8
50
20
14
Итого 3 9 13 50 22 3 100
На основе совокупности n независимых наблюдений пар xi, yj требуется:
изобразить поле корреляции;
построить эмпирические распределения условных средних значений xy и yx, а также графики эмпирических линий регрессии;
найти центр эмпирического распределения x,y;
вычислить коэффициенты регрессии ρyx и ρxy;
составить уравнения выборочных прямых регрессии Y на X и X на Y, изобразить их графически;
вычислить выборочный коэффициент корреляции rxy;
на уровне надежности γ=0,95 построить доверительный интервал для генерального коэффициента корреляции rxy.
Решение
Изобразить поле корреляции
построить эмпирические распределения условных средних значений xy и yx, а также графики эмпирических линий регрессии
Обозначим через ni, nj – частоты xi, yj соответственно.
Для каждой строки таблицы вычислим условные средние
xy=i=16xi∙nijnj
где nij – частота пар xi;yj, nj=i=16nij.
Аналогично для каждого столбца таблицы вычислим соответствующие условные средние
yx=j=15yj∙nijni
где nij – частота пар xi;yj, ni=j=15nij.
Дополним таблицу условными средними
yj
xi
nj
xy
5 10 15 20 25 30
10 3 5 8 8,125
20 4 4 8 12,5
30 7 35 8 50 20,1
40 2 10 8 20 21,5
50 5 6 3 14 24,2857
ni
3 9 13 50 22 3 100 -
yx
10 14,444 28,462 34 39,09 50 - -
Эмпирическая линия регрессии Y на X – в координатной плоскости отметим найденные условные средние точками с координатами xi,yx и соединим эти точки ломаной линией.
Эмпирическая линия регрессии X на Y - в координатной плоскости отметим найденные условные средние точками с координатами xy, yj и соединим эти точки ломаной линией.
По виду ломанных можно предположить, наличие линейных корреляционных зависимостей.
найти центр эмпирического распределения x,y
Найдем средние
x=1ni=16xini=1100∙5∙3+10∙9+15∙13+20∙50+25∙22+30∙3=1100∙15+90+195+1000+550+90=1940100=19,4
y=1nj=15yjnj=1100∙10∙8+20∙8+30∙50+40∙20+50∙14=1100∙80+160+1500+800+700=3240100=32,4
19,4;32,4 - центр эмпирического распределения.
вычислить коэффициенты регрессии ρyx и ρxy
Найдем средние
x2=1ni=16xi2ni=1100∙52∙3+102∙9+152∙13+202∙50+252∙22+302∙3=1100∙75+900+2925+20000+13750+2700=40350100=403,5
y2=1nj=15yj2nj=1100∙102∙8+202∙8+302∙50+402∙20+502∙14=1100∙800+3200+45000+32000+35000=116000100=1160
xy=1ni=16j=15xi∙yj∙nij=1100∙5∙10∙3+10∙10∙5+10∙20∙4+15∙20∙4+15∙30∙7+20∙30∙35+25∙30∙8+15∙40∙2+20∙40∙10+25∙40∙8+20∙50∙5+25∙50∙6+30∙50∙3=1100∙150+500+800+1200+3150+21000+6000+1200+8000+8000+5000+7500+4500=67000100=670
Коэффициенты регрессий
ρyx=xy-x∙yx2-x2=670-19,4∙32,4403,5-19,42≈1,5269
ρxy=xy-x∙yy2-y2=670-19,4∙32,41160-32,42≈0,3759
составить уравнения выборочных прямых регрессии Y на X и X на Y, изобразить их графически
Уравнения регрессий имеют вид
yx=y+ρyx∙x-x
xy=x+ρxy∙y-y
Уравнение выборочной прямой регрессии Y на X
yx=32,4+1,5269∙x-19,4
yx=2,7781+1,5269x
При увеличении количества обработанных деталей X на 1 штуку время непрерывной работы станков Y увеличивается в среднем на 1,5269 часа.
Уравнение выборочной прямой регрессии X на Y
xy=19,4+0,3759∙y-32,4
xy=7,2208+0,3759y
При увеличении времени непрерывной работы станков Y на 1 час количество обработанных деталей X увеличивается в среднем на 0,3759 штук.
Отметим, что свободные члены в уравнениях регрессий не имеют реального смысла.
Построим график линий регрессий
x
5 30
y
10 50
yx
10,4126 48,5851
xy
10,9798 26,0158
вычислить выборочный коэффициент корреляции rxy
Выборочных коэффициент корреляции
rxy=xy-x∙yx2-x2∙y2-y2=670-19,4∙32,4403,5-19,42∙1160-32,42≈0,7576
на уровне надежности γ=0,95 построить доверительный интервал для генерального коэффициента корреляции rxy
Построим доверительный интервал для генерального коэффициента корреляции rxy, применяя z- преобразование Фишера