Исследование линейной корреляционной зависимости между случайными величинами.
Распределение 100 фрез по твердости Y (HRC) и стойкости X (ч):
yj
xi
Итого
25 30 35 40 45 50
35
45
55
65
75 4 2
5
3
5
2
45
8
4
5
7
7
3 6
8
55
17
14
Итого 4 7 10 57 19 3 100
На основе совокупности n независимых наблюдений пар xi, yj требуется:
изобразить поле корреляции;
построить эмпирические распределения условных средних значений xy и yx, а также графики эмпирических линий регрессии;
найти центр эмпирического распределения x,y;
вычислить коэффициенты регрессии ρyx и ρxy;
составить уравнения выборочных прямых регрессии Y на X и X на Y, изобразить их графически;
вычислить выборочный коэффициент корреляции rxy;
на уровне надежности γ=0,95 построить доверительный интервал для генерального коэффициента корреляции rxy.
Решение
Изобразить поле корреляции
построить эмпирические распределения условных средних значений xy и yx, а также графики эмпирических линий регрессии
Обозначим через ni, nj – частоты xi, yj соответственно.
Для каждой строки таблицы вычислим условные средние
xy=i=16xi∙nijnj
где nij – частота пар xi;yj, nj=i=16nij.
Аналогично для каждого столбца таблицы вычислим соответствующие условные средние
yx=j=15yj∙nijni
где nij – частота пар xi;yj, ni=j=15nij.
Вычисленные значения добавим в таблицу
yj
xi
nj
xy
25 30 35 40 45 50
35 4 2
6 26,6667
45
5 3
8 31,875
55
5 45 5
55 40
65
2 8 7
17 41,4706
75
4 7 3 14 44,6429
ni
4 7 10 57 19 3 100 -
yx
35 42,143 54 57,807 66,05 75 - -
Эмпирическая линия регрессии Y на X – в координатной плоскости отметим найденные условные средние точками с координатами xi,yx и соединим эти точки ломаной линией.
Эмпирическая линия регрессии X на Y - в координатной плоскости отметим найденные условные средние точками с координатами xy, yj и соединим эти точки ломаной линией.
По виду ломанных можно предположить, наличие линейных корреляционных зависимостей Y на X и X на Y.
найти центр эмпирического распределения x,y
Найдем средние
x=1ni=16xini=1100∙25∙4+30∙7+35∙10+40∙57+45∙19+50∙3=1100∙100+210+350+2280+855+150=3945100=39,45
y=1nj=15yjnj=1100∙35∙6+45∙8+55∙55+65∙17+75∙14=1100∙210+360+3025+1105+1050=5750100=57,5
39,45;57,5 - центр эмпирического распределения.
вычислить коэффициенты регрессии ρyx и ρxy
Найдем средние
x2=1ni=16xi2ni=1100∙252∙4+302∙7+352∙10+402∙57+452∙19+502∙3=1100∙2500+6300+12250+91200+38475+7500=158225100=1582,25
y2=1nj=15yj2nj=1100∙352∙6+452∙8+552∙55+652∙17+752∙14=1100∙7350+16200+166375+71825+78750=340500100=3405
xy=1ni=16j=15xi∙yj∙nij=1100∙25∙35∙4+30∙35∙2+30∙45∙5+35∙45∙3+35∙55∙5+40∙55∙45+45∙55∙5+35∙65∙2+40∙65∙8+45∙65∙7+40∙75∙4+45∙75∙7+50∙75∙3=1100∙3500+2100+6750+4725+9625+99000+12375+4550+20800+20475+12000+23625+11250=230775100=2307,75
Коэффициенты регрессий
ρyx=xy-x∙yx2-x2=2307,75-39,45∙57,51582,25-39,452≈1,5175
ρxy=xy-x∙yy2-y2=2307,75-39,45∙57,53405-57,52≈0,3987
составить уравнения выборочных прямых регрессии Y на X и X на Y, изобразить их графически
Уравнения регрессий имеют вид
yx=y+ρyx∙x-x
xy=x+ρxy∙y-y
Уравнение выборочной прямой регрессии Y на X
yx=57,5+1,5175∙x-39,45
yx=1,5175x-2,3654
При увеличении стойкости фрез X на 1 час твердость фрез Y увеличивается в среднем на 1,5175 HRC.
Уравнение выборочной прямой регрессии X на Y
xy=39,45+0,3987∙y-57,5
xy=0,3987y+16,5248
При увеличении твердости фрез Y на 1 HRC стойкость фрез X увеличивается в среднем на 0,3987 часа.
Отметим, что свободные члены в уравнениях регрессий не имеют реального смысла.
Построим график линий регрессий
x
25 50
y
35 75
yx
35,5721 73,5096
xy
30,4793 46,4273
вычислить выборочный коэффициент корреляции rxy
Выборочных коэффициент корреляции
rxy=xy-x∙yx2-x2∙y2-y2=2307,75-39,45∙57,51582,25-39,452∙3405-57,52≈0,7779
Между переменные X и Y прямая корреляционная связь.
на уровне надежности γ=0,95 построить доверительный интервал для генерального коэффициента корреляции rxy
Построим доверительный интервал для генерального коэффициента корреляции rxy, применяя z- преобразование Фишера