Вычислить групповые средние xi и yjи построить эмпирические линии регрессии;
2) Предполагая, что между переменными ξ и существует линейная корреляционная зависимость:
а) найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать содержательную интерпретацию полученных уравнений;
б) вычислить коэффициент корреляции, на уровне значимости α = 0,05 оценить его значимость и сделать вывод о тесноте и направлении связи между переменными ξ и ;
в) используя соответствующее уравнение регрессии, оценить средний процент жирности молока для коров, дневной удой которых составляет 15 кг.
Решение
Для упрощения дальнейшей обработки заменим интервальные вариационные ряды их дискретными аналогами. Для этого каждый интервал разбиения, как по переменной , так и по переменной , будем характеризовать их срединным значением
Перейдем к серединам интервалов
ξ
η 5,5 8,5 11,5 14,5 17,5 Итого
3
8
8
3,4
2 16 8 26
3,8
4 16 10 2 32
4,2 2 6 10 2
20
4,6 8 6 20
34
Итого 10 16 48 36 10 120
Вычислим групповые средние. Для каждого срединного значения хi вычислим yi и для каждого значения yj вычислим xj по следующим формулам:
Групповые средние
xj=i=15xinijnj
yi=j=15yjnijni
Запишем все полученные результаты в виде корреляционной таблицы, в которой вычисленные значения групповых средних xj приведены в последней строке, а yi – в последнем столбце:
ξ
η 5,5 8,5 11,5 14,5 17,5 Итого yсрi
3 0 0 0 8 0 8 14,50
3,4 0 0 2 16 8 26 15,19
3,8 0 4 16 10 2 32 12,44
4,2 2 6 10 2 0 20 10,30
4,6 8 6 20 0 0 34 9,56
Итого 10 16 48 36 10 120
xcpj 4,52 4,25 4,20 3,47 3,48
На основании данных, представленных в корреляционной таблице, строим поле корреляции и эмпирические линии регрессии (рис. 6). Поле корреляции – точки на плоскости для которых эмпирические частоты nij отличны от нуля. Эмпирическая линия регрессии по (или Y на Х) по определению есть ломаная линия, соединяющая точки , а, соответственно эмпирическая линия регрессии по (или Х на Y) – ломаная, соединяющая точки .
Рис
. 6. Поле корреляции и соответствующие эмпирические линии регрессии
2. а) Найдем выборочные линейные уравнения регрессии. Уравнения регрессии по и по имеют вид:
Уравнение линейной регрессии с y на x имеет вид:
EQ yx = rxy \f(x - \x\to(x);σx) σy + \x\to(y)
Уравнение линейной регрессии с x на y имеет вид:
EQ xy = rxy \f(y - \x\to(y);σy) σx + \x\to(x)
Найдем необходимые числовые характеристики.
Выборочные средние:
EQ \x\to(x) = (3*8 + 3.4*26 + 3.8*32 + 4.2*20 + 4.6*34)/120 = 3.953
EQ \x\to(y) = (5.5*10 + 8.5*16 + 11.5*48 + 14.5*36 + 17.5*10)/120 = 12
Дисперсии:
σ2x = (32*8 + 3.42*26 + 3.82*32 + 4.22*20 + 4.62*34)/120 - 3.9532 = 0.26
σ2y = (5.52*10 + 8.52*16 + 11.52*48 + 14.52*36 + 17.52*10)/120 - 122 = 9.65
Откуда получаем среднеквадратические отклонения:
σx = 0.51 и σy = 3.1
и ковариация:
Cov(x,y) = (4.2*5.5*2 + 4.6*5.5*8 + 3.8*8.5*4 + 4.2*8.5*6 + 4.6*8.5*6 + 3.4*11.5*2 + 3.8*11.5*16 + 4.2*11.5*10 + 4.6*11.5*20 + 3*14.5*8 + 3.4*14.5*16 + 3.8*14.5*10 + 4.2*14.5*2 + 3.4*17.5*8 + 3.8*17.5*2)/120 - 3.953*12 = -1.08
Определим коэффициент корреляции:
EQ rxy = \f(Cov(x,y);σxσy)
Поскольку полученный коэффициент корреляции отрицательный, то можно сделать вывод о том, что между рассматриваемыми переменными наблюдается обратная корреляционная связь