При изучении девясила высокого рассматривалась зависимость высоты растения и содержания эфирных масел. Были получены следующие результаты, сведённые в корреляционную таблицу:
x \ y 60 –– 80 80 –– 100 100 –– 120 120 –– 140 140 –– 160 160 –– 180
0 – 1 4 2 1 2
1 – 2 5 10 18 14 3
2 – 3 2 6 24 45 20 3
3 – 4 3 10 15 11 2
4 – 5 2 3 2
Здесь x – содержание эфирных масел (%), y – высота растений (см).
Напишите уравнения прямой и обратной регрессий для данных величин. Постройте соответствующие графики. Найдите коэффициент корреляции рассматриваемых величин. По критерию Стьюдента проверьте гипотезу о существенности корреляционной связи, уровень значимости a = 0,1.
Нужно полное решение этой работы?
Решение
Корреляционная таблица:
Y / X 0.5 1.5 2.5 3.5 4.5
70 4 5 2
90 2 10 6 3
110 1 18 24 10
130 2 14 45 15 2
150
3 20 11 3
170
3 2 2
Уравнение линейной регрессии с y на x имеет вид:
EQ yx = rxy \f(x - \x\to(x);σx) σy + \x\to(y)
Уравнение линейной регрессии с x на y имеет вид:
EQ xy = rxy \f(y - \x\to(y);σy) σx + \x\to(x)
Найдем необходимые числовые характеристики.
Выборочные средние:
EQ \x\to(x) == (0.5(4 + 2 + 1 + 2) + 1.5(5 + 10 + 18 + 14 + 3) + 2.5(2 + 6 + 24 + 45 + 20 + 3) + 3.5(3 + 10 + 15 + 11 + 2) + 4.5(2 + 3 + 2))/207 = 2.437
EQ \x\to(y) = (70(4 + 5 + 2) + 90(2 + 10 + 6 + 3) + 110(1 + 18 + 24 + 10) + 130(2 + 14 + 45 + 15 + 2) + 150(3 + 20 + 11 + 3) + 170(3 + 2 + 2))/207 = 122.56
Дисперсии:
σ2x = (0.52(4 + 2 + 1 + 2) + 1.52(5 + 10 + 18 + 14 + 3) + 2.52(2 + 6 + 24 + 45 + 20 + 3) + 3.52(3 + 10 + 15 + 11 + 2) + 4.52(2 + 3 + 2))/207 - 2.4372 = 0.74
σ2y = (702(4 + 5 + 2) + 902(2 + 10 + 6 + 3) + 1102(1 + 18 + 24 + 10) + 1302(2 + 14 + 45 + 15 + 2) + 1502(3 + 20 + 11 + 3) + 1702(3 + 2 + 2))/207 - 122.562 = 526.29
Откуда получаем среднеквадратические отклонения:
σx = 0.863 и σy = 22.941
и ковариация:
Cov(x,y) = (0.5*70*4 + 1.5*70*5 + 2.5*70*2 + 0.5*90*2 + 1.5*90*10 + 2.5*90*6 + 3.5*90*3 + 0.5*110*1 + 1.5*110*18 + 2.5*110*24 + 3.5*110*10 + 0.5*130*2 + 1.5*130*14 + 2.5*130*45 + 3.5*130*15 + 4.5*130*2 + 1.5*150*3 + 2.5*150*20 + 3.5*150*11+4.5*150*3 +2.5*170*3 + 3.5*170*2 + 4.5*170*2)/207 - 2.437*122.56 = 8.9
Определим коэффициент корреляции:
EQ rxy = \f(Cov(x,y);σxσy)
EQ rxy = \f(8.9;0.863·22.941) = 0.4497
Запишем уравнения линий регрессии y(x):
EQ yx = 0.4497 \f(x - 2.437;0.863) 22.941 + 122.56
и вычисляя, получаем: yx = 11.95 x + 93.43
Запишем уравнения линий регрессии x(y):
EQ xy = 0.4497 \f(y - 122.56;22.941) 0.863 + 2.437
и вычисляя, получаем: xy = 0.0169 y + 0.37
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (2.437; 122.56) и точки расположены близко к линиям регрессии