В задаче приводятся данные о весе зерна в мг X и процентном содержании жира в нем Y.
Построить поле корреляции.
Сделать предположение о виде корреляционной связи.
Найти коэффициент корреляции и оценить тесноту связи.
Проверить гипотезу о значимости выборочного коэффициента корреляции, при значимости 0,05.
Составить линейное уравнение регрессии Y на X. Построить его график на графике, где было построено поле корреляции.
Описать коэффициент регрессии и детерминации.
X
37 39 42 44 49 48 48 39 40 34
Y
3 3 5 8 8 7 6 4 4 2
Решение
Построить поле корреляции.
Сделать предположение о виде корреляционной связи.
Точки расположены вдоль прямой. Имеем видимую корреляционную связь.
Найти коэффициент корреляции и оценить тесноту связи.
Вычислим выборочный коэффициент корреляции по формуле
rв=xi-xвyi-yвxi-xв2yi-yв2
Для вычисления величин, входящих в формулу, составим вспомогательную таблицу, в которой результаты измерений записаны столбцами. Внизу каждого из этих столбцов вычислены суммы для нахождения средних xв и yв. Далее расположены столбцы, в которых вычисляются разности xi-xв и yi-yв, их квадраты и произведения. Значения этих столбцов суммируются, чтобы получить величины, необходимые для подстановки в формулу. Отметим, что суммы в столбцах, в которых вычислены разности xi-xв и yi-yв, будут всегда равны 0.
i
xi
yi
xi-xв
xi-xв2
yi-yв
yi-yв2
xi-xвyi-yв
1 37 3 -5 25 -2 4 10
2 39 3 -3 9 -2 4 6
3 42 5 0 0 0 0 0
4 44 8 2 4 3 9 6
5 49 8 7 49 3 9 21
6 48 7 6 36 2 4 12
7 48 6 6 36 1 1 6
8 39 4 -3 9 -1 1 3
9 40 4 -2 4 -1 1 2
10 34 2 -8 64 -3 9 24
Сумма 420 50 0 236 0 42 90
Средние
xв=xin=42010=42; yв=yin=5010=5
Из таблицы имеем
xi-xвyi-yв=90; xi-xв2=236; yi-yв2=42
Подставляя эти значения в формулу для вычисления коэффициента корреляции, получим
rв=xi-xвyi-yвxi-xв2yi-yв2=90236∙42≈0,9
Таким образом, у выбранных зерен имеет место очень сильная прямая корреляция между весом и процентным содержанием жира.
Проверить гипотезу о значимости выборочного коэффициента корреляции, при значимости 0,05.
Проверим нулевую гипотезу H0 об отсутствии линейной корреляционной связи между переменными X и Y в генеральной совокупности H0:rген=0.
При справедливости этой гипотезы tнабл=rmr, где ошибка коэффициента корреляции mr=1-r2n-2 и tнабл=r∙n-21-r2 имеют распределение Стьюдента с f=n-2 степенями свободы