Менеджер предприятия хочет определить, существует ли связь между возрастом работников и количеством больничных, которые они берут каждый год:
Возраста 18 26 39 48 53 58
Дни болезни 16 12 9 5 6 2
Найти выборочный коэффициент корреляции и проверить гипотезу о его значимости.
Ответ
rxy=-0,979
trф=9,62>trкр=2,78, то коэффициент корреляции статистически значим
Решение
Построим расчетную таблицу.
№ Возраста, х
Дни болезни, у х2
ху
у2
1 18 16 324 288 256
2 26 12 676 312 144
3 39 9 1521 351 81
4 48 5 2304 240 25
5 53 6 2809 318 36
6 58 2 3364 116 4
Итого 242 50 10998 1625 546
Среднее 40,333 8,333 1833,00 270,83 91,00
N=X = 16(18+26+39+48+53+58)=40,333
Q=Y = 16(16+12+9+5+6+2)=8,333
Dbx=16182+262+392+482+532+582- 40,332=206,22
Dby=16162+122+92+52+62+22-8,332=21,56
σbx=206,22 =14,36;
σbу=21,56 =4,643;
Мху= 1618*16+26*12+39*9+48*5+53*6+58*2-40,33*8,33=-65,11
rxy=Mxyσbxσbу
rxy=-65,1114,36*4,643=-65,1166,673=-0,979
Или
, т.е. связь между показателями обратная, очень тесная.
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными)
. Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В решении нашей задачи связь между признаком Y и фактором X весьма высокая и обратная.
Проверим гипотезы:
H0: rxy = 0, нет линейной взаимосвязи между переменными;H1: rxy ≠ 0, есть линейная взаимосвязь между переменными;
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
где n-2 – число степеней свободы при заданном уровне значимости и объеме выборки n.
Рассчитаем фактическое значение критерия и сравним его с критическим:
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области