Имеются следующие данные об успеваемости одной из групп студентов:
Девушки 1 2 3 4 5 6 7 8 9 10
Оценки 4 3 3 5 5 4 4 5 4 5
Юноши 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Оценки 3 5 4 3 3 4 4 4 5 4 4 4 3 3 5
С помощью правила сложения дисперсии определите, влияет ли пол на успеваемость. Рассчитайте корреляционное отношение и коэффициент детерминации.
Решение
Распределение студентов по полу и успеваемости
Оценки Девушки Юноши Итого
3 2 5 7
4 4 7 11
5 4 3 7
Итого 10 15 25
Правило сложения дисперсий:
σобщ2=σi2+σмеж2
σобщ2 - общая дисперсия;
σмеж2 - межгрупповая дисперсия.
Общая дисперсия измеряет вариацию результативного признака в результате действия всех существующих факторов.
Общая дисперсия вычисляется по формуле:
σобщ2=(yi-y)2n
где yi - индивидуальные значения результативного признака
y - среднее значение результативного признака.
Среднее значение результативного признака (успеваемость):
y=yn=4+3+3+…+4+5+3+5+4+…+3+3+510+15=10025=4
Тогда общая дисперсия
σобщ2=(4-4)2+(3-4)2+(3-4)2+…+(3-4)2+(3-4)2+(5-4)225=1425=0.56
Межгрупповая дисперсия характеризует вариацию результативного признака под влиянием признака, положенного в основу группировки
. Она определяется по формуле
σмеж2=(yj-y)2∙fifi=(4,2-4)2∙10+(3,9-4)2∙1525=0,4+0,1525=0,022
Средний балл для девушек:
yд=3*2+4*4+5*42+4+4=6+16+2010=4210=4.2
Средний балл для юношей:
yю=3*5+4*7+5*35+7+3=15+28+1515=5815=3,9
Внутригрупповая дисперсия характеризует вариацию результативного признака под влиянием всех прочих факторных признаков за исключением признака, положенного в основу группировки.
Среднюю из внутригрупповых дисперсий можно вычислить, используя правило сложения дисперсий из формулы
σобщ2=σi2+σмеж2
0,56=σi2+0,022
Только она не участвует при дальнейших расчетах.
Тесноту связи между полом и успеваемостью измеряет эмпирическое корреляционное отношение:
η=σмеж2σобщ2=0,0220,56=0,2
Связь между полом и успеваемостью слабая.
Квадрат эмпирического корреляционного отношения называется эмпирический коэффициент детерминации
Он показывает, какая часть вариации результативного признака (успеваемости) связана с действием группировочного признака (пол).
η2=0,22=0,04
Это означает, что 0,04 (или 4%) вариации успеваемости студентов объясняется влиянием пола.
Контрольная работа 3