Имеются следующие данные:
наличие в домохозяйствах детей по величине уровня дохода
низкий средний высокий Итого
без детей 2 5 15 22
1 ребенок 6 15 5 26
2 и более детей 10 6 1 17
Итого 18 26 21 65
Определите хи-квадрат и коэффициент Чупрова. Сделайте выводы о наличии взаимосвязи между признаками.
Решение
Получено выборочное распределение признака доходов(А) в зависимости от наличия детей(В). Результаты приведены в таблице:
A1 A2 A3 ni*
B1 2 5 15 22
B2 6 15 5 26
B3 10 6 1 17
n*j 18 26 21 65
Для проверки независимости признаков «A» и «B» проверяем нулевую гипотезу Н0:(pij = pi*p*j для всех i, j). Вычислим статистику χ2 набл по формуле:где nij – наблюдаемые частоты.Если значение χ2набл попало в критическую область: χ2 > χ2крит(α ; v=4), нулевая гипотеза отвергается с вероятностью ошибки α и признаки считаются зависимыми.В этом случае имеет смысл измерить полученную связь между X и Y с помощью коэффициентов связи (сопряженности).Рассчитаем теоретические частоты по формуле:для всех клеток таблицыПолучим таблицу сопряженности теоретических частот распределения:
A1 A2 A3 ni*
B1 6.092 8.8 7.108 22
B2 7.2 10.4 8.4 26
B3 4.708 6.8 5.492 17
n*j 18 26 21 65
Вычислим статистику χ2:По таблице χ2-распределения находим:χ2крит(0.05;4) = 9.48773где v = (r-1)(s-1) = (3-1)(3-1) = 4 - число степеней свободы.Критическая область имеет вид χ2 > χ2крит
. Так как вычисленное значение хи-квадрат попадает в критическую область, то гипотеза о независимости отвергается с вероятностью ошибки 0.05.Далее воспользуемся информационным критерием проверки гипотезы независимости признаков.Для удобства вычисления можно применить следующую формулу:χ2I = 2(∑∑nijln nij - ∑ni·ln ni· - ∑n·jln n·j + n ln n)учитывая, что теоретические значения частот nij* находятся по формуле:и свойства логарифмов:χ2I = 2(2*ln(2) + 5*ln(5) + 15*ln(15) + 6*ln(6) + 15*ln(15) + 5*ln(5) + 10*ln(10) + 6*ln(6) + 1*ln(1) + 18*ln(18) - 26*ln(26) - 21*ln(21) - 22*ln(22) - 26*ln(26) - 17*ln(17) + 65 ln 65) = 26.068В результате вычисления получили χ2I = 26.07Критическая область при проверке указанной гипотезы: χ2I > χ2табл = 9.48773Так как χ2набл = 26.07 попадает в критическую область, гипотеза H0 отвергается с вероятностью ошибки 0,05.Определим силу связи по коэффициентам сопряженности.Для оценки силы связи вычислим точечные оценки коэффициентов.Коэффициент ЧупроваТаким образом, связь между «А» и «B» низкая.Рассчитаем интервальные оценки для коэффициентов Чупрова с надежностью γ = 0.95