Имеются данные о социальном развитии субъектов Северо-Кавказского
и Приволжского федеральных округов в 2016 году
Субьект РФ Доля сельского
населения, % Уровень экономической активности, %
Северо-Кавказский федеральный округ
Республика Дагестан 55,0 55,0
Республика Ингушетия 58,7 50,2
Кабардино-Балкарская Республика 47,8 60,4
Карачаево-Черкесская Республика 57,3 53,5
Республика Северная Осетия - Алания 35,9 58,4
Чеченская Республика 65,2 58,8
Ставропольский край 41,7 61,8
Приволжский федеральный округ
Республика Башкортостан 38,2 62,6
Республика Марий Эл 34,5 65,1
Республика Мордовия 38,1 67,9
Республика Татарстан 23,6 68,5
Удмуртская Республика 34,4 68,5
Чувашская Республика 38,7 68,3
Пермский край 24,4 61,8
Кировская область 24,1 65,0
Нижегородская область 20,5 67,5
Оренбургская область 40,1 64,3
Пензенская область 31,7 64,2
Самарская область 19,8 68,6
Саратовская область 24,7 62,9
Ульяновская область 25,3 63,3
Для изучения зависимости между долей сельского населения и уровнем экономической активности произведите группировку субъектов Северо-Кавказского и Приволжского федеральных округов по величине доли сельского населения, образовав группы с равными интервалами. По каждой группе подсчитайте: 1) количество субъектов; 2) среднюю величину доли сельского населения; 3) средний размер уровня экономической активности. Результаты представьте в виде групповой таблицы. Напишите краткие выводы.
1. Для нахождения числа групп и величины равных интервалов в аналитической и структурной группировке примените формулу Стреджесса.
2. Определите общее среднее значение показателя по формуле средней арифметической либо простой (если частоты соответствующих вариант равны между собой, или если варианты встречаются в ряду один раз), либо взвешенной (если частоты неравные).
3. Вычислите общую дисперсию.
2. По каждой группе рассчитайте групповые средние.
3. Определите внутригрупповые дисперсии.
4. Вычислите среднюю из внутригрупповых дисперсий.
5. Определите межгрупповую дисперсию.
8. Вычислите зависимость, под названием «правило сложения дисперсий».
9. Вычислите эмпирический коэффициент детерминации. Сделать вывод.
10. Для оценки степени связи исследуемого признака с группировочным рассчитайте эмпирическое корреляционное отношение. Оцените степень связи исследуемого признака с группировочным с помощью эмпирического корреляционного отношения по шкале Чеддока.
11. Проверьте значение эмпирическое корреляционное отношение на значимость распределения Фишера-Снедокера (F − распределение) при уровне значимости 𝛂 = 0,03.
12. Сделайте выводы.
Нужно полное решение этой работы?
Решение
Сгруппируем субъекты РФ по доле сельского населения.
Когда совокупность единиц более или менее однородна (вариация по группировочному признаку мала), прибегают к равным интервалам, размер которых приближенно определяется по формуле Стэрджесса:
n = 1 + 3,2log n = 1 + 3,2log(21) = 5 групп
Определим ширину интервала по формуле:
h=(Xmax-Xmin)/n
h=(65,2-19,8)/5=9%
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
Результаты группировки представим в таблице. Х – доля сельского населения, %, Y – уровень экономической активности, %.
Группы № субъекта РФ Кол-во, nj
∑X Xcp = ∑Xj / nj
∑Y Ycp = ∑Yj / nj
19.8 - 28.8 19,16,11,
15,14,20,21 7 162.4 23.2 457.6 65.37
28.8 - 37.8 18,12,9,5 4 136.5 34.13 256.2 64.05
37.8 - 46.8 10,8,13,17,7 5 196.8 39.36 324.9 64.98
46.8 - 55.8 3,1 2 102.8 51.4 115.4 57.7
55.8 - 64.8 4,2,6 3 181.2 60.4 162.5 54.17
Итого
21 779.7
1316.6
По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основано на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
Найдем средние значения каждой группы по формуле:
y1=457,67=65,37
y2=256,24=64,05
y3=324,95=64,98
y4=115,42=57,7
y5=162,53=54,17
Общее средние значение для всей совокупности определим по формуле:
y=1316,621=62,7
Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:
Произведем расчет для каждой группы.
Расчет для группы: 19.8 - 28.8 (19,16,11,15,14,20,21)
yj
(yj - yср)2 Результат
68.6 (68.6 - 65.37)2 10.42
67.5 (67.5 - 65.37)2 4.53
68.5 (68.5 - 65.37)2 9.79
65 (65 - 65.37)2 0.14
61.8 (61.8 - 65.37)2 12.76
62.9 (62.9 - 65.37)2 6.11
63.3 (63.3 - 65.37)2 4.29
Итого
48.03
Определим групповую (частную) дисперсию для 1-ой группы:
Расчет для группы: 28.8 - 37.8 (18,12,9,5)
yj
(yj - yср)2 Результат
64.2 (64.2 - 64.05)2 0.023
68.5 (68.5 - 64.05)2 19.8
65.1 (65.1 - 64.05)2 1.1
58.4 (58.4 - 64.05)2 31.92
Итого
52.85
Определим групповую (частную) дисперсию для 2-ой группы:
Расчет для группы: 37.8 - 46.8 (10,8,13,17,7)
yj
(yj - yср)2 Результат
67.9 (67.9 - 64.98)2 8.53
62.6 (62.6 - 64.98)2 5.66
68.3 (68.3 - 64.98)2 11.02
64.3 (64.3 - 64.98)2 0.46
61.8 (61.8 - 64.98)2 10.11
Итого
35.79
Определим групповую (частную) дисперсию для 3-ой группы:
Расчет для группы: 46.8 - 55.8 (3,1)
yj
(yj - yср)2 Результат
60.4 (60.4 - 57.7)2 7.29
55 (55 - 57.7)2 7.29
Итого
14.58
Определим групповую (частную) дисперсию для 4-ой группы:
Расчет для группы: 55.8 - 64.8 (4,2,6)
yj
(yj - yср)2 Результат
53.5 (53.5 - 54.17)2 0.44
50.2 (50.2 - 54.17)2 15.73
58.8 (58.8 - 54.17)2 21.47
Итого
37.65
Определим групповую (частную) дисперсию для 5-ой группы:
Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:
Средняя из частных дисперсий составит:
σ2=6,86*7+13,21*4+7,16*5+7,29*2+12,55*321=9
Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной:
σ2=16,75
Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:
σ2 = 9+16,75=25,75
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор.
Это отношение факторной дисперсии к общей дисперсии:
Определяем эмпирическое корреляционное отношение:
η=16,74725,742=0,807
Связи между признаками могут быть слабыми и сильными (тесными).
Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X высокая.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции (эмпирическое корреляционное отношение) нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия:
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области