По данным Росстата в 2018 г. распределение численности населения по возрасту следующее:
Возраст, лет Численность населения РФ, тыс. чел.
до 10 18 220
10-20 14 414
20-30 18 456
30-40 24 191
40-50 19 952
50-60 20 421
60-70 17 720
старше 70 13 506
146 880
Постройте график вариационного ряда
Вычислите:
Характеристики центра распределения: среднее значение варьирующего признака, моду, медиану.
Показатели вариации: размах вариации, дисперсию и среднее квадратическое отклонение, коэффициент вариации;
Коэффициент асимметрии.
Сделайте письменный вывод по каждому показателю, рассчитанному в п.2.
Решение
1. Определение характеристик центра распределения
1) Найдем среднее значение варьирующего признака
Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.
Величина интервала второй группы равна 10, следовательно, и величина первой группы также равна 10. Величина интервала предпоследней группы равна 10, значит и последний интервал будет иметь величину, равную 10.
Возраст, лет x 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80
Численность населения РФ, тыс. чел. f 18 220 14 414 18 456 24 191 19 952 20 421 17 720 13 506
х=xn=0+102=5 (пример по 1 категории)
x=xff
x=5801140146880=40
2) Найдем моду
Мода — это величина признака наиболее часто встречающегося в совокупности.
В интервальных рядах распределения с равными интервалами мода определяется по формуле:
M0=xM0+iM0*fM0-fM0-1fM0-fM0-1+(fM0-fM0+1)
хМо – начальное значение интервала, содержащего моду;
iМо – величина модального интервала,
fМо – частота модального интервала,
fМо-1 – частота интервала, предшествующего модальному,
fМо+1 – частота интервала, следующего за модальным.
Мода содержится в интервале 30-40, поскольку у этого интервала наибольшая частота f = 24191
M0=30+10*24191-1845624191-18456+24191-19952=36 лет
Таким образом, наибольшее число людей имеют возраст 36 лет.
3) Найдем медиану
Медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него.
Ме=x0+iMe*f2-SMe-1fMe
x0 – нижняя граница медианного интервала
iMe – величина медианного интервала
f – общее число единиц совокупности
SMe-1 – накопленная частота до медианного интервала
fMe – частота медианного интервала
Определим, прежде всего, медианный интервал
. Сумма накопленных частот, превышающая половину всех значений (98233), соответствует интервалу 40-50