Средние величины и показатели вариационных рядов
Охарактеризовать ряд распределения с помощью следующих показателей:
Средняя величина анализируемого признака.
Структурные средние: мода, медиана, первый и третий квартиль.
Показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации.
Коэффициент асимметрии.
Дать графическое изображение и выводы по результатам расчётов.
Распределение студентов факультета по возрасту характеризуется приведенными в таблице данными. Определите средний возраст студентов и остальные показатели задания.
Возраст студентов, лет До 21 21-25 25-29 29-33 33-37 37-41 Свыше 41 Всего
Число студентов, чел. 72 153 180 260 92 35 8 800
Решение
Таблица для расчета показателей.
Возраст студентов,
лет Число студентов,
fi Накопленная частота, S Централь
ная варианта, xцентр xi·fi |x-xср|·fi (x-xср)2·fi
17 - 21 72 72 19 1368 678.24 6389.021
21 - 25 153 225 23 3519 829.26 4494.589
25 - 29 180 405 27 4860 255.6 362.952
29 - 33 260 665 31 8060 670.8 1730.664
33 - 37 92 757 35 3220 605.36 3983.269
37 - 41 35 792 39 1365 370.3 3917.774
41 - 45 8 800 43 344 116.64 1700.611
Итого 800
22736 3526.2 22578.88
x= xififi= 22736800=28.42
d= 3526.2800=4.41
σ=(xi-x)2fifi=28.224=5.313
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
1) Средняя взвешенная (выборочная средняя)
2) Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Выбираем в качестве начала интервала 29, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда – 30.29
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к
. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 29 - 33, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Таким образом, 50% единиц совокупности будут меньше по величине 28.89.
Для характеристики социально-экономического явления, отражѐнного рядом распределения, следует рассчитать первый и третий квартиль (второй равен медиане) по следующим формулам, аналогичным медиане:
Таким образом, 25% единиц совокупности будут меньше по величине 24.35
Q2 совпадает с медианой, Q2 = 28.89
Остальные 25% превосходят значение 32.
Квартильный коэффициент дифференциации.
k = Q1 / Q3
k = 24.35 / 32 = 0.76
3) Показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = xmax - xmin = 45 - 17 = 28
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 4.41Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е