По данным 20%-й выборки безработных, результаты которой представлены ниже, рассчитать: 1) возрастную структуру безработных; 2) моду, медиану возраста; 3) средний возраст безработных; 4) размах вариации; 5) среднее линейное отклонение; 6) дисперсию; 7) среднее квадратическое отклонение; 8) коэффициент вариации; 9) пределы, в которых изменяется средний возраст безработных; 10) с вероятностью 0,954 пределы, в которых изменяется доля безработных старше 49 лет. Сделать выводы.
Таблица 3
Исходные данные
Группы безработных по возрасту, лет Число безработных, чел
до 20 2 036
20 – 25 3 473
25 – 30 2 535
30 – 50 9 740
50 – 55 798
55 – 60 898
60 и старше 379
Решение
1) Определим долю каждой группы как отношения числа безработных в возрастной группе к общему число безработных (табл. 4).
Таблица 4
Структура безработных
Группа Частота Накопленная частота Доля, %
до 20 2 036 2 036 10,3
20 – 25 3 473 5 509 17,5
25 – 30 2 535 8 044 12,8
30 – 50 9 740 17 784 49,0
50 – 55 798 18 582 4,0
55 – 60 898 19 480 4,5
60 и старше 379 19 859 1,9
Итого 19 859 × 100,0
2) Мода – это наиболее часто встречающийся вариант ряда. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем – значение модальной величины признака по формуле:
,
где Mo – значение моды;
– нижняя граница модального интервала;
h – величина интервала;
, , – частота модального интервала, предшествующего модальному и следующего за модальным соответственно.
В данном случае интервалом с наибольшей частотой является группа в возрасте от 30 до 50 лет, тогда:
лет.
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем – значение медианы по формуле:
где Me – искомая медиана;
– нижняя граница интервала, который содержит медиану;
h – величина интервала;
– сумма частот или число членов ряда;
– сумма накопленных частот интервалов, предшествующих медианному;
– частота медианного интервала.
Находим половину суммы частот ряда:
По данным таблицы 4 первый интервал, в котором накопленная частота превышает половину суммы частот ряда – группа в возрасте от 30 до 50 лет, тогда медиана составит:
лет.
3) Определим средний возраст безработных по формуле:
,
где – середины интервалов;
– частоты интервалов.
Данный ряд распределения содержит открытые интервалы
. В таких рядах условно принимается величина интервала первой группы равной величине интервала последующей, а величина интервала последней группы равной величине интервала предыдущей.
Вспомогательные расчеты проведем в таблице (табл. 5).
Таблица 5
Вспомогательные расчеты
Группа
15 – 20 17,5 2 036 35 630,0 17,3 35 222,8 609 354,4
20 – 25 22,5 3 473 78 142,5 12,3 42 717,9 525 430,2
25 – 30 27,5 2 535 69 712,5 7,3 18 505,5 135 090,2
30 – 50 40,0 9 740 389 600,0 5,2 50 648,0 263 369,6
50 – 55 52,5 798 41 895,0 17,7 14 124,6 250 005,4
55 – 60 57,5 898 51 635,0 22,7 20 384,6 462 730,4
60 – 65 62,5 379 23 687,5 27,7 10 498,3 290 802,9
Итого × 19 859 690 302,5 110,2 192 101,7 2 536 783,1
По данным таблицы 5, получаем:
лет
4) Определим размах вариации как разность между наибольшим и наименьшим значением признака:
лет.
5) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:
По данным таблицы 5 получаем:
6) Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической:
По данным таблицы 5 получаем:
7) Среднее квадратическое отклонение представляет собой корень из дисперсии:
Среднее квадратическое отклонение всегда больше среднего линейного отклонения