Сводка и группировка статистических данных. Статистические показатели и средние величины
Приведены данные по количеству осужденных лиц по районам области. Произвести группировку с равными интервалами данных своего варианта, вычислить основные характеристики вариационного ряда и сделать выводы. Построить гистограмму распределения и кумуляту. С помощью кумуляты определить, в скольких районах количество осужденных лиц не превышает их среднего числа.
384; 632; 945; 623; 818; 423; 338; 369; 643; 594; 640; 619; 472; 491; 538; 382; 824; 584; 593; 497; 561; 870; 903; 571; 969.
Решение
Общее количество предоставленных для исследования данных 𝑛 = 25. Отсортируем значения ряда по возрастанию от наименьшего к наибольшему, получим:
338; 369; 382; 384; 423; 472; 491; 497; 538; 561; 571; 584; 593; 594; 619; 623; 632; 640; 643; 818; 824; 870; 903; 945; 969.
Таким образом, наименьшее количество осужденных составляет xmin = 338, а наибольшее – xmax =969.
Определим рекомендуемую ширину интервала по формуле:
k=969-3381+3,221*lg 25≈111.7982
Учитывая, что количество осужденных может быть только целым числом, выберем 𝑘 = 112 чел.
Для определения начала первого интервала вычислим величину по формуле:
xmin-k2
338-1122=282
Таким образом, первый интервал составит от 282 чел. до 338 чел.
Тогда интервальный ряд будет иметь вид, представленный в таблице 1.
Таблица 1 – Интервальный ряд
Количество осужденных (х), чел. Середина интервала (xi) Частота (ni), количество районов Накопленная частота, (nicum)
282-338 310 1 1
338-450 394 4 5
450-562 506 5 10
562-674 618 9 19
674-786 730 0 19
786-898 842 3 22
898-1010 954 3 25
Для полученного вариационного ряда вычислим среднюю арифметическую по формуле:
Подставим значения xi и ni в формулу и получим:
x=310*1+394*4+506*5+618*9+730*0+842*3+954*325= 614,64
В расчетные формулы входит разность (xi-x) поэтому для упрощения вычислений сведем их в таблицу 2.
Таблица 2 – Вспомогательные вычисления для расчета основных статистических характеристик
xi ni
(xi-x)
(xi-x)2ni
(xi-x)3ni
(xi-x)4ni
310 1 -304,64 92805,5296 -28272276,54 7,41815E+19
394 4 -220,64 194728,0384 -42964794,39 5,7514E+21
506 5 -108,64 59013,248 -6411199,263 6,06412E+19
618 9 3,36 101,6064 341,397504 959238864,5
730 0 115,36 0 0 0
842 3 227,36 155077,7088 35258467,87 1,73508E+21
954 3 339,36 345495,6288 117247396,6 4,27456E+22
СУММА 847221,76 74857935,67 5,03669E+22
Проведем расчет дисперсии по формуле, взяв значения суммы из таблицы:
s2=847221,7625=33888,87
Вычислим среднеквадратическое отклонение по формуле:
s=33888,87=184,09
Определим коэффициент вариации по формуле:
v=184,09614,64*100%=29,95%
На основе вычисленного значения среднеквадратического отклонения и значений таблицы 2 вычислим асимметрию и эксцесс по формулам:
А=74857935,6725*184,093=0,48
Е=5,03669E+2225*184,094-3=1,75425E+12
Сделаем выводы:
Количество осужденных составляет в среднем 614,64 человек на район.
Коэффициент вариации 29,95% указывает на наличие несущественного разброса значений ряда