Сводка и группировка статистических данных. Статистические показатели и средние величины
Приведены данные по количеству осужденных лиц по районам области. Произвести группировку с равными интервалами данных своего варианта, вычислить основные характеристики вариационного ряда и сделать выводы. Построить гистограмму распределения и кумуляту. С помощью кумуляты определить, в скольких районах количество осужденных лиц не превышает их среднего числа.
384; 632; 945; 623; 818; 423; 338; 369; 643; 594; 640; 619; 472; 491; 538; 382; 824; 584; 593; 497; 561; 870; 903; 571; 969.
Решение
Общее количество предоставленных для исследования данных 𝑛 = 25. Отсортируем значения ряда по возрастанию от наименьшего к наибольшему, получим:
338; 369; 382; 384; 423; 472; 491; 497; 538; 561; 571; 584; 593; 594; 619; 623; 632; 640; 643; 818; 824; 870; 903; 945; 969.
Таким образом, наименьшее количество осужденных составляет xmin = 338, а наибольшее – xmax =969.
Определим количество интервалов по формуле:
n=1+3,3221*lg (25)=5,64
Определим рекомендуемую ширину интервала по формуле:
k=969-3385≈126,2
Учитывая, что количество осужденных может быть только целым числом, выберем 𝑘 = 127 чел.
Для определения начала первого интервала вычислим величину по формуле:
xmin-k2
338-1122=275
Таким образом, первый интервал составит от 275 чел. до 338 чел.
Тогда интервальный ряд будет иметь вид, представленный в таблице 1.
Таблица 1 – Интервальный ряд
Количество осужденных (х), чел
. Середина интервала (xi) Частота (ni), количество районов Накопленная частота, (nicum)
275-338 306,5 1 1
338-465 401,5 4 5
465-592 528,5 7 12
592-719 655,5 7 19
719-846 782,5 2 21
846-973 909,5 4 25
Для полученного вариационного ряда вычислим среднюю арифметическую по формуле:
Подставим значения xi и ni в формулу и получим:
x=306,5*1+401,5*4+528,5*7+655,5*7+782,5*2+909,5*425= 616,14
В расчетные формулы входит разность (xi-x) поэтому для упрощения вычислений сведем их в таблицу 2.
Таблица 2 – Вспомогательные вычисления для расчета основных статистических характеристик
xi ni (xi-x)
(xi-x)2ni
(xi-x)3ni
(xi-x)4ni
306,5 1 -309,64 95876,9296 -29687332,48 8,45E+19
401,5 4 -214,64 184281,3184 -39554142,18 4,61302E+21
528,5 7 -87,64 53765,3872 -4711998,534 5,84937E+19
655,5 7 39,36 10844,4672 426838,229 9,68124E+16
782,5 2 166,36 55351,2992 9208242,135 1,87733E+19
909,5 4 293,36 344240,3584 100986351,5 5,61704E+22
306,5 1 -309,64 95876,9296 -29687332,48 8,45E+19
СУММА 744359,76 36667958,71 6,09452E+22
Проведем расчет дисперсии по формуле, взяв значения суммы из таблицы:
s2=744359,7625=29774,39
Вычислим среднеквадратическое отклонение по формуле:
s=29774,39=172,55
Определим коэффициент вариации по формуле:
v=172,55616,14*100%=28,09%
На основе вычисленного значения среднеквадратического отклонения и значений таблицы 2 вычислим асимметрию и эксцесс по формулам:
А=36667958,7125*172,553=0,29
Е=6,09452E+2225*172,554-3=2,74988E+12
Сделаем выводы:
Количество осужденных составляет в среднем 616,14 человек на район.
Коэффициент вариации 28,09% указывает на наличие несущественного разброса значений ряда