А) Выполнить группировку субъектов РФ по показателю «объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами» по субъектам Российской Федерации за 2018 год (млн. руб.), указанных в варианте задания (Приложение 1. Источник: http://old.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/enterprise/ind ustrial/). Результат представить в виде группировочной таблицы.
Б) Рассчитать следующие характеристики:
а) показатели центра распределения;
б) показатели вариации;
в) показатели дифференциации;
г) показатели формы распределения.
В) Дать сравнительную оценку полученных по группам средних значений показателя.
Сформулировать выводы.
Решение
Построим интервальный ряд распределения, количество интервалов определим по формуле Стерджесса:
n=1+3,322lg(N) (1)
Где N – объем совокупности.
n=1+3,322lg(20) = 7,38 ≈ 7 интервалов
Длина интервала:
h=Hn=xmax-xminn (2)
Где H – размах вариации,
xmax и xmin – максимальное и минимальное значения признака.
h=6572374 – 518 7 = 938837 млн. руб.
Полученная интервальная группировка и промежуточные расчеты представлены в таблице 1.
Таблица 1 – Равноинтервальная группировка субъектов РФ по объему отгруженной продукции обрабатывающими производствами в 2018 году
Группы регионов по объему отгруженных товаров, млн. руб. Количество регионов – частота, fi
518 – 939355 69
939355 – 1878191 9
1878191 – 2817028 4
2817028 – 3755864 0
3755864 – 4694701 0
4694701 – 5633537 0
5633537 - 6572374 1
Итого 83
Из таблицы 1 видно, что равноитервальная группировка не информативная, большая часть регионов (69) относится к первой группе, а 3 группы оказались вообще не заполненными. Поэтому сформируем группировку регионов из 7-х групп с прогрессивно возрастающими интервалами в геометрической прогрессии с коэффициентом (α) 3. В этом случае длина каждого интервала будет определяться по формуле:
hi+1=hi*α (3)
Определим длину первого интервала для 7 групп:
h1=6572374 – 5181+3+32+33+34+35+36 = 6013 млн. руб.
По формуле (3) определим длину интервала для остальных групп:
h2=6013*3 = 18038 млн. руб. и т.д.
Для характеристики ннтервального ряда распределения с неравными интервала важным параметром выступает показатель плотности распределения, который характеризует количество регионов, приходящихся на единицу длины интервала по объему отгруженной продукции, и определяется по формуле:
mi= fihi (4)
Результаты группировки представлены в таблице 2.
Таблица 2 – Группировка субъектов РФ с прогрессивно-возрастающими интервалами по объему отгруженной продукции обрабатывающими производствами в 2018 году
Группы регионов по объему отгруженных товаров, млн. руб. Длина интервала,
hi Количество регионов – частота, fi Накопленная частота, Fi Удельный вес регионов – частость, di Накопленная частость, Di Плотность, mi
518 - 6531 6013 5 5 6,0 6,0 0,000832
6531 - 24569 18038 5 10 6,0 12,0 0,000277
24569 - 78683 54114 9 19 10,8 22,9 0,000166
78683 - 241025 162342 24 43 28,9 51,8 0,000148
241025 - 728052 487027 21 64 25,3 77,1 0,000043
728052 - 2189132 1461081 16 80 19,3 96,4 0,000011
2189132 - 6572374 4383242 3 83 3,6 100,0 0,000001
Итого - 83 - 100 - -
Б) Для расчета показателей центра, вариации и формы распределения построим расчетную таблицу 3.
Таблица 3 – Расчетная таблица для изучения распределения субъектов РФ по объему отгруженной продукции обрабатывающими производствами в 2018 году
Группы регионов по объему отгруженных товаров, млн. руб. Коли-чество регионов – частота, fi Середина интервала, x'i
x'ifi
(x'i-x )2fi
(x'i-x )3fi
(x'i-x )4fi
518 - 6531 5 3524,5 17622,5 1,87E+12 -1,14E+18 6,99E+23
6531 - 24569 5 15550,0 77750 1,80E+12 -1,08E+18 6,46E+23
24569 - 78683 9 51626,0 464634 2,86E+12 -1,61E+18 9,07E+23
78683 - 241025 24 159854,0 3836496 4,97E+12 -2,26E+18 1,03E+24
241025 - 728052 21 484538,5 10175309 3,58E+11 -4,67E+16 6,10E+21
728052 - 2189132 16 1458592,0 23337472 1,14E+13 9,60E+18 8,10E+24
2189132 - 6572374 3 4380753,0 13142259 4,25E+13 1,60E+20 6,03E+26
Итого 83 6554438 51051542 6,58E+13 1,64E+20 6,15E+26
Определим показатели центра распределения анализируемого ряда – среднюю арифметическую, моду и медиану.
Средняя арифметическая интервального ряда распределения определяется по формуле:
x= x'ififi (5)
Где x'i – середина i-го интервала,
fi–вес фактора.
x= 5105154283 = 615078,8 млн
. руб.
Среднерегиональный объем отгруженной продукции обрабатывающих производств в РФ в 2018 году 615078,8 млн. руб.
Мода (Мо) - наиболее часто встречающееся значение признака. Для интервального ряда распределения с неравными интервалами мода определяется по формуле:
Мо=xMо+hМо*mMо-mMо-1mMо-mMо-1+(mMо-mMо+1) (6)
Где: xMо- нижняя граница модального интервала,
hМо - длина модального интервала,
mMо, mMо-1, mMо+1 - соответственно плотность модального, предмодального и послемодального интервалов.
Наибольшая плотность распределения соответствует группе регионов с объемом отгруженной продукции от 518 до 6531 млн. руб., данный интервал и будет модальным.
Мо=518+6013*0,000832-00,000832-0+(0,000832-0,000277) = 4126 млн. руб.
У большинства регионов объем отгруженной продукции обрабатывающих производств составляет 4126 млн. руб.
Медиана (Ме) соответствует значению признака, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером:
NMe=n+12 (7)
Для интервального ряда медиана определяется по формуле:
Ме=xMe+hМе*fi2-FMe-1fMe (8)
Где: xMe- нижняя граница медианного интервала,
hМе - длина медианного интервала,
FMe-1 - накопленная частота интервала, предшествующего медианному,
fMe - частота медианного интервала.
Определим положение медианы:
NMe=83+12 = 42
Медианой является значение 42-го показателя ранжированного ряда распределения регионов. По накопленной частоте из таблицы 2 видно, что 42-й регион находятся в группе с объемом отгруженной продукции от 78683 до 241025, данный интервал и будет медианным.
Ме=78683+162342*832-1924 = 230879 млн. руб.
У половины регионов объем отгруженной продукции обрабатывающих производств менее 230879 млн. руб., а у половины регионов - более 230879 млн. руб.
х>Мe>Мo, что свидетельствует о правосторонней асимметрии распределения регионов, в котором преобладают регионы с более низким объемом отгруженной продукции, что подтверждается результатами равноинтервальной группировки (таблица 1).
Для измерения вариации распределения чаще всего используются дисперсия, среднеквадратическое отклонение и среднеквадратическое отклонение.
Дисперсия (σ2) – средняя из квадратов отклонений вариантов значений признака от их средней величины, для интервального ряжа распределения рассчитывается:
σ2= (x'i-x )2fifi (9)
σ2= 6,58*101383=7,93*1011
Среднеквадратическое отклонение (σ) показывает, на сколько в среднем индивидуальные значения признака отличаются от среднего показателя всей совокупности, представляет собой корень из дисперсии:
σ= σ2 (10)
σ= 7,93*1011 = 890248,27 млн