А) Выполнить группировку субъектов РФ по показателю в соответствии
с вариантом по субъектам Российской Федерации за 2019 год (Приложение
1. Источник: https://rosstat.gov.ru). Результат представить в виде
группировочной таблицы.
Б) Рассчитать следующие характеристики:
а) показатели центра распределения;
б) показатели вариации;
в) показатели дифференциации;
г) показатели формы распределения.
В) Дать сравнительную оценку полученных по группам средних значений
показателя в расчете на один субъект и среднего значения в целом по РФ.
Сформулировать выводы.
Решение
А) Выполним группировку субъектов РФ по показателю
Электропотребление
млн.кВт.час
1 Владимирская область 7414,6
2 Воронежская область 11974,1
3 Ивановская область 3468,0
4 Калужская область 8038,6
5 Костромская область 3728,3
Б) Рассчитать следующие характеристики:
а) показатели центра распределения;
Проранжируем ряд. Для этого сортируем его значения по возрастанию.
x
x-xcp
x2
3 Ивановская область 3468,0 3456,72 12027024,0
5 Костромская область 3728,3 3196,42 13900220,89
1 Владимирская область 7414,6 489,88 54976293,16
4 Калужская область 8038,6 1113,88 64619089,96
2 Воронежская область 11974,1 5049,38 143379070,81
34623,6 13306,28 288901698,82
Для оценки ряда распределения найдем следующие показатели: Показатели центра распределения. Простая средняя арифметическая
x=xin=34623,65=6924,72
Мода. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности. Мода отсутствует (имеются несколько показателей с одинаковым значением частоты). Медиана. Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.
Находим середину ранжированного ряда: h = (n+1)/2 = (5+1)/2 = 3. Этому номеру соответствует значение ряда 7414,6. Следовательно, медиана Me = 7414,6
б) показатели вариации;
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда. R = xmax - xmin = 11974,1 - 3468 = 8506,1 Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности
. Каждое значение ряда отличается от другого в среднем на 2661.256 Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Расчет методом моментов: Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия). Среднее квадратическое отклонение. Каждое значение ряда отличается от среднего значения 6924,72 в среднем на 3135,059 Оценка среднеквадратического отклонения. Относительные показатели вариации. К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс. Поскольку v>30% ,но v<70%, то вариация умеренная. Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины. Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.
в) показатели дифференциации;
Квартили. Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1, 25% будут заключены между Q1 и Q2, 25% - между Q2 и Q3. Остальные 25% превосходят Q3. Находим 1/4 ранжированного ряда: h = (n+1)/4 = (5+1)/4 = 1. Этому номеру соответствует значение ряда 3468