В таблице представлены данные о продукции сельского хозяйства, произведенной в Челябинской области в некотором году.
Таблица 1 – Продукция сельского хозяйства
в млн. руб.
Челябинская область 15695,8
города:
Верхний Уфалей 73,1
Еманжелинск 459,1
Златоуст 125,2
Карабаш 32,6
Копейск 219,6
Коркино 71,6
Кыштым 70,9
Магнитогорск 358,7
Миасс 188,3
Пласт 170,9
Усть-Катав 71,9
Челябинск 484,0
Южноуральск 50,7
районы:
Агаповский
943,3
Аргаяшский
736,2
Ашинский 155,6
Брединский
599,7
Варненский
626,9
Верхнеуральский 505,6
Еткульский
1079,6
Карталинский
505,9
Каслинский
226,3
Катав-Ивановский 96,6
Кизильский
569,2
Красноармейский 743,1
Кунашакский
414,1
Кусинский 157,5
Нагайбакский
550,4
Нязепетровский
188,1
Октябрьский 572,1
Саткинский
215,0
Сосновский 1188,0
Троицкий 697,5
Увельский 539,5
Уйский
501,8
Чебаркульский
822,3
Чесменский 555,0
По представленным данным:
Провести группировку по стоимости продукции сельского хозяйства.
Построить по несгруппированным данным полигон распределения, по сгруппированным данным – гистограмму, куммуляту и огиву распределения.
Определить по сгруппированным данным:
Среднее значение;
Моду;
Медиану;
Размах вариации;
Среднее линейное отклонение
Дисперсию
Среднеквадратическое отклонение
Относительный размах вариации;
Относительное линейное отклонение;
Коэффициент вариации;
Квартили распределения;
Квинтили распределения;
Центральные и начальные моменты первого, второго, третьего, четвертого порядка;
Коэффициент асимметрии;
Коэффициент эксцесса.
То же, что и в предыдущем пункте определить по несгруппированным данным с использованием средств Microsoft Excel.
Нужно полное решение этой работы?
Решение
1. Определим с помощью формулы Стерджесса число интервалов и их шаг:
k=1+3,322*lgn=1+3,322*lg37=6,2 или 6
i=xmax-xmink=1188-32,66=192,6 млн.руб.
Построим интервальный вариационный ряд и рассчитаем его частоты, накопленные частоты и середины интервалов, результат приведем в таблице:
Таблица 2 – Расчетная таблица
N Интервалы fi
f’i нак
x’i
1 32,6-225,2 15 15 128,9
2 225,2-417,8 3 18 321,5
3 417,8-610,4 11 29 514,1
4 610,4-803 4 33 706,7
5 803-995,6 2 35 899,3
6 995,6-1188,2 2 37 1091,9
Итого 37
2. Построим графики распределения:
Рисунок 1 - Гистограмма
Рисунок 2 - Полигон
Рисунок 3 - Кумулята
Рисунок 4 - Огива
Данные таблицы и рисунков показывают характерную для многих признаков форму распределения, при которой чаще встречаются средние значения. Форма распределения близка к нормальному, единственным отличием является начало распределения.
3. Среднее значение признака по сгруппированным данным:
x=x'iff=15362,337=415,2 млн.руб.
Мода рассчитывается по формуле:
Mo=x0+ifMo-fMo-1(fMo-fMo-1)+(fMo-fMo+1)
где x0 - нижняя граница модального интервала;
fMo-fMo-1 - разность частот модального и домодального интервалов;
fMo-fMo+1 - разность частот модального и послемодального интервалов;
i - шаг интервала.
Mo=32,6+192,6*15-015-0+15-3=139,6 млн.руб.
Медиана рассчитывается следующим образом:
Me=x0+i0,5f-f'Me-1fMe
где f'Me-1 - накопленная частота домедианого интервала;
fMe- частота медианного интервала.
Me=417,8+192,6*0,5*37-1811=426,6 млн.руб.
Размах вариации:
М=xmax-xmin=1188-32,6=1155,4 млн.руб.
Среднее линейное отклонение:
d=x'-xff=128,9-415,2*15+…+1091,9-415,2*237=479,0 млн.руб.
Дисперсия:
σ2=(x'-x)2ff=(128,9-415,2)2*15+…+(1091,9-415,2)2*237=83456,4
Среднее квадратическое отклонение:
σ=σ2=83456,4=288,9 млн.руб.
Относительный размах вариации:
S=Мx=1155,4415,2=2,78
Относительное линейное отклонение:
d=dx=479,0415,2=1,15
Коэффициент вариации:
V=σx=288,89415,2=0,70 или 70%
В среднем продукция сельского хозяйства в Челябинской области по городам и районам отклоняется от средней величины продукции сельского хозяйства на 288,89 млн
. руб. Совокупность не однородна, поскольку коэффициент вариации более 33%.
Квартили распределения:
Q1=x0+i0,25f-f'Q1-1fQ1=32,6+192,6*0,25*37-015=151,3 млн.руб.
Q2=Me=426,6 млн.руб.
Q3=x0+i0,75f-f'Q3-1fQ3=417,8+192,6*0,75*37-1811=588,5 млн.руб.
Квантили распределения (см. таблицу 3):
р25=155,6+157,52=313,1 млн.руб.
р75=569,2+572,12=570,65 млн.руб.
Близость значений квартилей и квантилей говорит о нормальности группировки данных. Разность между средней (415,2), медианой (426,6) и модой (139,6) велика, поэтому можно судить о различии нашего распределения с нормальным