Ранжировать ряд данных сортировкой по значениям от минимального к максимальному.
Рассчитать количество интервалов по формуле Стерджеса, округлив вверх до целых единиц.
Рассчитать величину интервала h, округлить до десятков.
Рассчитать границы интервалов:
Подсчитать количество единиц совокупности, принадлежащих каждому из интервалов.
Построить интервальный вариационный ряд в виде таблицы
Построить гистограмму распределения для интервалов и полигон распределения для вариант, кумуляту.
Вычислить среднее арифметическое, моду, медиану, квартили, децили.
Вычислить показатели вариации: R, dср, s2, s, Vr, Vd ,V. Вычислить асимметрию и эксцесс.
Сделать вывод об однородности вариационного ряда, о симметричности и остро- или плоско-вершинности распределения.
169 201 144 202 241 172
47 94 130 56 112 156
94 114 122 112 136 146
78 68 198 93 81 237
121 178 132 145 213
154 59 89 184 70
50 145 164 60 174
65 129 77 78 154
105 121 142 126 145
125 111 156 150 133
Решение
Ранжировать ряд данных сортировкой по значениям от минимального к максимальному.
47 50 56 59 60 65 68 70 77 78 78
81 89 93 94 94 105 111 112 112 114 121
121 122 125 126 129 130 132 133 136 142 144
145 145 145 146 150 154 154 156 156 164 169
172 174 178 184 198 201 202 213 237 241
Объем выборки равен N=54
2. Рассчитаем количество интервалов по формуле Стерджеса
k=1+3,32∙lgN=1+3,32∙lg54=1+3,32∙1,73≈6,75=7 групп
3. Рассчитаем величину интервала h, округлим до десятков.
xmin=47, xmax=241,hx=241-47=194
Величина интервала равна
l=hxN=1947=27,71≈28
4. Рассчитаем границы интервалов. Расширим границы интервалов снизу до 46.
В результате получим следующие интервалы:
46 – 74; 74 – 102; 102 – 130; 130 – 158; 158 – 186; 186 – 214; 214 – 242.
5. Рассчитаем количество единиц совокупности, принадлежащих каждому из интервалов. При попадании значения на границу интервала будем относить его к предыдущему интервалу; если на границу попадает четное количество, то разделяем значения пополам между соседними интервалами. В результате получаем следующий интервальный ряд распределения, представленный в табл. В таблице сразу рассчитаем значения вариант (середины интервалов) для построения полигона и накопленную частоту для построения кумуляты.
№ Интервал Варианта (середина интервала), xi
Частота, ni
Накопленная частота, Si
1 46 – 74 60 8 8
2 74 – 102 88 8 16
3 102 – 130 116 12 28
4 130 – 158 144 14 42
5 158 – 186 172 6 48
6 186 – 214 200 4 52
7 214 – 242 228 2 54
∑
54
7. Построим гистограмму распределения для интервалов и полигон распределения для вариант, кумуляту.
Рис
. 1 Гистограмма распределения
Рис. 2 Полигон распределения
Рис. 3 Кумулята распределения
8. Вычислить среднее арифметическое, моду, медиану, квартили, децили.
Составим расчетную таблицу
Варианта, xi
Частота, ni
ni∙xi
60 8 480
88 8 704
116 12 1392
144 14 2016
172 6 1032
200 4 800
228 2 456
Сумма 54 6880
Выборочная средняя:
xв=1Ni=17ni∙xi=688054≈127,41
Мода
Мода – это величина признака (варианта), которая чаще всего встречается в данной совокупности, т.е. имеет наибольшую частоту.
В интервальных рядах распределения с равными интервалами мода определяется по формуле:
Мо=xМо+h∙nМо-nМо-1nМо-nМо-1+nМо-nМо+1
где
xМо – начальное значение интервала, содержащего моду;
h – величина модального интервала,
mМо – частота модального интервала,
mМо-1 – частота интервала, предшествующего модальному,
mМо+1 – частота интервала, следующего за модальным.
Мода и медиана содержится в интервале от 130 до 158, так как у этого интервала наибольшая частота n=14, т.е модальным интервалом является интервал (130;158).
Тогда
Мо=130+28∙14-1214-12+14-6=135,6
Медиана
Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 130 - 158, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Me=x0+hnМeni2-SМe-1=102+2812∙542-16=127,67
Таким образом, 50% единиц совокупности будут меньше по величине 127,67.
Квартили
Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1, 25% будут заключены между Q1 и Q2, 25% - между Q2 и Q3