Требуется:
1) ранжировать данные (построить вариационный ряд). Построить гистограмму, полигон, кумуляту;
2) определить основные выборочные характеристики: М (моду), Ме (медиану), (выборочную среднюю), S2 (выборочную дисперсию), («исправленную» дисперсию), V (коэффициент вариации), А (коэффициент асимметрии), Е (эксцесс);
3) определить границы, в которых с вероятностью 0,95 заключено среднее значение исследуемого признака :
а) при условии, что генеральная дисперсия известна () (за принять S2);
б) при неизвестной дисперсии (при помощи t-статистики);
4) определить доверительный интервал для дисперсии с вероятностью 0,95;
5) определить объём выборки, при котором с вероятностью 0,9973 отклонение среднего выборки от средней (генеральной совокупности) всей 1 % (по абсолютной величине);
6) для эмпирического распределения исследуемого признака на уровне значимости = 0,05 проверить гипотезу о нормальности распределения с помощью критерия.
95
49
71
85
99 72
71
52
80
100 85
95
61
92
101 99
72
86
40
86 86
52
101
67
70 99
86
100
72
85 101
85
99
85
88 103
99
86
86
60 70
100
75
76
69 72
101
74
71
109 61
70
77
92
50 52
72
87
96
61
Ответ
См. рисунок
M=69.9, Me=76.8, x=18,017, S2=303.587, S2=308.733, V=21.51%, A=-0,257, E=-1.05
а) 76,607;85,427, б) 76,517;85,517
221,812; 459,284
2733
Гипотеза не согласуется с опытными данными
Решение
1) Ранжировать данные (построить вариационный ряд). Построить гистограмму, полигон, кумуляту.
Составим интервальный вариационный ряд
n=60
Минимальное и максимальное значения случайной величины равны:
xmin=40, xmax=109
Размах выборки:
R=xmax-xmin=109-40=69
Число интервалов приближенно определяется по формуле Стерджесса:
L=1+3,22lgn
Получим: L=1+3,22∙lg60=6.7. Выделим 6 интервалов.
Длина частичного интервала равна h=R6=696=11,5.
Получим интервальный вариационный ряд (табл. 1).
Интервал Середина интервала Частота Частость Накопленная частота Накопленная частость
40..51,5 45,75 3 0,05 3 0,05
51,5..63 57,25 7 0,12 10 0,17
63..74,5 68,75 14 0,23 24 0,40
74,5..86 80,25 9 0,15 33 0,55
86..97,5 91,75 13 0,22 46 0,77
97,5..109 103,25 14 0,23 60 1,00
Построим полигон, гистограмму и полигон частот:
Построим кумуляту
2) Определить основные выборочные характеристики: М (моду), Ме (медиану), (выборочную среднюю), S2 (выборочную дисперсию), («исправленную» дисперсию), V (коэффициент вариации), А (коэффициент асимметрии), Е (эксцесс).
Найдем моду по гистограмме графически. Для этого выбираем самый высокий прямоугольник, который и является модальным, далее верхнюю правую вершину соединяем с верхней правой вершиной предыдущего, в верхнюю левую вершину соединяем с левой правой вершиной последующего.
M≈68.75+5.755=69.9
Медиана графически рассчитываем по кумуляте
. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности, делим пополам (602=30). Через полученную точку проводим прямую, параллельно оси абсцисс, до пересечения с кумулятой.
Me≈74.5+5.75∙0.4=76.8
Найдем выборочную среднюю, в качестве xi берем середины соответствующих интервалов (найдены в табл. 1):
Середина интервала Частота
45,75 3
57,25 7
68,75 14
80,25 9
91,75 13
103,25 14
x=1ni=1mnixi=16045.75∙3+57.25∙7+68.75∙14+80.25∙9+91.75∙13+103.25∙14==81.017
Найдем выборочную дисперсию:
S2=x2-x2, x2=1ni=1mnixi2
x2=16045.752∙3+57.252∙7+68.752∙14+80.252∙9+91.752∙13+103.252∙14==6867.288
S2=6867.288-81.0172=303.587
Найдем исправленную дисперсию:
S2=nn-1∙S2=6059∙303.587=308.733
Найдем среднее квадратичное отклонение:
S=S2=303.587=17.424.
Найдем коэффициент вариации:
V=Sx∙100%
V=17.42481.017∙100%=21.51%
Найдем коэффициент асимметрии:
A=μ3S3
Третий центральный момент μ3 найдем по формуле:
μ3=ν3-3ν1ν2+2ν13
Учитываем, что ν1=x, ν2=x2, ν3=x3.
ν1=x=81.017
ν2=x2=6867.288
ν3=x3=16045.753∙3+57.253∙7+68.753∙14+80.253∙9+91.753∙13+103.253∙14==604198,245
μ3=604198,245-3∙81,017∙6867,288+2∙81,0173=-1357,747
A=-1357,74717,4243=-0,257
Найдем эксцесс:
E=μ4S4-3
Четвертый центральный момент найдем по формуле:
μ4=ν4-4ν1ν3+6ν12ν2-3ν14
ν4=x4=16045.754∙3+57.254∙7+68.754∙14+80.254∙9+91.754∙13+103.254∙14==54777836,370
μ4=54777836.370-4∙81.017∙604198.245+6∙81.0172∙6867.288-3∙81.0174==179742,392
E=179742.39217.4244-3=-1.05
3) Определить границы, в которых с вероятностью 0,95 заключено среднее значение исследуемого признака :
а) при условии, что генеральная дисперсия известна () (за принять S2);
б) при неизвестной дисперсии (при помощи t-статистики).
а) По условию σ2=S2=303.587, α=1-0,95=0,05