Цель работы - знакомство с простейшими приемами обработки данных и с критерием согласия хи-квадрат.
Постановка задачи
Дана случайная выборка из неизвестного распределения. Требуется:
а) построить гистограмму;
б) оценить математическое ожидание и среднее квадратичное отклонение;
в) проверить гипотезу о нормальности распределения, из которого получена
данная выборка;
г) построить доверительные интервалы для математического ожидания и
среднего квадратичного отклонения.
Вариант 94
n=96, k=7, α=0,05
№ Х
1 13,1
2 13,2
3 13,2
4 13,4
5 13,4
6 13,4
7 13,5
8 13,7
9 13,7
10 13,8
11 13,8
12 13,8
13 13,9
14 13,9
15 14
16 14
17 14
18 14,1
19 14,2
20 14,3
21 14,3
22 14,3
23 14,3
24 14,3
25 14,3
26 14,4
27 14,5
28 14,5
29 14,5
30 14,6
31 14,6
32 14,6
33 14,7
34 14,7
35 14,7
36 14,8
37 14,8
38 14,8
39 14,9
40 15
41 15
42 15,1
43 15,1
44 15,2
45 15,2
46 15,2
47 15,2
48 15,2
49 15,2
50 15,3
51 15,3
52 15,3
53 15,3
54 15,4
55 15,4
56 15,4
57 15,5
58 15,5
59 15,6
60 15,6
61 15,6
62 15,6
63 15,7
64 15,7
65 15,7
66 15,7
67 15,8
68 15,8
69 15,8
70 15,9
71 16
72 16
73 16,1
74 16,1
75 16,1
76 16,1
77 16,2
78 16,2
79 16,2
80 16,2
81 16,2
82 16,3
83 16,3
84 16,4
85 16,4
86 16,4
87 16,4
88 16,5
89 16,5
90 16,6
91 16,6
92 16,6
93 16,7
94 17
95 17,2
96 17,3
Нужно полное решение этой работы?
Решение
Построение гистограммы
Разобьем выборку на к = 7 подгрупп, для чего проделаем следующие действия:
Экстремальные значения:
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin =4,2
Ширину каждого интервала берем одинаковой и равной δ.
Тогда длина интервала группирования
Разобьем интервал (13,1;17,3) на к=7 интервалов длины δ=0,6. Концы интервалов определяются по формулам:
a0=xmin=13,1; a7=xmax=17,3; ai=ai-1+δ;
i=1,2,…,7
Для каждого интервала (аі, аі+1) подсчитываем абсолютную частоту Nі, т.е. число элементов выборки, принадлежащих этому интервалу. При этом элементы выборки, совпадающие с правым концом интервала, будем также относить к этому интервалу, а элемент xmin - к интервалу (а0, а1). Если выборка содержит повторяющиеся элементы, то каждое такое значение нужно считать столько раз, сколько оно повторяется в выборке;
вычисляем относительные частоты hі = Nі /N;
строим прямоугольники, основания которых - интервалы (аі, аі+1) , а высоты пропорциональны соответствующим частотам Nі. Масштаб по вертикали выбираем из соображений наглядности.
Составим расчетную таблицу:
Номера интервалов группировки Интервалы группировки
Частоты
Относительные частоты
0000 0000 219710-17526000 366395-18478500
1 13,1 13,7 9 0,0938
2 13,7 14,3 10 0,1042
3 14,3 14,9 19 0,1979
4 14,9 15,5 18 0,1875
5 15,5 16,1 16 0,1667
6 16,1 16,7 21 0,2188
7 16,7 17,3 3 0,0313
N = 96 1.0000
2
. Оценки параметров
i Середины интервалов, Частота CiNi
(Ci-x)2Ni
Ci Ni
1 13,4 9 120,6 697,68
2 14,0 10 140 464,07
3 14,6 19 277,4 2388,80
4 15,2 18 273,6 3934,30
5 15,8 16 252,8 3277,56
6 16,4 21 344,4 2677,55
7 17,0 3 51 1210,96
Итого ΣNi= 96 1459,80 96,1163
Выборочное среднее значение
x=1Ni=1NciNi=1459,8096≈15,21
Выборочное среднее квадратическое отклонение:
s=1N-1i=1N(ci-x)2Ni1/2=96,116395≈1,06.
3.Проверим гипотезу о нормальности распределения, из которого получена данная выборка – Н0. Используем критерий хи-квадрат Пирсона.
Суть проверки гипотезы о том, что случайная величина распределена по нормальному закону, состоит в том, что сравниваются наблюдаемое значение статистики χ2набл и критическое χ2кр.
Вычисляем вспомогательные величины:
zi=ai-xs, i=1,…,k
Вычисляем рi, исходя из того, что гипотеза Н0 верна:
pi=Фzi-Фzi-1,
где Ф(z) – функция Лапласа.
Наблюдаемое значение статистики определяется по эмпирическим и теоретическим относительным частотам по формуле:
χнабл.2=Ni=1k(hi-pi)2pi
где hi - эмпирические, а pi - теоретические относительные частоты.
Заполним расчетную таблицу:
Интервалы Частота z1i z2i 2540-190500
31115-190500
pi hi 952513335000
(ai-1÷ai)
Ni
13,1 13,7 9 -2,09 -1,50 -0,5000 -0,4329 0,0671 0,09 0,0106
13,7 14,3 10 -1,50 -0,90 -0,4329 -0,3162 0,1167 0,10 0,0013
14,3 14,9 19 -0,90 -0,30 -0,3162 -0,1196 0,1966 0,20 0,0000
14,9 15,5 18 -0,30 0,29 -0,1196 0,1149 0,2345 0,19 0,0094
15,5 16,1 16 0,29 0,89 0,1149 0,3129 0,1980 0,17 0,0050
16,1 16,7 21 0,89 1,49 0,3129 0,4312 0,1184 0,22 0,0852
16,7 17,3 3 1,49 2,08 0,4312 0,5000 0,0688 0,03 0,0205
Сумма 96 1 1 0,1319
χнабл.2=96∙0,1319=12,66.
Из таблицы видно, что частота 7-го интервала равна 3, что меньше 5, поэтому нужно объединить 6-й и 7-й интервалы