Провести исследование генеральной совокупности, используя выборочные данные соответствующего варианта.
1) Построить статистическое распределение выборки и гистограмму частот (шаг h=7)
2) Дать точечные оценки генеральному среднему и дисперсии.
3) Предполагая, что выборка сделана из нормальной совокупности, построить доверительные интервалы для математического ожидания и дисперсии нормального распределения, приняв доверительную вероятность γ=0,95.
4) При уровне значимости α=0,01 проверить гипотезу о нормальности генеральной совокупности, используя критерий согласия Пирсона.
Выборка объёма N=237, начало первого интервала a=285.
324 296 313 323 312 321 322 301 337 322 329 307
301 328 312 318 327 315 319 317 309 334 323 340
326 322 314 335 313 322 319 325 312 300 323 335
339 326 298 298 337 322 303 314 315 310 316 321
312 315 331 322 321 336 328 315 338 318 327 323
325 314 297 303 322 314 317 330 318 320 312 333
332 319 325 319 307 305 316 330 318 335 327 321
332 288 322 334 295 318 329 305 310 304 326 319
317 316 316 307 309 309 328 317 317 322 316 304
303 350 309 327 345 329 338 311 316 324 310 306
308 302 315 314 343 320 304 310 345 312 330 324
308 326 313 320 328 309 306 306 308 324 312 309
324 321 313 330 330 315 320 313 302 295 337 346
327 320 307 305 323 331 345 315 318 331 322 315
304 324 317 322 312 314 308 303 333 321 312 323
317 288 317 327 292 316 322 319 313 328 313 309
329 313 334 314 320 301 329 319 332 316 300 300
304 306 314 323 318 337 325 321 322 288 313 314
307 329 302 300 316 321 315 323 331 318 334 316
328 294 288 312 312 315 321 332 319
Решение
Xmin=288, xmax=350, n=237 h=7
Разобьем выборку на 10 интервалов, приняв за начало первого интервала xmin=285
[xi;xi+1)
[285;292)
[292;299)
[299;306)
[306;313)
[313;320)
[320;327)
[327;334)
[334;341)
[341;348)
[348;355)
ni
4 8 22 36 62 50 33 16 5 1
nin
0,017 0,034
0,093 0,152 0,262 0,211 0,139 0,067 0,021 0,004
Приняв в качестве новых вариант yi серединные значения частичных интервалов, построим распределение равноотстоящих вариант для вычисления точечных оценок генеральной средней и дисперсии методом произведений
yi
288,5
295,5
302,5
309,5
316,5
323,5
330,5
337,5
344,5
351,5
ni
4 8 22 36 62 50 33 16 5 1
Выберем C=12y1+y10=288,5+351,52=320
ui=(yi-C)h M1*=niuin M2*=niui2n
yв=M1*h+C Dв=(M2*-M1*2)h2
Составим расчетную таблицу:
yi
ni
ui
niui
niui2
288,5 4 -4,5 -18 81
295,5 8 -3,5 -28 98
302,5 22 -2,5 -55 137,5
309,5 36 -1,5 -54 81
316,5 62 -0,5 -31 15,5
323,5 50 0,5 25 12,5
330,5 33 1,5 49,5 74,25
337,5 16 2,5 40 100
344,5 5 3,5 17,5 61,25
351,5 1 4,5 4,5 20,25
237 0 -49,5 681,25
M1*=-49,5237≈-0,21 M2*=681,25237≈2,87
yв=-0,21∙7+320=318,53
Dв=(2,87-(-0,21)2)∙49≈138,47 σВ=Dв=11,77
Для получения интервальной оценки математического ожидания a нормально распределённой случайной величины по выборочной средней xВ и неизвестной дисперсии используем формулу:
xВ-tγ∙Sn<a<xВ+tγ∙Sn
S2=nn-1∙Dв=237236∙138,47=139,05 => S=11,79
tγ=1,984
tγ∙Sn=1,984∙11,89237=1,53
318,53-1,53<a<318,53+1,53
317<a<320,06
доверительный интервал для дисперсии можно записать в виде:
(n-1)S2u2<σ2<(n-1)S2u1
α2=1-0,952=0,025 α1=1+0,952=0,975 k=237-1=236
Так как в нашем случае k>30 используем равенство Уилсона-Гильферти для нахождения u2 и u1:
1-2α12=0,5-0,975=-0,475 Фzα1=-0,475 => zα1=-1,96
1-2α22=0,5-0,025=0,475 Фzα2=0,475 => zα2=1,96
u1=236∙1-29∙236-1,96∙29∙2363=195,34
u2=236∙1-29∙236+1,96∙29∙2363=280,45
236∙139,05280,45<σ2<236∙139,05195,34
117<σ2<168
Считаем, что эмпирическое распределение задано в виде последовательности интервалов и соответствующих им частот:
[xi;xi+1)
[285;292)
[292;299)
[299;306)
[306;313)
[313;320)
[320;327)
[327;334)
[334;341)
[341;348)
[348;355)
ni
4 8 22 36 62 50 33 16 5 1
Объединим интервалы с количеством частот меньше пяти:
[xi;xi+1)
[285;299)
[299;306)
[306;313)
[313;320)
[320;327)
[327;334)
[334;341)
[341;355)
ni
12 22 36 62 50 33 16 6
Перейдем к новой случайной величине:
zi=xi-xВσВ, z1=-∞ z9=∞
z2=299-318,5311,77=-1,66
z3=306-318,5311,77=-1,06
z4=313-318,5311,77=-0,47
z5=320-318,5311,77=0,12
z6=327-318,5311,77=0,72
z7=334-318,5311,77=1,31
z8=341-318,5311,77=1,91
Найдём теоретические вероятности попадания случайной величины в интервал
Найдем теоретические частоты:
ni'=nPi
P1=Ф-1,66-Ф-∞=-0,4515+0,5=0,0485 n1'=237∙0,0485=11,49
P2=Ф-1,06-Ф-1,66=-0,3554+0,4515=0,0961 n2'=237∙0,0961=22,78
P3=Ф-0,47-Ф-1,06=-0,1808+0,3554=0,1746 n3'=237∙0,1746=41,38
P4=Ф0,12-Ф-0,47=0,0478+0,1808=0,2286 n4'=237∙0,2286=54,18
P5=Ф0,72-Ф0,12=0,2642-0,0478=0,2164 n5'=237∙0,2164=51,29
P6=Ф1,31-Ф0,72=0,4049-0,2642=0,1407 n6'=237∙0,1407=33,35
P7=Ф1,91-Ф1,31=0,4719-0,4049=0,067 n7'=237∙0,067=15,88
P8=Ф∞-Ф1,91=0,5-0,4719=0,0281 n8'=237∙0,0281=6,66
Посчитаем статистику по формуле:
χнабл2=i=18(ni-ni')2ni'=1,98
По таблице критических точек распределения χ2, по заданному уровню значимости α=0,01 и числу степеней свободы k=8-3=5, находим критическую точку правосторонней критической области:
χкрит2=15,08
Так как χнабл2<χкрит2 , то гипотеза о нормальном распределении случайной величины принимается.