При наблюдении за признаком X получены 50 значений. При помощи табличного процессора Excel систематизировать выборку по разрядам и выполнить её статистическую обработку: построить гистограмму, вычислить числовые характеристики xВ, DВ, σВ , Mo,
Me, A, E. Найти несмещённые точечные оценки генеральной средней и СКО генеральной совокупности, доверительные интервалы для M(X) и σ при γ=0,95. По виду гистограммы выдвинуть гипотезу о виде распределения и проверить её с помощью критерия Пирсона при уровне значимости α=0,05.
373 367 370 337 385 301 377 299 377 338
350 359 360 337 360 348 381 363 344 344
373 363 330 342 340 379 319 352 341 341
360 351 348 343 334 329 367 332 347 360
381 349 350 348 323 356 362 318 348 337
Решение
Нам дана выборка объёмом n=50. Найдём минимальное и максимальное числа в ней: минимум равен 299 , максимум равен 385. Тогда размах выборки R=385-299=86.
Количество интервалов разбиения вычислим по формуле Старджесса:
k=3,3∙lgn+1≈7
Ввиду того, что нам дано количество интервалов разбиения, то шаг разбиения
h=Rk=867≈13
Теперь разобьём выборку на девять интервалов с заданным шагом и посчитаем количество чисел, попадающих в каждый интервал. Результат оформим в виде вариационного интервального ряда:
Тут относительные частоты находятся как частное абсолютных частот и объёма выборки по формуле:
mi=nin
Построим полигон абсолютных частот, откладывая по оси абсцисс наши интервалы (беря их середины), а по оси ординат – абсолютные частоты:
Полигон относительных частот строится аналогично полигону абсолютных частот, только по оси OY отмечаются уже не абсолютные частоты, а относительные частоты:
Построим гистограмму относительных частот, откладывая по оси абсцисс интервалы, а по оси ординат – относительные частоты. Также отметим, что здесь числами отмечены все порядковые номера идущих подряд номеров интервалов из предыдущей таблицы.
Вычислим числовые характеристики выборки (все расчёты ведутся в Excel):
-среднее (ищем сумму произведений середин интервалов на абсолютные частоты); здесь несмещённая оценка генерального среднего совпадает с далее вычисленным средним:
x=1ni=1nxini=349,7
-выборочную дисперсию (как сумму произведений разниц середин интервалов и среднего на абсолютные частоты):
DВ=1ni=1nxi-x2ni=122,046
-исправленную дисперсию:
Dисп=nn-1DВ=5049∙122,046=124,536
-выборочное среднее квадратическое отклонение:
σВ=DВ=122,046≈11,047
-исправленное среднее квадратическое отклонение (несмещённая оценка):
σисп=Dисп=124,536≈11,16
С помощью функций Excel находим моду Mo и медиану Me выборки:
Коэффициент асимметрии и эксцесса вычисляются по формулам:
A= m3σВ3, m3=1ni=1nxi-x3ni
E= μ4σВ4-3, m4=1ni=1nxi-x4ni
Имеем:
A= -2636411,0473≈-19,554
Так как коэффициент асимметрии по модулю больше 0,5 , то асимметрия существенна.
E= μ4σВ4-3=20063531, 2811,0473-3=1343,977
Так как коэффициент эксцесса больше нуля, то эмпирическое распределение является более высоким (то есть «островершинным») относительно эталонного нормального распределения с параметрами a=x, σ=σВ