Дана выборка
10 2 5 7 5 10 3 9 7 5
4 6 5 2 2 7 5 7 7 8
3 9 6 5 10 7 6 6 7 3
4 5 6 7 9 8 9 8 4 7
9 3 1 3 10 6 7 4 4 8
3 5 6 5 4 8 3 6 6 1
9 6 7 7 3 2 4 6 4 7
4 9 10 4 3 4 6 11 5 5
2 5 7 6 8 1 6 2 8 -1
9 8 7 6 4 5 9 3 4 8
1. Провести группировку данных. число интервалов k вычислить по формуле k=310*n, где n – объем выборки. Записать группированный статистический ряд распределения выборки.
2. Построить гистограмму относительных частот и выдвинуть гипотезу о законе распределения изучаемого признака Х.
3. Провести проверку нулевой гипотезы, используя χ2 - критерий Пирсона при уровне значимости α=0.05. После принятия гипотезы построить график плотности распределения.
Решение
1. Определение числа групп.
k=310*n=310*100=10
Ширина интервала составит:
h=xmax-xminkh=11--110=65=1.2
xmax - максимальное значение группировочного признака в совокупности.
xmin - минимальное значение группировочного признака.
составим расчетную таблицу при и .
Положим c =4.4+5.62=5 (одно из средних наблюдаемых значений), h=1.2 и составим расчетную таблицу
i
Интервал
xi;xi+1
Середина интервала
xi
Эмпирические частоты
ni,
Относительные частоты, wi=nin
ui=xi-ch
ui*ni
ui2*ni
1 [-1;0,2] -0,4 1 0,01 -4,5 -4,5 20,25
2 [0,2;1,4] 0,8 3 0,03 -3,5 -10,5 36,75
3 [1,4;2,6] 2 6 0,06 -2,5 -15 37,5
4 [2,6;3,8] 3,2 10 0,1 -1,5 -15 22,5
5 [3,8;5] 4,4 26 0,26 -0,5 -13 6,5
6 [5;6,2] 5,6 15 0,15 0,5 7,5 3,75
7 [6,2;7,4] 6,8 15 0,15 1,5 22,5 33,75
8 [7,4;8,6] 8 9 0,09 2,5 22,5 56,25
9 [8,6;9,8] 9,2 9 0,09 3,5 31,5 110,25
10 [9,8;11] 10,4 6 0,06 4,5 27 121,5
∑ 100 1 53 449
Тогда выборочная средняя
xB=uinin*h+c=53100*1.2+5=5.636
Выборочная дисперсия
σB2=ui2nin*h2-xB-c2=449100*1.22-5.636-52≈6.06
Таким образом, a=xB=5.636; σ2=σB2=6.06.
Тогда
σ=σB2=6.06≈2.46
2) Построим гистограмму относительных частот:
По виду гистограммы можно предположить, что исследуемая величина имеет нормальный закон распределения.
3) Пусть непрерывная случайная величина (признак) X представлена выборкой значений в виде интервального распределения, причем известны выборочное среднее x и выборочное с.к.о
. σ.
Пусть имеются основания предполагать, что случайная величина X подчинена нормальному закону распределения (например, из визуального соответствия гистограммы и нормальной кривой).
Проверка этой гипотезы при уровне значимости с помощью критерия Пирсона осуществляется по следующей схеме.
Нужно проанализировать интервальное распределение выборки, объем которой должен быть не менее 50, и в случае, если какому-нибудь частичному интервалу выборочных значений соответствует эмпирическая частота ni, которая меньше, чем 5, этот интервал следует объединить с соседним (соседними), поставив в соответствие новому интервалу сумму эмпирических частот объединенных интервалов. Так как нормальное распределение определено для всех действительных значений x, то принято левую границу первого частичного интервала расширить до -∞, а правую границу последнего до +∞. По окончании описанной процедуры будем обозначать число частичных интервалов через m.
В предположении, что исследуемая случайная величина X действительно распределена нормально с параметрами x и σ X~Nx, σ, нужно вычислить вероятности Pi попадания ее значений в каждый из m частичных интервалов по формуле:
Pi=Pxi-1<X<xi=Фxi-xσ-Фxi-1-xσ;i=1, …, m
где x0 и xm заменены соответственно на -∞ и+∞, а значения функции Лапласа можно найти в таблицах