Из генеральной совокупности извлечена выборка. Данные наблюдений сведены в группы и представлены в виде дискретного ряда, где первая строка – середины частичных интервалов xi, вторая строка – соответствующие им частоты ni. Требуется провести статистическую обработку экспериментальных данных по следующей схеме:
1) Построить выборочную (эмпирическую) функцию распределения Fx
2) Построить полигон и гистограмму относительных частот.
3) Найти числовые характеристики выборки: выборочную среднюю xB, выборочное среднее квадратическое отклонение σB, исправленное среднее квадратическое отклонение s.
4) Сделать предварительный выбор закона распределения по виду гистограммы и полигона относительных частот.
5) Проверить с помощью критерия согласия Пирсона гипотезу о нормальном законе распределения генеральной совокупности при уровне значимости α=0.05.
6) В случае принятия гипотезы найти интервальные оценки параметров нормального распределения (доверительную вероятность принять равной γ=1-α=0.95).
Вычисления проводить с точностью до 0,001.
xi
-2 1 4 7 10 13 16 19
ni
2 7 14 20 25 18 11 3
Решение
Построить выборочную (эмпирическую) функцию распределения F*x.
Для точечного распределения выборки может быть получена эмпирическая функция распределения F*x, которая является статистической оценкой функции распределения вероятностей признака X (интегрального закона распределения) и строится по формуле:
F*x=nxn
где n − объем выборки, а nx − сумма частот выборочных значений признака, которые меньше x.
В нашей задаче, очевидно,
xi
-2 1 4 7 10 13 16 19 ∑
ni
2 7 14 20 25 18 11 3 100
nxn
0,02 0,07 0,14 0,2 0,25 0,18 0,11 0,03 1
Накопленные частоты 0,02 0,09 0,23 0,43 0,68 0,86 0,97 1
F*x=0 при x≤-2, 0.02 при-2<x≤1,0.09 при 1<x≤4,0.23 при 4<x≤7,0.43 при 7<x≤10,0.68 при 10<x≤13,0.86 при 13<x≤16,0.97 при 16<x≤19,1 при x>19
2) Построить полигон и гистограмму относительных частот
Распределение непрерывной случайной величины принято графически представлять кривой распределения, которая является графиком ее плотности вероятностей (дифференциальной функции распределения). В статистике одной из оценок кривой распределения является гистограмма относительных частот.
Это ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы, а высотами являются частот pi на частичных интервалах.
может быть построен полигон относительных частот, который является, как и гистограмма относительных частот, статистической оценкой кривой распределения признака
. Это ломаная линия, вершины которой находятся в точках xi;ni:
Полигон относительных частот
3) Найти числовые характеристики выборки: выборочную среднюю xB, выборочное среднее квадратическое отклонение σB, исправленное среднее квадратическое отклонение S.
Важнейшими числовыми характеристиками признака X являются, как известно, математическое ожидание, дисперсия и среднее квадратичное отклонение (с.к.o.). Точечными статистическими оценками этих параметров служат соответственно выборочное среднее x, выборочная дисперсия σx2=σn2 и исправленная выборочная дисперсия σn-12=s2, выборочное с.к.o.
σx=σn и исправленное выборочное с.к.o. σn-1=s , которые вычисляются по формулам:
x=1n*i=1kxini
DX=1n*i=1kxi-x2ni
или
DX=x2-x2
x2=1n*i=1kxi2ni
где xi- выборочные значения (варианты) признака X, ni- частоты этих значений, n – объем выборки.
По приведенным выше формулам вычислим точечные статистические оценки генеральных параметров распределения признака X , используя при этом данные из таблицы:
1) Находим выборочное среднее:
xi
-2 1 4 7 10 13 16 19
ni
2 7 14 20 25 18 11 3
x=1ni=1kxini=1100-2*2+1*7+4*14+7*20+10*25+13*18+16*11+19*3=22925=9.16
2) Находим выборочную дисперсию, используя универсальную формулу ее вычисления σx2=x2-x2. Имеем:
x2=1ni=1kxi2ni=1100-22*2+12*7+42*14+72*20+102*25+132*18+162*11+192*3=5335=106.6
σx2=x2-x2=106.6-9.162=22.6944
3) Находим исправленную выборочную дисперсию:
s2=nn-1*σx2=100100-1*22.6944≈22.9236
4) Находим выборочное с.к.о