Сгруппировать эти данные в интервальную таблицу, подобрав длину интервала.
2. Построить гистограмму, полигон частот и эмпирическую функцию распределения.
3. Найти несмещённые оценки для математического ожидания и дисперсии случайной величины Х. Указать моду М0.
4. По критерию χ2 (Пирсона) проверить гипотезу о том, что случайная величина Х имеет нормальный закон распределения.
5. Найти интервальные оценки математического ожидания и дисперсии случайной величины Х с уровнем доверия γ=0.9.
4,7 7,2 6,2 6,7 7,2 5,7 7,7 8,2 6,2 7,2
5,7 6,2 5,7 8,2 5,7 6,2 5,7 6,2 6,7 5,2
6,7 5,2 7,7 6,2 7,2 6,7 7,7 6,2 7,2 6,2
6,2 5,7 6,2 6,7 7,2 5,7 6,7 7,7 6,2 5,7
8,7 4,7 6,7 8,7 6,2 6,7 5,2 4,7 8,7 8,2
Решение
Составим интервальное выборочное распределение (интервальный вариационный ряд). Для этого, прежде всего, отметим, что у нас xmin =4.7 , xmax =8.7, а размах выборочных значений
R =xmax-xmin=8.7-4.7=4
Теперь определим длину каждого частичного интервала (иногда их называют классовыми интервалами), воспользовавшись формулой Стерджеса:
l=R1+3.322lnn
где n – объем выборки. В нашем случае
l=41+3.322ln50≈0.6
Далее устанавливаем границы частичных интервалов: левую границу первого интервала принимаем равной x0=xmin=4.7, далее x1=x0+l=4.7+0.6=5.3;x2=5.9;x3=6.5; x4=7.1;x5=7.7;x6=8.3;x7=8.9
На этом указанная процедура заканчивается, т.к. последующие частичные интервалы не будут содержать выборочных значений признака.
Приступаем к распределению по частичным интервалам выборочных значений признака, ставя в соответствие интервалу с номером i частоту ni как число выборочных значений признака, попавших в интервал. При этом договоримся, что если некоторое из выборочных значений совпадет с границей двух соседних интервалов, то будем относить его к предыдущему из них. В итоге реализации данных рекомендаций получим таблицу 2, в первых двух столбцах которой разместим искомое интервальное распределение выборки, в третьем − относительные частоты wi=nin, а в последнем четвертом − плотности распределения относительных частот на частичных интервалах:
pi =wil
Таблица 2
xi-1;xi
Середина интервалов ni
wi
j=1imin
pi
(4,7; 5,3) 5 6 0,12 0,12 0,2
(5,3; 5,9) 5,6 8 0,16 0,28 0,2667
(5,9; 6,5) 6,2 12 0,24 0,52 0,4
(6,5; 7,1) 6,8 8 0,16 0,68 0,2667
(7,1; 7,7) 7,4 10 0,2 0,88 0,3333
(7,7; 8,3) 8 3 0,06 0,94 0,1
(8,3; 8,9) 8,6 3 0,06 1 0,1
Σ
50 1
Эмпирическая функция распределения Fn*x определяется по значениям накопленных относительных частот, которые расположены в шестой строке таблицы 1. Эта функция имеет скачки в точках xi* – серединах интервалов группированного статистического ряда.
Аналитическое выражение эмпирической функции распределения имеет вид:
Fn*x=0, x≤50.12, 5<x≤5.60.28, 5.6<x≤6.20.52, 6.2<x≤6.80.68, 6.8<x≤7.40.88, 7.4<x≤80.94, 8<x≤8.61, x>8.6
График эмпирической функции распределения Fn*x изображен на рис
. 1.
Построим гистограмму относительных частот, для этого на каждом интервале группированной выборки строим столбики, высоты которых вычислены в таблице 1. График гистограммы изображен на рис. 2.
Построим полигон:
Важнейшими числовыми характеристиками признака X являются, как известно, математическое ожидание, дисперсия и среднее квадратичное отклонение (с.к.o.). Точечными статистическими оценками этих параметров служат соответственно выборочное среднее x, выборочная дисперсия (Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего)), σx2=σn2 и исправленная выборочная дисперсия (Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия)), σn-12=s2, выборочное с.к.o.
σx=σn и исправленное выборочное с.к.o. σn-1=s , которые вычисляются по формулам:
x=1n*i=1kxini
σx2=1n*i=1kxi-x2ni
или
σx2=x2-x2
x2=1n*i=1kxi2ni
s2=nn-1*σx2
σx=σx2;s=s2
где xi- выборочные значения (варианты) признака X, ni- частоты этих значений, n – объем выборки.
Составим расчетную таблицу:
Таблица 2
xi-1;xi
Середина интервалов ni
xini
xi-x2ni
(4,7; 5,3) 5 6 30 14,38
(5,3; 5,9) 5,6 8 44,8 7,19
(5,9; 6,5) 6,2 12 74,4 1,45
(6,5; 7,1) 6,8 8 54,4 0,51
(7,1; 7,7) 7,4 10 74 7,26
(7,7; 8,3) 8 3 24 6,32
(8,3; 8,9) 8,6 3 25,8 12,63
Σ
50 327,4 49,74
Выборочное среднее находим по формуле:
x=1ni=1kxi*mi
в нашем случае
x=327.450=6.548
Исправленную выборочную дисперсию находим по формуле:
S2=1ni=1kxi*-x2mi
в нашем случае
S2=49.7450=0.995
s=S2=0.995≈0.997
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
MO=x0+h*n2-n1n2-n1+n2-n3где x0 – начало модального интервала;
h – величина интервала;
n2 – частота, соответствующая модальному интервалу;
n1 – предмодальная частота;
n3 – послемодальная частота.
Выбираем в качестве начала интервала 5.9, так как именно на этот интервал приходится наибольшее количество.
MO=5.9+0.6*12-812-8+12-8=6.2
Наиболее часто встречающееся значение ряда – 6.2.
Пусть в результате n наблюдений признака X получен вариационный ряд.
Анализ выборки (например, по виду гистограммы частот - если в нашем примере через верхние основания прямоугольников гистограммы провести плавную линию, то она будет иметь колоколообразную форму, т.е