В результате опыта получена выборочная совокупность.
60 71 62 57 81 55 59 47 75 56 61 60 63 65 59 61 65 58 76 49
65 64 59 76 58 52 70 77 67 50 65 53 56 64 55 77 51 61 73 64
45 53 45 58 57 60 48 71 33 65 50 80 58 67 71 51 51 49 66 63
67 60 67 61 58 36 75 47 68 63 77 75 62 75 70 75 66 53 63 60
68 67 55 75 71 59 77 58 65 57 55 28 74 71 47 73 40 45 37 66
По данной таблице составить интервальный вариационный ряд, разбив всю вариацию на 8-10 интервалов.
По сгруппированным данным построить:
а) полигон относительных частот;
б) гистограмму относительных частот;
в) график эмпирической функции распределения.
Найти числовые характеристики выборочной совокупности: выборочную среднюю XB, выборочную дисперсию DB, выборочное среднее квадратическое отклонение σB и исправленную дисперсию S2 .
По виду гистограммы и эмпирической функции распределения выборки выдвинуть гипотезу о распределении генеральной совокупности.
Проверить выполнение правила «трёх сигм».
Применив критерий согласия Пирсона χ2 с заданным уровнем значимости α=0,025, окончательно принять или отвергнуть выдвинутую гипотезу о распределении генеральной совокупности.
Найти доверительные интервалы для генеральной средней и генерального среднего квадратического отклонения по уровню надёжности γ=0,95.
Решение
По данной таблице составить интервальный вариационный ряд, разбив всю вариацию на 8-10 интервалов.
Разобьем всю вариацию объемом n=100 на k=10 частичных интервалов равной длины и посчитаем частоты попадания наблюдаемых значений в частичные интервалы.
Длину интервала находим по формуле
h=xmax-xmink=81-2810=5,3
Примем за длину интервала h=6.
За начало первого интервала примем x0=xmin -h2=28-62=25. Получим последовательность интервалов. Составим вариационный ряд частот и относительных частот.
i
интервал
xi-1;xi
середина интервала
xi*
частота
ni
относительная частота
wi=nin
1 [25; 31) 28 1 0,01
2 [31; 37) 34 2 0,02
3 [37; 43) 40 2 0,02
4 [43; 49) 46 7 0,07
5 [49; 55) 52 11 0,11
6 [55; 61) 58 24 0,24
7 [61; 67) 64 22 0,22
8 [67; 73) 70 14 0,14
9 [73; 79) 76 15 0,15
10 [79; 85] 82 2 0,02
Σ - - 100 1
Отметим, что i=110ni=n=100 – объем выборки, i=110wi= i=110nin=nn=1.
Статистическое распределение выборки является оценкой неизвестного распределения. В частности. относительные частоты wi являются статистическими аналогами вероятностей полной группы несовместных событий.
По сгруппированным данным построить:
а) полигон относительных частот
Полигон относительных частот вариационного ряда – ломанная линия, соединяющая точки xi*;wi.
Полигон относительных частот является статистическим аналогом многоугольника распределения дискретной случайной величины X.
б) гистограмму относительных частот
Гистограмма относительных частот имеет ступенчатый вид. На каждом частичном интервале строим прямоугольник высотой wih.
Гистограмма относительных частот является статистическим аналогом дифференциальной функции распределения (плотности) fx непрерывной случайной величины X.
в) график эмпирической функции распределения.
График эмпирической функции распределения F*x=xi<xnin непрерывной случайной величины X совпадает с кумулятой (график накопленных частот).
Отметим на плоскости точки, соответствующие значениям функции F*x на концах интервалов, и соединим их отрезками.
x
x≤ 25
31 37 43 49 55 61 67 73 79 x≥ 85
F*x
0 0,01 0,03 0,05 0,12 0,23 0,47 0,69 0,83 0,98 1
Эмпирическая функция распределения F*x является статистическим аналогом интегральной функции распределения Fx случайной величины X.
Найти числовые характеристики выборочной совокупности: выборочную среднюю XB, выборочную дисперсию DB, выборочное среднее квадратическое отклонение σB и исправленную дисперсию S2 .
Для нахождения выборочной средней xв, выборочной дисперсии Dв, выборочного среднего квадратического отклонения σв заполним вспомогательную таблицу.
i
xi*
ni
wi
xi*wi
xi*2wi
1 28 1 0,01 0,28 7,84
2 34 2 0,02 0,68 23,12
3 40 2 0,02 0,8 32
4 46 7 0,07 3,22 148,12
5 52 11 0,11 5,72 297,44
6 58 24 0,24 13,92 807,36
7 64 22 0,22 14,08 901,12
8 70 14 0,14 9,8 686
9 76 15 0,15 11,4 866,4
10 82 2 0,02 1,64 134,48
Σ - 100 1 61,54 3903,88
Выборочное среднее
xв=i=110xi*wi=61,54
Выборочная дисперсия
Dв=i=110xi*2wi-xв2=3903,88-61,542≈116,71
Выборочное среднее квадратическое отклонение
σв=Dв=116,71≈10,8
Исправленная выборочная дисперсия
s2=nn-1Dв=10099∙116,71≈117,89
Исправленная выборочное среднее квадратическое отклонение
s=s2=117,89≈10,86
По виду гистограммы и эмпирической функции распределения выборки выдвинуть гипотезу о распределении генеральной совокупности.
Точечной оценкой математического ожидания a является средняя выборочная xв, тогда a=xв=61,54
. Точечной оценкой генерального среднего квадратического отклонения σ является исправленное выборочное среднее квадратическое отклонение, то есть σ=s=10,86.
Вид гистограммы относительных частот напоминает график плотности функции fx=1σ2π∙e-x-a22∙σ2 нормального распределения непрерывной случайной величины X.
Вид эмпирической функции распределения F*x напоминает интегральную функцию Fx=12+Фx-aσ нормального распределения.
По виду гистограммы и функции F*x выдвигаем основную (нулевую) гипотезу H0: «генеральная совокупность распределена по нормальному закону с параметрами a=61,54, σ=10,86» и альтернативную гипотезу H1: «генеральная совокупность не распределена по нормальному закону».
Проверить выполнение правила «трёх сигм».
Проверим выполнение правил «трех сигм»:
PX-a≤3σ=0,9973
которое требует, чтобы практически достоверно значения случайной величины, распределенной по нормальному закону, попадали на отрезок a-3σ;a+3σ.
В нашем случае a-3σ=61,54-3∙10,86=28,96; a+3σ=61,54+3∙10,86=94,12, отсюда получаем, что найденный промежуток 28,96;94,12 практически полностью накрыл наши статистические значения 25;85.
Так как условие правила «трех сигма» выполняется, то есть основание предполагать, что изучаемое распределение является нормальным.
Применив критерий согласия Пирсона χ2 с заданным уровнем значимости α=0,025, окончательно принять или отвергнуть выдвинутую гипотезу о распределении генеральной совокупности.
Проверим соответствие гипотезы H0 опытным данным.
Для этого необходимо вычислить теоретические вероятности pi и выравнивающие частоты ni'=npi.
Необходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений (то есть ni≥5)