В результате опыта была получена выборочная совокупность.
42 40 35 29 58 46 39 46 45 38 53 31 39 53 50 21 57 25 30 47
23 56 42 39 46 45 45 47 25 48 56 22 40 41 41 33 45 34 43 37
29 41 36 31 35 63 56 42 40 48 39 33 39 20 37 34 33 38 40 61
45 45 43 39 26 14 36 55 48 34 43 44 37 37 31 58 39 47 56 41
57 31 27 46 42 43 47 44 46 37 34 45 30 46 37 33 28 56 42 29
1. По данной таблице составить интервальный вариационный ряд, разбив всю вариацию на 8-10 интервалов.
2. По сгруппированным данным построить:
а) полигон относительных частот;
б) гистограмму относительных частот;
в) график эмпирической функции распределения.
3. Найти числовые характеристики выборки: М0*, Ме*, xв, σв, s, V*, as*,εk*.
4. Построить:
а) на чертеже гистограммы её теоретический аналог f (x) ;
б) на чертеже эмпирической функции F*(x) её теоретический аналог F(x);
5. По виду гистограммы и эмпирической функции распределения выборки выдвинуть гипотезу о распределении генеральной совокупности.
6. Проверить выполнение правила «трёх сигм».
7. Применив критерий согласия Пирсона χ2 с заданным уровнем значимости α=0,01, окончательно принять или отвергнуть выдвинутую гипотезу о распределении генеральной совокупности.
8. Построить на одном чертеже:
а) полигон относительных частот pi* и кривую распределения pi;
б) гистограмму теоретических вероятностей (относительных частот) pi и f (x) . Сравнить график pi с графиком идеально нормального распределения, используя значения as*,εk*.
9. Найти доверительные интервалы для генеральной средней и генерального среднего квадратического отклонения по уровню надёжности γ=0,99 .
Решение
Составим интервальный вариационный ряд
Разобьем всю вариацию объемом n=100 на k=10 частичных интервалов равной длины и посчитаем частоты попадания наблюдаемых значений в частичный интервалы.
Так как xmax=63, xmin=14, то найдем длину частичного интервала:
h=xmax-xmink=63-1410=4,9≈5
Примем начало первого интервала
x0=xmin-h2=14-52≈13
Исходные данные разбиваем на 10 интервалов: 13;18, (18;23], (23;28], (28;33], (33;38], (38;43], (43;48], (48;53], (53;58],(58;63].
Посчитав частоты mi, попавших из полученных промежутков, получим интервальный вариационный ряд.
Составим вариационный ряд частот и относительных частот:
i
Интервал
(xi-1;xi]
Середина интервала xi=xi-1+xi2
Частота mi
Частость pi*=min
1 13;18
15,5 1 0,01
2 (18;23] 20,5 3 0,03
3 (23;28]
25,5 5 0,05
4 (28;33]
30,5 10 0,1
5 (33;38], 35,5 18 0,18
6 (38;43]
40,5 22 0,22
7 (43;48]
45,5 23 0,23
8 (48;53]
50,5 4 0,04
9 (53;58]
55,5 10 0,1
10 (58;63]
60,5 4 0,04
∑
100 1
Статистическое распределение выборки является оценкой неизвестного распределения. В частности, относительные частоты pi* являются статистическими аналогами вероятностей полной группы несовместных событий.
2. Вторым этапом обработки статистических данных является построение полигона, гистограммы относительных частот и эмпирической функции распределения.
а) Полигон относительных частот вариационного ряда – ломаная линия, соединяющая точки xi,pi*. График полигона представлен на рис. 1.
Рис. 1 Полигон относительных частот
Полигон относительных частот является статистическим аналогом многоугольника распределения дискретной случайной величины Х.
б) Гистограмма относительных частот изображается только для интервального ряда и имеет вид ступенчатой фигуры (рис. 2). На каждом частичном интервале строим прямоугольник высотой fi*=pi*h
Рис. 2 Гистограмма относительных частот
Гистограмма относительных частот является статистическим аналогом дифференциальной функции распределения (плотности) f(x) непрерывной случайной величины Х.
в) Для интервального вариационного ряда эмпирическая функция распределения совпадает с кумулятой. Значение F*(x) найдем по формуле:
F*x=xi<xmin
Отметим на плоскости точки, соответствующие значениям функции F*x на концах интервалов, и соединим их отрезками прямых (рис.3)
x
x≤13
18 23 28 33 38 43 48 53 58 x≥63
F*x
0 0,01 0,04 0,09 0,19 0,37 0,59 0,82 0,86 0,96 1
Рис.3 Эмпирическая функция распределения
3. Найдем числовые характеристики выборки:
Мода М0* находится внутри интервала, для которого соответствующая частота максимальна. В нашем случае М0*∈(43;48], при этом p7*=0,23.
Моду вычислим по формуле
М0*=xi-1+hi∙pi*-pi-1*pi*-pi-1*+pi*-pi+1*
где hi=5, pi-1*=0,22 и pi*=0,23, pi+1*=0,04, xi-1=43
Подставляем в формулу, получаем
М0*=43+5∙0,23-0,220,23-0,22+0,23-0,04=43
Медиана Ме* интервального вариационного ряда принадлежит тому частотному интервалу, для которого накопленная частота составляет половину или больше половины всей суммы частот, а предыдущая накопленная частота меньше половины всей суммы частот
. Геометрически прямая x=Ме* делит площадь гистограммы пополам. Медиана может быть приближённо найдена на чертеже графика F*x (рис. 3), как значение признака, для которого F*Ме*=0,5. Для данного вариационного ряда значение (38; 43]
Медиану найдем по формуле
Ме*=xi-1+hipi*∙0,5-j=1i-1hjpj*
По условию нашей задачи xi-1=38, hi=5, pi*=0,22,
j=1i-1hjpj*=0,01+0,03+0,05+0,1+0,18=0,37
Подставляем в формулу
Ме*=38+50,22∙0,5-0,37=41
Для нахождения выборочной средней xв, выборочной дисперсии Dв , выборочного среднего квадратического отклонения σв (статистические аналоги соответствующих числовых характеристик случайной величины) заполним вспомогательную таблицу.
i
xi
mi
pi*
xipi*
xi2pi*
1 15,5 1 0,01 0,16 2,4
2 20,5 3 0,03 0,62 12,6
3 25,5 5 0,05 1,28 32,5
4 30,5 10 0,1 3,05 93,0
5 35,5 18 0,18 6,39 226,8
6 40,5 22 0,22 8,91 360,9
7 45,5 23 0,23 10,47 476,2
8 50,5 4 0,04 2,02 102,0
9 55,5 10 0,1 5,55 308,0
10 60,5 4 0,04 2,42 146,4
∑
100
40,85 1760,9
Находим выборочное среднее:
xв=M*X=i=110xipi*=40,85
Находим выборочную дисперсию:
Dв=i=110xi2pi*-xв2=1760,9-40,852=92,18
Найдем среднее квадратическое отклонение
σв=Dв=92,18≈9,60
Найдем исправленное среднее квадратическое отклонение
s=nn-1∙Dв=100100-1∙92,18≈9,65
Так как число наблюдений n = 100 достаточно велико, то вместо s можно использовать неисправленную выборочную дисперсию σв .
Вычислим коэффициент вариации
V*=σвxв∙100%=9,640,85∙100%≈23,5%
Поскольку V*≤30%, то совокупность однородная, а вариация слабая.
Для вычисления коэффициента ассиметрии и эксцесса составим расчетную таблицу
i
xi
pi*
xi-xв
xi-xв3pi*
xi-xв4pi*
1 15,5 0,01 -25,35 -162,905 4129,637
2 20,5 0,03 -20,35 -252,822 5144,923
3 25,5 0,05 -15,35 -180,84 2775,898
4 30,5 0,1 -10,35 -110,872 1147,523
5 35,5 0,18 -5,35 -27,5635 147,4646
6 40,5 0,22 -0,35 -0,00943 0,003301
7 45,5 0,23 4,65 23,12526 107,5325
8 50,5 0,04 9,65 35,94529 346,872
9 55,5 0,1 14,65 314,422 4606,282
10 60,5 0,04 19,65 303,4923 5963,623
∑
-28,5 -58,03 24369,76
Выборочный центральный момент 3-го порядка вычислим по формуле:
μ3*=i=110xi-xв3∙pi*=-58,03
Находим выборочный коэффициент ассиметрии:
as*=μ3*σв3=-58,039,63≈-0,066
Так как as*<0 свидетельствует о левосторонней ассиметрии.
Выборочный центральный момент 4-го порядка вычислим по формуле:
μ4*=i=110xi-xв4∙pi*=24369,76
Находим выборочный коэффициент эксцесса:
εk*=μ4*σв4-3=24369,769,64-3≈2,869-3=-0,131
Поскольку εk*<0, то полосковершинное распеделение.
4. Точечной оценкой математического ожидания a является средняя выборочная xв, тогда полагаем xв=а=40,85; точечной оценкой генерального среднего квадратического отклонения σ является исправленное выборочное среднее квадратическое отклонение, то есть σ=s=9,6.
а) Построим на чертеже гистограммы её теоретический аналог f (x).
Вид гистограммы относительных частот напоминает график плотности функции fx=12π∙σ∙e-(x-a)22∙σ2 нормального распределения непрерывной случайной величины Х.
Построим на одном чертеже с гистограммой относительных частот pi* (рис.2) ее теоретический аналог fx=12π∙9,6∙e-(x-40.85)22∙9,62
Рис