Приведены результаты проверки скорости чтения (знаков в минуту) у первокурсников:
138 140 139 140 136 138 137 138 141 137
140 139 142 138 141 137 141 136 141 140
138 142 140 139 137 141 141 138 137 141
138 140 141 142 136 138 137 142 142 138
140 141 138 138 139 139 142 138 136 139
Для исследования полученных данных необходимо выполнить следующее:
1. Составить интервальный статистический ряд значений признака Х, разбив весь диапазон наблюдаемых значений на 5-7 интервалов (6)
2. Построить гистограмму и полигон относительных частот полученных измерений.
3. Найти эмпирическую функцию распределения и построить ее график.
4. Вычислить среднее арифметическое выборки, выборочную дисперсию, выборочное среде квадратическое отклонение, выборочные коэффициенты асимметрии и вариации, эксцесс.
5. Сделать предварительный выбор закона распределения случайной величины Х.
6. Проверить согласия эмпирической функции распределения с выбранным законом распределения с помощью критерия согласия.
7. Найти интервальные оценки параметров нормального закона распределения с доверительной вероятностью 0,95.
8. Найти необходимый объем выборки для уменьшения предельной ошибки в два раза, учитывая, что проводилась случайная повторная выборка.
Решение
Исследование статистических данных начнѐм с группировки, т.е. с разбиения всех наблюденных значений непрерывной случайной величины Х из табл. А на 6 интервалов длиной:
h=xmax-xmins=142-1366=1
За начало первого интервала примем: x1=xmin=136, x2=136+1=137, а конец последнего: x6=xmax=142.
В результате получим интервальный ряд :
Интервал (xi;xi+1]
Частота mi
Относительная частота ωi=min
ωih
xi*=xi-1+xi2
[136;137] 4 0,08 0,08 136,5
(137;138] 6 0,12 0,12 137,5
(138;139] 12 0,24 0,24 138,5
(139;140] 6 0,12 0,12 139,5
(140;141] 7 0,14 0,14 140,5
(141;142] 15 0,3 0,3 141,5
∑ 50 1
2. Для того, чтобы составить предварительное представление о характере распределения значений случайной величины Х, построим еѐ гистограмму и полигон относительных частот.
3. Найти эмпирическую функцию распределения и построить ее график.
Эмпирическая функция распределения находится по формуле:
Fnx=nxn
nx – количество наблюдений(вариантов) меньших х.
n - объем выборки.
Тогда эмпирическая функция распределения имеет вид:
Fnx=0 при х≤1360,08 при 136<х≤1370,2 при 137<х≤1380,44 при 138<х≤1390,56 при 139<х≤1400,7 при 140<х≤1411 при х>141
Построим эмпирическую функцию распределения
4. Для нахождения выборочной средней X, выборочной дисперсии D(X), выборочного среднего квадратического отклонения σ(X) (статистические аналоги соответствующих числовых характеристик случайной величины) заполним вспомогательную таблицу.
i
xi*
mi
xi*mi
xi*-X2
xi*-X2mi
1 136,5 4 546 9,1204 36,4816
2 137,5 6 825 4,0804 24,4824
3 138,5 12 1662 1,0404 12,4848
4 139,5 6 837 0,0004 0,0024
5 140,5 7 983,5 0,9604 6,7228
6 141,5 15 2122,5 3,9204 58,806
∑
50 6976
138,98
Находим среднее арифметическое выборки:
X=1ni=16xi*mi=697650=139,52
Находим выборочную дисперсию:
D(X)=1ni=16xi*-X2mi=138.9850=2,7796
Найдем среднее квадратическое отклонение
σ(X)=DX=2,7796≈1,67
Найдем исправленное среднее квадратическое отклонение
s=nn-1∙D(X)=5050-1∙2,7796≈1,68
Для вычисления коэффициента ассиметрии и эксцесса составим расчетную таблицу
i
xi*
mi
xi*-X3mi
xi*-X4mi
1 136,5 4 -110,174 332,7268
2 137,5 6 -49,4544 99,89798
3 138,5 12 -12,7345 12,98919
4 139,5 6 -0,000048 0,00000096
5 140,5 7 6,588344 6,456577
6 141,5 15 116,4359 230,543
∑
50 -49,3392 682,6136
Выборочный центральный момент 3-го порядка вычислим по формуле:
μ3*=1ni=16xi*-X3mi=-49,339250=-0,9868
Находим выборочный коэффициент ассиметрии:
η=μ3*σ3=-0,98681,673≈-0,212
Так как η<0 свидетельствует о левосторонней ассиметрии
.
Выборочный центральный момент 4-го порядка вычислим по формуле:
μ4*=1ni=16xi*-X4mi=682,613650≈13,6523
Находим выборочный коэффициент эксцесса:
ε=μ4*σ4-3=13,65231,674-3≈1,755-3=-1,245
Поскольку ε<0, то распределение более плосковершинное (сплюснутое), чем нормальное.
Вычислим коэффициент вариации
V*=σ(X)X∙100%=1,67139,52∙100%≈0,012∙100%=1,2%
Поскольку V*≤30%, то совокупность однородная, а вариация слабая.
5. Полученный коэффициент вариации 0,012 попадает в диапазон 0,08;0,40.
Для предварительного выбора закона распределения используют коэффициенты асимметрии, эксцесс и их средние квадратичные отклонения:
Еη=S (n-1)n+1(n+3)=6∙(50-1)50+1(50+3)≈0,33
Еε=24nn-2(n-3)(n-1)n+3(n+5)=24∙50∙50-2(50-3)(50-1)50+3(50+5)≈4,35
А так же для нормального закона распределения должны выполняться неравенства: η<3Еη и ε<3Еε
В нашем случае: -0,212<3∙0,33 и -1,245<3∙4,35.
Неравенства выполняются.
На основании полученных результатов можно предположить, что случайная величина X распределена по нормальному закону с плотностью вероятности:
fx=11,672π∙e-(x-139,52)22∙1,672
Тогда интегральную функцию распределения можно записать в
Fx=12+Фx-139,521,67
Здесь Х=139,52 - точечная оценка параметра а, а σ(Х)=1,67 - параметра σ