Дана выборка значений случайной величины (выборка объема из генеральной совокупности).
1. Найти выборочную оценку математического ожидания случайной величины , указать свойства этой оценки.
2. Найти выборочные оценки дисперсии и среднеквадратического отклонения случайной величины , указать свойства этих оценок.
3. Составить группированный вариационный ряд, разбив выборку на равных интервалов.
4. Построить гистограмму и полигон относительных частот. На их основе выдвинуть нулевую гипотезу о виде распределения.
5. На одном чертеже с гистограммой построить график теоретической плотности вероятностей в соответствие с выдвинутой гипотезой вывод о визуальном совпадении гистограммы с графиком плотности вероятностей.
6. Найти эмпирическую функцию распределения и построить ее график.
7. На одном чертеже с эмпирической функцией распределения построить график теоретической функции распределения в соответствие с выдвинутой гипотезой . Сделать вывод о визуальном совпадении графиков эмпирической и теоретической функции распределения.
8. С помощью критерия согласия Пирсона проверить гипотезу о виде распределения генеральной совокупности при уровне значимости . Сделать статистический вывод.
9. Построить доверительные интервалы для неизвестных математического ожидания и дисперсии нормально распределенной генеральной совокупности с параметрами и при уровнях значимости , и . Сделать вывод о ширине доверительного интервала в зависимости от уровня значимости .
Указание: все вычисления производить с точностью до 0,0001.
Решение
Дана выборка значений случайной величины (выборка объема из генеральной совокупности).
Таблица 1
Исходные данные
-2,83 1,15 -0,02 3,34 -0,25 4,61 3,66 1,16 2,64 0,15
3,16 7,76 1,28 -0,22 5,31 5,21 6,22 7,57 6,42 0,35
1,48 1,42 2,50 3,14 0,11 6,70 6,26 0,70 6,76 2,88
3,60 3,02 -0,43 2,02 3,71 3,90 -1,54 8,97 1,84 3,00
2,61 3,15 2,59 -2,98 5,29 5,39 5,06 -1,07 9,32 0,92
4,88 1,39 5,19 3,35 1,86 3,78 2,69 8,76 2,73 3,98
2,70 4,52 0,64 3,34 5,04 1,59 -1,31 1,02 5,72 1,33
0,36 1,44 4,56 3,22 -0,97 5,54 9,13 7,82 0,65 7,36
6,50 3,66 0,22 0,43 4,73 5,82 -0,41 4,33 7,66 1,26
2,11 1,23 2,83 4,71 1,66 1,51 8,14 7,32 3,28 -4,95
1. Найти выборочную оценку математического ожидания случайной величины , указать свойства этой оценки.
Оценкой математического ожидания случайной величины служит выборочное среднее . Данная оценка является несмещенной, эффективной и состоятельной.
2. Найти выборочные оценки дисперсии и среднеквадратического отклонения случайной величины , указать свойства этих оценок.
Оценкой неизвестной дисперсии случайной величины служат выборочная дисперсия и модифицированная выборочная дисперсия, вычисляемые по формулам:
Оценка является несмещенной, асимптотически эффективной и состоятельной, а - смещенная, асимптотически эффективная и состоятельная оценка. Следовательно, дает несколько лучшее приближение оцениваемой дисперсии, поэтому в дальнейших расчетах в качестве оценки дисперсии используется : .
Оценка среднеквадратического отклонения, являющаяся несмещенной, асимптотически эффективной, состоятельной:
Найденные оценки параметров распределения можно найти с помощью статистических функций: =СРЗНАЧ(A2:J11); =ДИСПР(A2:J11); =ДИСП.В(A2:J11); =СТАНДОТКЛОН.В(A2:J11):
3. Составить группированный вариационный ряд, разбив выборку на равных интервалов.
Составим сгруппированный вариационный ряд для выборки из генеральной совокупности значений случайной величины , разбив выборку на равных интервалов.
Данная выборка имеет объем .
Определим интервал изменения случайной величины . Для этого в таблице 1 находим максимальный и минимальный элементы:
Определим размах выборки:
Для удобства дальнейшей обработки статистических данных округляем и до ближайших целых чисел таких, чтобы и вошли бы в новый интервал:
,
Тогда новый размах вариации выборки .
Разбиваем выборку на равных интервалов. Длина каждого частичного интервала равна .
Частичные интервалы приведены во втором столбце таблицы 2.
Найдем количество вариант, попавших в каждый частичный интервал разбиения, и заполним третий столбец таблицы 2. Сумма всех частот должна быть равна .
Найдем относительные частоты и накопленные относительные частоты (четвертый и пятый столбцы таблицы 2).
Группированный вариационный ряд оформим а таблице 2.
Таблица 2
Группированный вариационный ряд
Индекс i Интервал
[ui ;ui+1] Частота
ni
Относит. частота
n̅i
Накопит. относит. частота
wi
1 [-5;-3,5] 1 0,01 0,01
2 [-3,5;-2] 2 0,02 0,03
3 [-2;-0,5] 4 0,04 0,07
4 [-0,5;1] 15 0,15 0,22
5 [1;2,5] 19 0,19 0,41
6 [2,5;4] 25 0,25 0,66
7 [4;5,5] 14 0,14 0,80
8 [5,5;7] 9 0,09 0,89
9 [7;8,5] 7 0,07 0,96
10 [8,5;10] 4 0,04 1,00
Сумма 100 1
Из таблицы 2 видно, что данная выборка имеет одну изолированную точку , удаленную от группы других экспериментальных точек. В таком случае можно считать эту изолированную точку аномальным наблюдением, грубой ошибкой измерения и удалить ее из выборки. Тогда объем выборки уменьшится и будет равен 99.
Изменяются так же и выборочные характеристики (в дальнейших значениях будут использоваться именно эти значения):
Проверим гипотезу об аномальности
Значение признается аномальным и выбрасывается из выборки объема , если , где значение определяется для данной доверительной вероятности по таблице нормального распределения
. Выберем доверительную вероятность , которому соответствует . Значения и определяются по выборке уменьшенного объема, то есть и
Так как условие выполняется, точку можно из выборки исключить. Соответственно, в таблице 2 можно исключить один первый интервал. Заметим, что число оставшихся интервалов группировки оказалось равно 9, что соответствует условию:
В противном случае число интервалов пришлось бы увеличить.
Новое разбиение на интервалы оформим в таблице 3.
Таблица 3
Новая группировка вариационного ряда без аномальной точки
Индекс i Интервал
[ui ;ui+1] Частота
ni
Относит. частота
n̅i
Накопит. относит. частота
wi
1 [-3,5;-2] 2 0,0202 0,0202
2 [-2;-0,5] 4 0,0404 0,0606
3 [-0,5;1] 15 0,1515 0,2121
4 [1;2,5] 19 0,1919 0,4040
5 [2,5;4] 25 0,2525 0,6566
6 [4;5,5] 14 0,1414 0,7980
7 [5,5;7] 9 0,0909 0,8889
8 [7;8,5] 7 0,0707 0,9596
9 [8,5;10] 4 0,0404 1
Сумма 99 1
4. Построить гистограмму и полигон относительных частот. На их основе выдвинуть нулевую гипотезу о виде распределения.
Для удобства заполним таблицу 4. В третий столбец занесены середины интервалов , в четвертый – относительные частоты интервалов , в пятый – высоты прямоугольников гистограммы относительных частот .
Таблица 4
Данные для построения гистограммы
Индекс i Интервал
[ui ;ui+1] Середина интервала
zi
Относит. частота
n̅i
Высота прямоуг.
hi
1 [-3,5;-2] -2,75 0,0202 0,0135
2 [-2;-0,5] -1,25 0,0404 0,0269
3 [-0,5;1] 0,25 0,1515 0,1010
4 [1;2,5] 1,75 0,1919 0,1279
5 [2,5;4] 3,25 0,2525 0,1684
6 [4;5,5] 4,75 0,1414 0,0943
7 [5,5;7] 6,25 0,0909 0,0606
8 [7;8,5] 7,75 0,0707 0,0471
9 [8,5;10] 9,25 0,0404 0,0269
Сумма 1,0000
По данным таблицы 4 построим гистограмму. Для этого в прямоугольной системе координат на оси абсцисс откладываем значения границ интервалов разбиения и на каждом интервале с номером стоим прямоугольник высотой .
Рис. 1. Гистограмма относительных частот и кривая теоретической плотности вероятностей
Для такой гистограммы площадь ступенчатой фигуры приближенно равна сумме вероятностей и равна 1. Площадь каждого прямоугольника гистограммы приближенно равна вероятности попадания случайной величины в интервал, соответствующий основанию прямоугольника.
Полигон относительных частот – ломанная, соединяющая точки , (Рис. 2).
Рис. 2 . Полигон относительных частот
Гистограмма и полигон относительных частот, являющиеся статистическими оценками плотности вероятностей генеральной совокупности, схожи с кривой плотности вероятности нормального закона. На основании этого выдвигаем нулевую гипотезу : генеральная совокупность, из которой взята выборка распределена по нормальному закону распределения с параметрами , , то есть теоретическая плотность вероятностей имеет вид: .
5. На одном чертеже с гистограммой построить график теоретической плотности вероятностей в соответствие с выдвинутой гипотезой вывод о визуальном совпадении гистограммы с графиком плотности вероятностей.
Вычислим значение теоретической плотности вероятностей в точках - серединных интервалов. Результаты вычислений занесем в таблицу 5. Заметим, что .
Таблица 4
Вычисление значений теоретической плотности вероятностей
1 -2,75 -2,1469 0,0398 0,0144
2 -1,25 -1,6052 0,1100 0,0397
3 0,25 -1,0635 0,2266 0,0818
4 1,75 -0,5218 0,3482 0,1257
5 3,25 0,0199 0,3989 0,1440
6 4,75 0,5616 0,3407 0,1231
7 6,25 1,1033 0,2171 0,0784
8 7,75 1,6450 0,1031 0,0372
9 9,25 2,1867 0,0365 0,0132
x̅= 3,1948 0,0000 0,3989 0,1441
Последний столбец таблицы 4 можно вычислить сразу по серединам интервалов с помощью статистической функции НОРМРАСП пакета EXCEL с логическим значением ЛОЖЬ.
Для построения теоретической плотности вероятностей на рисунке 1 поставим , и и соединим их плавной линией.
Из рисунка 1 видно, что график теоретической плотности вероятностей и гистограмма достаточно хорошо совпадают.
6