а) Представить данные в виде интервального статистического ряда, проиллюстрировать его гистограммой ni(x).
б) Найти эмпирические значения выборочного среднего и дисперсии с точностью 10–2;
в) Сделать оценки математического ожидания и дисперсии измеренной случайной величины с точностью до единиц.
г) Выдвинуть гипотезу о функциональном виде распределения и значениях его параметров, построить математическую модель в виде предполагаемой функции плотности распределения и интегральной функции распределения.
д) При необходимости, изменить статистический ряд, добиваясь наполненности интервалов ni ≥ 5 и покрытия всей области возможных значений выдвинутой гипотезы.
е) Исходя из выдвинутой гипотезы, получить теоретические предсказания количества измерений niTx=npi для каждого интервала статистического ряда.
ж) Проиллюстрировать гипотезу графически, построив сравнительную гистограмму распределений эмпирического (ni(x)) и теоретического (niTx) количества измерений по интервалам статистического ряда на одном поле.
з) Проверить выдвинутую гипотезу с помощью метода χ2 Пирсона, сделать вывод о необходимости отвергнуть гипотезу (на уровне значимости α=0,05)
2,00 2,02 2,02 2,04 2,09 2,37 2,50 2,77 2,87 2,95 3,11 3,16
3,28 3,39 3,48 3,60 3,61 3,63 3,71 3,81 3,83 3,97 3,98 4.00 4,17
4,28 4,41 4,50 4,51 4,67 4,7 5,12 5,14 5,15 5,17 5,5 5,56 5,78
5,81 5,82 6,05 6,37 6,61 6,68 6,87 6,96 7,03 7,07 7,27 7,37 7,56
7,63 8,03 8,18 8,47 8,53 8,56 8,62 8,69 8,72 8,79 8,97 8,98 9,21
9,41 9,56 9,56 9,63 9,79 9,9 10,05 10,11 10,12 10,22 10,44 10,7 10,71
10,76 10,77 11,05 11,08 11,29 11,36 11,43 11,45 11,48 11,52 11,53 11,68 11,7
11,80 11,83 11,97 12,10 12,19 12,49 12,53 12,76 12,87 12,99
Нужно полное решение этой работы?
Решение
А) Представить данные в виде интервального статистического ряда, проиллюстрировать его гистограммой ni(x).
Приемлимое количество интервалов – от 6 до 10, желательно выбирать ширину интервалов и границы между ними целыми. У нас минимальное значение в выборке 2, а максимальное не достигает 13. Ширина этого диапазона – 13-2=11 единицы, она неудобна для разделения на одинаковые интервалы целой ширины. Однако, немного увеличивая диапазон до 12 (2 –14), мы имеем возможности взять 12 интервалов по 1 единицы (больше рекомендованного) или 6 интервалов по 2 единицы – на нижней границе допустимого.
Принимаем решение: статистический ряд охватит диапазон от 2 до 14, ширина интервала – 2 ед, количество интервалов – 6. Подсчитаем значения, попадающие в каждый интервал и составим таблицу интервального статистического ряда, попадающие на границы между интервалами значения учитываем по 0,5 шт. в оба интервала:
i (№)
1 2 3 4 5 6
xi-1
2 4 6 8 10 12
xi
4 6 8 10 12 14
xiср
3 5 7 9 11 13
ni
23 17 12 18 23 7
Контроль: сумма значений в последней строке таблицы 100, совпадает с объемом выборки:
n=ni=23+17+12+18+23+7=100
Проиллюстрируем полученный интервальный статистический ряд гистограммой:
б) Найти эмпирические значения выборочного среднего и дисперсии с точностью 10–2
Для нахождения числовых характеристик выборки дополним статистический ряд: ряд вспомогательными расчетными величинами (wi=nin=ni100 – частоты интервалов):
i (№)
1 2 3 4 5 6 ∑
xiср
3 5 7 9 11 13
ni
22,5 17,5 12 18 23 7 100
wi
0,23 0,17 0,12 0,18 0,23 0,07 1,00
wixiср
0,69 0,85 0,84 1,62 2,53 0,91 7,44
Определили первый эмпирический начальный момент
M1*=wixiср=7,44
Введем новые переменные для отклонения вариантов от выборочного среднего ∆i=xiср-M1* и рассчитаем второй эмпирический (выборочный) центральный момент:
i (№)
1 2 3 4 5 6 ∑
∆i
-4,44 -2,44 -0,44 1,56 3,56 5,56 3,36
wi
0,23 0,17 0,12 0,18 0,23 0,07 1,00
wi∆i2
4,53 1,01 0,02 0,44 2,91 2,16 11,09
Определили: второй эмпирический центральный момент
m2*=wi∆i2=11,09
Вычислим характеристики выборки, связанные с её начальными и центральными моментами:
– Среднее выборочное x=M1*=7,44;
– Выборочная дисперсия Dв=m2*=11,09;
– Выборочное СКО σв=Dв=11,09=3,33
в) Сделать оценки математического ожидания и дисперсии измеренной случайной величины с точностью до единиц.
M(X) ≈ x̅≈ 7; σ ≈ σв ≈ 3.
г) Выдвинуть гипотезу о функциональном виде распределения и значениях его параметров, построить математическую модель в виде предполагаемой функции плотности распределения и интегральной функции распределения
.
Общий вид гистограммы без явного спадания на краях, примерно нулевое значение асимметрии (допустимое отклонение ±0,3) и отрицательное значение эксцесса позволяют выдвинуть гипотезу о равномерном распределении случайной величины, представленной в выборке