Полученные данные в некотором исследовании занесены в таблицу.
Требуется:
1. найти моду, медиану, размах выборки;
2. построить полигон частот;
3. построить гистограмму выборки (можно разбить на 5 интервалов);
4. построить эмпирическую функцию распределения;
5. подсчитать среднее значение и исправленную дисперсию выборки, исправленное среднее квадратическое отклонение;
6. найти с надежностью 0,95 доверительный интервал для M (X ).
Вариант 2
20 15 10 7 4 15 2 3 15 10 20 12 15 4 11
Решение
Мода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 15 (n = 4). Следовательно, мода равна 15.
Медиана.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Это значение x = 11. Таким образом, медиана равна 11.
Размах выборки - разность между максимальным и минимальным значениями признака первичного ряда.
R = xmax - xmin = 20 - 2 = 18
Построим дискретный вариационный ряд. Для этого отсортируем ряд по возрастанию и подсчитаем количество повторения для каждого элемента ряда.
xi
Частота, ni
2 1
3 1
4 2
7 1
10 2
11 1
12 1
15 4
20 2
Итого 15
Построим полигон частот:
Сгруппируем выборку (разобъем на 5 интервалов)
Ширина интервала составит:
xmax - максимальное значение выборки.
xmin - минимальное значение выборки.
Определим границы интервалов.
Номер интервала Нижняя граница Верхняя граница
1 2 6
2 6 10
3 10 14
4 14 18
5 18 22
Одно и тоже значение признака служит верхней и нижней границами двух смежных интервалов.
Для каждого значения выборки подсчитаем, какое количество раз оно попадает в тот или иной интервал
.
Интервалы Частота, fi
2 - 6 4
6 - 10 1
10 - 14 4
14 - 18 4
18 - 22 2
Построим гистограмму:
Посчитаем относительные частоты, накопленные относительные частоты и построим эмпирическую функцию распределения
Интервалы Частота, ni
Относительная частота, ni/n Накопленная относительная частота, ∑ ni/n
2 - 6 4 0,266666667 0,266667
6 - 10 1 0,066666667 0,333333
10 - 14 4 0,266666667 0,6
14 - 18 4 0,266666667 0,866667
18 - 22 2 0,133333333 1
∑ 15 1
Теперь можно составить эмпирическую функцию распределения:
F(x)=0 при х≤2
F(x)=0,266667 при 2<x≤6
F(x)=0,333333 при 6<x≤10
F(x)=0,6 при 10<x≤14
F(x)=0,866667 при 14<x≤18
F(x)=1 при х>22
График функции распределения представлен на рисунке
Посчитаем среднее значение и исправленную дисперсию выборки, исправленное среднее квадратическое отклонение;
Таблица для расчета показателей.
Интервалы Середина интервала, xi
Частота, ni xi·ni
(xi-xср)2·ni
2 - 6 4 4 16 239.218
6 - 10 8 1 8 13.938
10 - 14 12 4 48 0.284
14 - 18 16 4 64 72.818
18 - 22 20 2 40 136.676
Итого
15 176 462.933
Выборочная средняя
исправленная дисперсия
исправленное среднее квадратическое отклонение.
Доверительный интервал для генерального среднего.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.95/2 = 0.475
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.475
tkp(γ) = (0.475) = 1.96
Предельная ошибка выборки:
Доверительный интервал:
(11.733 - 2.91;11.733 + 2.91) = (8.823;14.643)
С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.