Проведены наблюдения над некоторыми статистическими показателями. Зафиксированы их значения и сформированы выборки (представлены в таблице по вариантам).
Требуется по данным выборочной совокупности провести обработку статистических данных, начальный анализ и сделать выводы:
Составить вариационный ряд частот и частостей.
Изобразить полигон частот. Сделать обоснованное предположение о законе распределения.
Составить и изобразить эмпирическую функцию распределения
Вычислить основные числовые характеристики выборки: размах, мода, медиана, выборочное среднее значение, выборочная дисперсия, выборочное среднеквадратическое отклонение, асимметрия, эксцесс. Интерпретировать результаты вычислений. Сделать обоснованные выводы о законе распределения.
По этой выборке найти точечные оценки для математического ожидания М(Х) и среднеквадратического отклонения (Х) генеральной совокупности
Найти интервальные оценки для математического ожидания М(Х) и среднеквадратического отклонения (Х) генеральной совокупности при следующих условиях: доверительный интервал для математического ожидания М(Х) с надёжностью 90%; доверительный интервал для среднеквадратического отклонения (Х) с надёжностью 95%.
Данные выборок
Номер варианта Зафиксированные значения экономических показателей
5 3, 3, 1, 2, 3, 5, 5, 3, 3, 5, 5, 6, 6, 6, 7, 2, 2, 7, 3, 3
Нужно полное решение этой работы?
Решение
1. Объём представленной выборки n =20 наблюдений. Ранжируем значения в возрастающем порядке:
1
2
2
2
3
3
3
3
3
3
3
5
5
5
5
6
6
6
7
7
Видим, что различных значений присутствует k = 6. Подсчитываем частоты каждого значения: значение 1 – встречается 1 раз, 2 – 3 раза, 3 – 7 раз, 5 – 4 раза, 6 – 3 раза, 7 – 2 раза.
Составляем вариационный ряд частот:
Варианты хi
1 2 3 5 6 7
Частоты ni
1 3 7 4 3 2
Проверяем правильность вычислений:
i=1kni=1+3+7+4+3+2=20=n – равно объёму выборки. Верно.
Разделив частоты на объём выборки mi=nin - получим частости каждой варианты. Частости являются эмпирическими вероятностями.
Составим вариационный ряд частостей. Он же является эмпирическим законом распределения.
Варианты хi
1 2 3 5 6 7
Частости mi 1/20 3/20 7/20 4/20 3/20 2/20
right10871454002. Строим полигон частот. Используем данные вариационного ряда. В координатной плоскости строим точки с координатами (xi; ni) и соединяем их. Получаем ломаную линию – полигон частот.
Рис. 1 Полигон частот
Распределение имеет вершину и спадает по краям, то есть имеет характерные признаки нормального распределения.
3. Для составления эмпирической функции распределения используем вариационный ряд частостей, т.к. он является эмпирическим законом распределения.
Эмпирическая функция распределения:
F*x=P*X<x=0, если x≤1,120, если 1<x≤2,120+320=420, если 2<x≤3,420+720=1120, если 3<x≤5,1120+420=1520, если 5<x≤6,1520+320=1820, если 6<x≤7,1820+220=1, если x>7
На координатной плоскости строим эмпирическую функцию распределения. Она является кусочно-постоянной функцией и имеет ступенчатый вид.
Рис. 2. Функция распределения
4. Вычислим основные числовые характеристики выборки
Размах данной выборки: R = xmax – xmin = 7 - 1 = 6.
Мода – наиболее часто встречающееся значение.
Наибольшая частота ni = 7 соответствует варианте xi = 3. Т.е. мода Мо = 3.
Таким образом, наиболее часто исследуемый показатель принимает значение, равное 3.
Медиана – значение, которое находится ровно на середине ранжированного ряда
.
Всего значений 20 – чётное число. Значит, в таком ранжированном ряду будет 2 серединных места: место № 10 и № 11. В нашем ранжированном ряду и на месте № 19 и на месте № 20 стоит значение 3. Следовательно, медиана Ме = 3.
То есть 50% процентов значение исследуемого показателя – меньше уровня 3, а другие 50% – выше этого уровня.
Далее покажем формулы для расчета показателей.
Выборочное среднее значение: x=1ni=1kxini.
Выборочная дисперсия: d2=x2-x2. Является мерой рассеяния значений выборки относительно её среднего значения. Так же, следует заметить, что дисперсия является эмпирическим моментом 2-го порядка - 2.
Выборочное среднеквадратическое отклонение:
d=d2
Асимметрия является мерой нарушения симметрии графика распределения по сравнению с графиком нормального распределения. Асимметрия нормального распределения =0, т.к. график нормального распределения строго симметричен относительно математического ожидания. Если А>0, то левосторонняя асимметрия. Если А<0, то – правостронняя.
Асимметрия вычисляется с помощью эмпирического момента 3-го порядка и дисперсии: A=μ3d3.
Эмпирический момент k-го порядка: μk=1ni=1xi-xkni.
Эксцесс – характеризует остроту вершины графика распределения. Для нормального распределения эксцесс =0. Если вершина острее, чем у нормального распределения, то Е > 0. Если вершина более «приплюснутая», чем у нормального распределения, то Е < 0.
Эксцесс вычисляется с помощью эмпирического момента 4-го порядка и дисперсии:
E=μ4d4-3.
Расчеты и результаты удобно свести в таблицу:
xi ni
xi*ni
(xi-xsr)2*ni
(xi-xsr)3*ni
(xi-xsr)4*ni
1 1 1 9 -27 81
2 3 6 12 -24 48
3 7 21 7 -7 7
5 4 20 4 4 4
6 3 18 12 24 48
7 2 14 18 54 162
Σ 20 80 62 24 350
xsr = 4
d2 = 3,1
d = 1,761
As = 0,220
Ex = -1,179
Выборочное среднеквадратическое отклонение:
d=d2=1,761. Показывает на сколько в среднем значения выборки отклоняются/рассеиваются от среднего значения.
Итак, изучаемый статистический показатель в среднем равен 4±1,761; т.е