1. Построить интервальный вариационный ряд. Гистограмму.
2. Перейти от интервального вариационного ряда к дискретному, заменив частичные интервалы их серединами. Построить полигон, кумуляту частот, частостей.
3. Найти эмпирическую функцию распределения.
4. Найти числовые характеристики выборки: моду, медиану, выборочное среднее, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.
5. Сделать предварительный выбор закона распределения случайной величины.
6. Проверить согласованность эмпирической и теоретической функций распределения выбранного закона распределения с помощью критериев согласия χ2-Пирсона, Колмогорова при уровне значимости α=0,05.
7. Определить интервальные оценки для генеральной средней, генерального среднего квадратического отклонения нормального закона распределения с надёжностью γ=0,95.
Вариант №20. Имеются следующие данные о производительности труда 100 рабочих (в шт.).
93 93 90 74 97 80 87 77 74 82 82 76 83
84 82 85 81 84 85 81 88 83 88 92 76 83
86 79 76 83 84 81 84 83 89 92 78 93 74
79 89 73 90 85 79 78 81 93 86 83 83 76
81 77 81 71 82 91 84 85 81 78 88 84 75
83 74 81 83 76 87 88 91 74 88 89 87 90
84 81 85 73 85 90 83 86 82 87 89 83 82
96 84 81 92 81 75 79 87 80
Решение
Для построения интервального ряда определим интервальный шаг выборки, воспользовавшись формулой Стерджеса h=( xmax -xmin)/(1 +3.322 lgn), где n – объём выборки (в нашем случае 100), xmax ,xmin - соответственно наибольшее и наименьшее значения признака.
h= (97-71)/(1 +3.322 lg100)= 3,4
За начало первого интервала примем х1= xmin - h/2=69,3. В результате получим интервальный ряд.
Интервал (хi;хi+1] значений наблюдения Частота ni
Частость wi=ni/n
69,3-72,7 1 0,01
72,7-76,1 14 0,14
76,1-79,5 9 0,09
79,5-82,9 19 0,19
82,9-86,3 28 0,28
86,3-89,7 14 0,14
89,7-93,1 13 0,13
93,1-96,5 1 0,01
96,5-99,9 1 0,01
100 1,00
Частота – это количество значений признака, встречающееся в данном интервале. Например, в интервал (72,7;76,1] попадает 14 значений производительности труда. Гистограмма – это ступенчатая фигура, состоящая из прямоугольников. Их основаниями служат частичные интервалы, а высоты равны частотам (частостям). Ее график изображен на рис.1.
Рис.1. Гистограмма
Построим дискретный вариационный ряд. Для этого интервалы заменяем их серединами, причем частоты остаются прежними.
хi
71 74,4 77,8 81,2 84,6 88 91,4 94,8 98,2
Частота ni 1 14 9 19 28 14 13 1 1
Частость wi=ni/n 0,01 0,14 0,09 0,19 0,28 0,14 0,13 0,01 0,01
Полигон частот ((многоугольник распределения) – ломаная, соединяющая точки с координатами (xi, ni) или (xi, wi). Его график отражен ниже на рис.2.
Рис. 2. Полигон частот
Кумулята – это кривая накопленных частот (частостей). Для её построения найдём wнак. Её графическое изображение на рис.3.
хi
71 74,4 77,8 81,2 84,6 88 91,4 94,8 98,2
Частость wi=ni/n 0,01 0,09 0,14 0,19 0,28 0,14 0,13 0,01 0,01
Накопленная частотсь wнак
0,01 0,15 0,24 0,43 0,71 0,85 0,98 0,99 1,00
Рис. 3. Кумулята
Эмпирической функцией распределения F*(x) называется относительная частота того, что признак примет значение, меньшее заданного x, т.е
. F*(x)=w(X<x)= wxнак. Она является аналогом функции распределения случайной величины X. Запишем эмпирическую функцию:
F*(x)=0 при x≤71,00,01 при 71,0<x≤74,40,15 при 74,4<x≤77,80,24 при 77,8<x≤81,20,43 при 81,2<x≤84,60,71 при 84,6<x≤88,00,85 при 88,0<x≤91,40,98 при 91,4<x≤94,80,99 при 94,8<x98,21,0 при 98,2<x
Модой Мо вариационного ряда называется варианта, которая имеет наибольшую частоту. Мо=84,6.
Медианой Ме вариационного ряда называется значение признака приходящееся на середину ранжированного ряда наблюдений.
Если n=2k+1 (нечётное число), то Ме=хк+1; если n=2k (чётное число), то Ме =(хк+1+хк)/2. Ме =(84,6+81,2)/2 = 82,9.
Выборочной средней в называют среднее арифметическое значение признака выборочной совокупности:
= 83,38
Выборочная дисперсия:
=31,8
Среднее квадратическое отклонение: 5,64
Найдём коэффициент вариации: =6,8%
Определим коэффициент асимметрии, которая характеризует асимметрию полигона вариационного ряда:
Вычислим эксцесс, показывающий степень «крутости» выборочного распределения относительно нормального распределения:
Предварительный закон распределения может определяться по величине коэффициента вариации наблюдённых данных. Например, для нормального закона распределения он приближённо соответствует интервалу [0,01; 0,40], для экспоненциального – [0,6;1,3], для логарифмического – [0,35;0,8].
Равенство выборочного среднего и выборочной дисперсии может служить основанием выбора пуассоновского распределения. Для теоретического показательного закона распределения характерно равенство выборочного среднего и выборочного среднего квадратического отклонения