Расчет числовых характеристик выборки.
Определения закона распределения случайной величины
Цель работы: ознакомление со способами построения рядов распределения и методом расчёта их числовых характеристик, применение критериев согласия.
Даны значения механической скорости проходки на ста скважинах при одном и том же числе израсходованных долот:
5 9 11 13 9 11 7 13 11 13 9 11 11
15 9 13 15 11 9 17 7 13 11 11 11 9
11 9 9 11 13 9 9 13 7 11 9 11 13
13 7 17 11 11 15 9 13 9 5 11 9 13
7 13 9 13 11 11 15 9 13 11 11 13 17
13 15 9 9 11 13 11 5 15 11 11 15 9
15 11 9 11 13 11 7 13 7 11 11 13 9
9 13 9 13 13 9 11 9 13
Содержание работы:
Построить интервальный вариационный ряд. Гистограмму.
Перейти от интервального вариационного ряда к дискретному, заменив частичные интервалы их серединами. Построить полигон, кумуляту частот, частостей.
Найти эмпирическую функцию распределения.
Найти числовые характеристики выборки: моду, медиану, выборочное среднее, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.
Сделать предварительный выбор закона распределения случайной величины.
Проверить согласованность эмпирической и теоретической функций распределения выбранного закона распределения с помощью критериев согласия χ2-Пирсона, Колмогорова при уровне значимости α=0,05.
Определить интервальные оценки для генеральной средней, генерального среднего квадратического отклонения нормального закона распределения с надёжностью γ=0,95.
Решение
Построить интервальный вариационный ряд. Гистограмму.
n=100 – объем выборки.
xmin=5 – наименьшее значение признака.
xmax=17 – наибольшее значение признака.
Для построения интервального ряда определим интервальный шаг выборки, воспользовавшись формулой Стерджеса
h=xmax-xmin1+3,322lgn=17-51+3,322lg100≈1,57≈2
За начало первого интервала примем х1= xmin -h2=5-22=4. В результате получим интервальный ряд.
Интервал (хi;хi+1] наблюдаемых значений Частота ni
Частость wi=nin
4 – 6 3 0,03
6 – 8 7 0,07
8 – 10 25 0,25
10 – 12 30 0,3
12 – 14 24 0,24
14 – 16 8 0,08
16 – 18 3 0,03
Частота ni – это количество значений признака, встречающееся в данном интервале. Например, в интервал (6; 8] попадает 7 значений механической скорости проходки при одном и том же числе израсходованных долот.
Гистограмма – это ступенчатая фигура, состоящая из прямоугольников. Их основаниями служат частичные интервалы, а высоты равны частотам (частостям).
Перейти от интервального вариационного ряда к дискретному, заменив частичные интервалы их серединами. Построить полигон, кумуляту частот, частостей.
Построим дискретный вариационный ряд. Для этого интервалы заменяем их серединами, причем частоты остаются прежними.
xi
5 7 9 11 13 15 17
Частота ni
3 7 25 30 24 8 3
Частость wi=nin
0,03 0,07 0,25 0,3 0,24 0,08 0,03
Полигон частот (многоугольник распределения) – ломаная, соединяющая точки с координатами (xi, ni) или (xi, wi).
Кумулята – это кривая накопленных частот (частостей). Для её построения найдём nнак, wнак.
xi
5 7 9 11 13 15 17
Частота ni
3 7 25 30 24 8 3
Накопленная частота nнак
3 10 35 65 89 97 100
Частость wi=nin
0,03 0,07 0,25 0,3 0,24 0,08 0,03
Накопленная частость wнак
0,03 0,1 0,35 0,65 0,89 0,97 1
Найти эмпирическую функцию распределения.
Эмпирической функцией распределения F*x называется относительная частота того, что признак примет значение, меньшее заданного x, т.е. F*x=wX<x=wxнак. Она является аналогом функции распределения случайной величины X.
Запишем эмпирическую функцию
F*x=0 при x≤50,03 при 5<x≤70,1 при 7<x≤90,35 при 9<x≤110,65 при 11<x≤130,89 при 13<x≤150,97 при 15<x≤171 при x>17
Найти числовые характеристики выборки: моду, медиану, выборочное среднее, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс.
Модой Mo вариационного ряда называется варианта, которая имеет наибольшую частоту Мо=11.
Медианой Ме вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений.
Так как n=2∙k=2∙50=100 – четное число, то медиана
Me=xk+1+xk2=x51+x52=11+112=11
Выборочной средней xв называют среднее арифметическое значение признака выборочной совокупности
xв=xinin==11005∙3+7∙7+9∙25+11∙30+13∙24+15∙8+17∙3=1102100=11,02
Выборочная дисперсия
Dв=xi-xв2nin=11005-11,022∙3+7-11,022∙7+9-11,022∙25+11-11,022∙30+13-11,022∙24+15-11,022∙8+17-11,022∙3=1100108,7212+113,1228+102,01+94,0896+126,7232+107,2812=651,96100=6,5196
Среднее квадратическое отклонение σ=Dв=6,5196≈2,5534
Найдём коэффициент вариации
V=σxв∙100%=2,553411,02∙100%=23,17
Определим коэффициент асимметрии, которая характеризует асимметрию полигона вариационного ряда
As=xi-xв3ninσ3=1100∙2,553435-11,023∙3+7-11,023∙7+9-11,023∙25+11-11,023∙30+13-11,023∙24+15-11,023∙8+17-11,023∙3≈1100∙2,55343-654,5016-454,7537-206,0602-0,00024+186,2974+504,3583+641,5416=16,8816100∙2,55343≈0,0101
Вычислим эксцесс, показывающий степень “крутости” выборочного распределения относительно нормального распределения
Ex=xi-xв4ninσ4-3=1100∙2,553445-11,024∙3+7-11,024∙7+9-11,024∙25+11-11,024∙30+13-11,024∙24+15-11,024∙8+17-11,024∙3-3≈1100∙2,553443940,0998+1828,1097+416,2416+368,8689+2007,3462+3836,4186-3=12397,0848100∙2,55344-3≈-0,0836
Сделать предварительный выбор закона распределения случайной величины.
Предварительный закон распределения может определяться по величине коэффициента вариации наблюдённых данных
. В нашем случае V=0,2317, что соответствует нормальному закону распределения (попадает в интервал [0,01; 0,40]).
Найдем
EA=6n-1n+1n+3=6100-1100+1100+3≈0,239
EE=24nn-2n-3n-12n+3n+5=24∙100∙100-2100-3100-12100+3100+5≈0,4639
Тогда
As=0,0101<3∙EA=0,717; Ex=0,0836<3∙EE=1,3917
Неравенства выполняются, поэтому о нормальности закона распределения может быть принята.
Основываясь на значениях коэффициентов вариации (находится в интервале [0,01; 0,40]), асимметрии (близок к нулю), эксцесса (близок к нулю) можно предположить, что признак подчинён нормальному закону распределения.
Плотность вероятности
fx=1σ2πe-x-a22σ2=12,55342πe-x-11,02213,0397
Тогда функция распределения имеет вид
Fx=0,5+Фx-aσ=0,5+Фx-11,022,5534
Здесь xв=11,02 – точечная оценка параметра a, σ=2,5534 – параметра σ.
Проверить согласованность эмпирической и теоретической функций распределения выбранного закона распределения с помощью критериев согласия χ2-Пирсона, Колмогорова при уровне значимости α=0,05.
Для строгой проверки гипотезы о нормальном распределении признака применим критерии согласия