Дано 100 значений случайной величины. Результаты в табл. 2, 3. Определить оценки среднего, дисперсии, стандартного отклонения, асимметрии и эксцесса. Проверить гипотезы
о нормальном распределении,
о равномерном распределении.
Обе гипотезы надо проверить на обеих таблицах
Таблица 2
2.05 0.45 0.79 0.73 1.07 0.48 0.77 0.88 1.97 0.83
0.06 1.15 2.00 1.97 -0.11 0.38 -0.31 0.39 0.34 2.06
-0.00 0.90 1.60 1.58 1.63 0.81 2.19 1.52 0.26 0.24
1.24 1.83 0.77 1.33 0.73 -0.85 1.54 1.50 0.71 1.02
1.64 0.73 -0.38 0.15 1.15 0.75 0.47 1.63 1.35 2.37
1.12 0.25 0.99 0.64 0.54 -0.32 -0.45 0.18 1.02 0.77
0.48 -0.63 -0.51 1.77 0.47 -0.37 1.70 1.59 0.65 -0.31
2.49 2.05 1.90 2.78 0.07 0.14 1.05 -0.06 1.24 2.24
0.19 0.23 1.64 -0.59 0.83 1.01 1.01 1.62 1.24 1.15
1.45 1.98 1.67 -1.66 -1.37 1.03 0.55 1.28 1.11 0.96
Таблица 3
-0.87 -1.22 -0.77 -1.38 -0.97 -0.96 -1.24 -0.81 -1.02 -1.14
-0.53 -1.27 -1.48 -1.27 -1.01 -1.32 -0.81 -1.39 -1.20 -0.60
-1.46 -1.39 -1.49 -0.62 -0.53 -1.40 -1.00 -0.58 -1.24 -0.95
-1.50 -1.24 -0.89 -1.47 -0.94 -0.77 -0.71 -1.34 -0.86 -1.21
-0.82 -0.59 -0.86 -1.02 -1.28 -0.93 -0.83 -0.67 -0.89 -0.66
-0.63 -1.40 -1.30 -0.78 -0.55 -0.54 -1.43 -1.17 -1.47 -1.04
-1.39 -0.79 -0.80 -1.08 -1.40 -1.29 -0.53 -0.91 -1.32 -1.30
-0.90 -1.36 -0.86 -1.47 -0.66 -0.54 -0.58 -1.04 -0.78 -0.76
-1.17 -1.36 -1.28 -0.69 -0.71 -0.68 -1.26 -1.28 -0.90 -1.29
-0.56 -0.92 -1.30 -0.65 -0.52 -0.90 -1.37 -1.10 -0.70 -1.15
Решение
Число групп приближенно определяется по формуле Стэрджесса
n = 1 + 3,2log n = 1 + 3,2log(100) = 7
Ширина интервала составит:
h=xmax - xminn=2.78 - (-1.66)7=0.63
Таблица 2.1 для расчета показателей:
Таблица 2.1
Группы Середина интервала, xцентр Кол-во, fi xi·fi (x-xср)2·fi Относительная частота, fi/f
-1.66 - -1.03 -1.345 2 -2.69 9.898 0.02
-1.03 - -0.4 -0.715 5 -3.575 12.715 0.05
-0.4 - 0.23 -0.085 15 -1.275 13.958 0.15
0.23 - 0.86 0.545 27 14.715 3.024 0.27
0.86 - 1.49 1.175 23 27.025 2.006 0.23
1.49 - 2.12 1.805 23 41.515 19.694 0.23
2.12 - 2.78 2.45 5 12.25 12.33 0.05
Итого 100 87.965 73.625 1
Выборочная средняя
x = xi∙fifi = 87.965100 = 0.88
Дисперсия
𝐷 =(xi - x)2 fifi=73.625100= 0.736
Среднее квадратическое отклонение.
σ=D=0.736=0.858
As = M3/s3
M3 = -18.59/100 = -0.19
As=-0.190.8583=-0.294
Расчет центральных моментов проводим в таблице 2.2:
Таблица 2.2
Группы Середина интервала, xцентр Кол-во, fi (x-xср)3·fi (x-xср)4·fi
-1.66 - -1.03 -1.35 2 -22.02 48.99
-1.03 - -0.4 -0.72 5 -20.28 32.33
-0.4 - 0.23 -0.085 15 -13.46 12.99
0.23 - 0.86 0.55 27 -1.01 0.34
0.86 - 1.49 1.18 23 0.59 0.18
1.49 - 2.12 1.81 23 18.22 16.86
2.12 - 2.78 2.45 5 19.36 30.41
Итого 100 -18.59 142.09
Эксцесс оценивается с помощью показателя:
Ex=M4s4 - 3
M4 = 142.09/100 = 1.42
Ex=1.420.8584 - 3=2.6213 - 3=-0.38
Проверка гипотез о виде распределения.
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.
K = (fi - f pi)2f pi
где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу 2.3 функции Лапласа
Ф(xi+1-xs) - Ф(xi - xs),
где
s = 0.858, xср = 0.88
Теоретическая (ожидаемая) частота равна fi = fpi, где f = 100
Вероятность попадания в i-й интервал: pi = Ф(x2) - Ф(x1)
Таблица 2.3
xi÷xi+1 fi x1 = (xi - xср)/s x2 = (xi+1 - xср)/s Ф(x1) Ф(x2) pi=Ф(x2)-Ф(x1) Ожид. част., 100pi Слаг. стат. Пирсона, Ki
-1.66 - -1.03 2 -2.945 -2.2144 -0.4985 -0.4868 0.0117 1.17 0.5888
-1.03 - -0.4 5 -2.2144 -1.4839 -0.4868 -0.4319 0.0549 5.49 0.04373
-0.4 - 0.23 15 -1.4839 -0.7533 -0.4319 -0.2764 0.1555 15.55 0.01945
0.23 - 0.86 27 -0.7533 -0.02279 -0.2764 -0.012 0.2644 26.44 0.01186
0.86 - 1.49 23 -0.02279 0.7078 -0.012 0.2611 0.2731 27.31 0.6802
1.49 - 2.12 23 0.7078 1.4383 0.2611 0.4251 0.164 16.4 2.6561
2.12 - 2.78 5 1.4383 2.2036 0.4251 0.4868 0.0617 6.17 0.2219
100 4.222
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = χ2(7-2-1;0.05) = 9.48773; Kнабл = 4.22
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу
. Справедливо предположение о том, что данные выборки имеют нормальное распределение.
Проверка гипотезы о равномерном распределении генеральной совокупности.
Для того чтобы проверить гипотезу о равномерном распределении X,т.е. по закону: f(x) = 1/(b-a) в интервале (a,b)
надо:
1. Оценить параметры a и b - концы интервала, в котором наблюдались возможные значения X, по формулам (через знак ∙ обозначены оценки параметров):
a∙=x - 3σ , b∙=x + 3\sigma
2. Найти плотность вероятности предполагаемого распределения f(x) = 1/(b∙ - a∙)
3. Найти теоретические частоты:
n1 = nP1 = n[f(x)∙(x1 - a∙)] = n∙1/(b∙ - a∙)∙(x1 - a∙)
n2 = n3 = ... = ns-1 = n∙1/(b∙ - a∙)∙(xi - xi-1)
ns = n∙1/(b∙ - a∙)∙(b∙ - xs-1)
4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-3, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.
1. Найдем оценки параметров a∙ и b∙ равномерного распределения по формулам:
a∙=x - 3σ , b∙=x + 3\sigma
a∙=0.88 - 3∙0.858=-0.61, b∙=0.88 + 3∙0.858=2.37
2. Найдем плотность предполагаемого равномерного распределения:
f(x) = 1/(b∙ - a∙) = 1/(2.37 - (-0.61)) = 0.336
3. Найдем теоретические частоты:
n1 = n∙f(x)(x1 - a∙) = 100 ∙ 0.336(-1.03-(-0.61)) = -14.25
Поскольку получилось отрицательное значение, то n1 = 0
n7 = n∙f(x)(b∙ - x6) = 100 ∙ 0.336(2.37-2.12) = 8.27
Остальные ns будут равны:
ns = n∙f(x)(xi - xi-1)
Таблица 2.4
i ni n∙i ni - n∙i (ni - n∙i)2 (ni - n∙i)2/n∙i
1 2 0 2 4
2 5 21.1952 -16.1952 262.2829 12.3747
3 15 21.1952 -6.1952 38.3799 1.8108
4 27 21.1952 5.8048 33.6963 1.5898
5 23 21.1952 1.8048 3.2575 0.1537
6 23 21.1952 1.8048 3.2575 0.1537
7 5 8.2708 -3.2708 10.698 1.2935
Итого 100 17.3761
Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры a и b).
Kkp(4,0.05) = 9.48773; Kнабл = 17.38
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по равномерному закону.
Определение числа групп.
Число групп приближенно определяется по формуле Стэрджесса
n = 1 + 3,2log n = 1 + 3,2log(98) = 7
Ширина интервала составит:
h=xmax - xminn=-0.52 - (-1.5)7=0.14
Результаты группировки оформим в виде таблицы:
Таблица для расчета показателей.
Группы Середина интервала, xцентр Кол-во, fi xi·fi (x-xср)2·fi Относи
тельная частота, fi/f
-1.5 –
-1.36 -1.43 18 -25.74 2.963 0.184
-1.36 –
-1.22 -1.29 18 -23.22 1.271 0.184
-1.22 –
-1.08 -1.15 7 -8.05 0.111 0.0714
-1.08 –
-0.94 -1.01 10 -10.1 0.002 0.102
-0.94 –
-0.8 -0.87 17 -14.79 0.405 0.173
-0.8 –
-0.66 -0.73 14 -10.22 1.212 0.143
-0.66 –
-0.52 -0.59 14 -8.26 2.64 0.143
Итого 98 -100.38 8.604 1
Для оценки ряда распределения найдем следующие показатели:
x = xi∙fifi = -100.3898 = -1.02
𝐷 =(xi - x)2 fifi=8.60498= 0.0878
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).
S2 = (xi - x)2 fifi-1=8.60497= 0.0887
Среднее квадратическое отклонение.
σ=D=0.0878=0.296
Расчет центральных моментов проводим в аналитической таблице:
Группы Середина интервала, xцентр Кол-во, fi (x-xср)3·fi (x-xср)4·fi
-1.5 –
-1.36 -1.43 18 -1.2 0.49
-1.36 –
-1.22 -1.29 18 -0.34 0.09
-1.22 –
-1.08 -1.15 7 -0.014 0.00175
-1.08 –
-0.94 -1.01 10 2.9E-5 0
-0.94 –
-0.8 -0.87 17 0.062 0.00963
-0.8 –
-0.66 -0.73 14 0.36 0.11
-0.66 –
-0.52 -0.59 14 1.15 0.5
Итого 98 0.012 1.19
As = M3/s3
где M3 - центральный момент третьего порядка.
s - среднеквадратическое отклонение.
M3 = 0.0123/98 = 0.000126
As=0.0001260.2963=0.00483
Положительная величина указывает на наличие правосторонней асимметрии
Ex=M4s4 - 3
M4 = 1.19/98 = 0.0122
Ex=0.01220.2964 - 3=1.5777 - 3=-1.42
Ex < 0 - плосковершинное распределение
Проверка гипотез о виде распределения.
1