Даны две выборки:1) 8.7, 8.1, 7.5, 8.9, 13.9, 15.8, 16.5, 6.7, 1.2, 13, 17.5, 6.2, 7.1, 15.8, 8.2, 17.1, 9.9, 9.7, 4.5, 15.5, 7.6, 2.1, 8.9, 16.5, 2.72) 26.2, 12.8, 7.6, 5.7, 9.5, 8.3, 22.5, 22.5, 4.2, 12.7, 8.1, 9.7, 19.3, 5.5, 14.9, 8.5, 12.6, 21, 9.5, 9.2, 3.3, 6.2, 13, 11.9, 11.2
Для первой выборки необходимо построить доверительные интервалы для мат ожидания, считая дисперсию а - неизвестной, б - равной единице.
Для второй выборки необходимо построить доверительные интервалы для дисперсии, считая мат ожидание а - неизвестным и б - равной 10.
И третье: проверить гипотезы:
о нормальности первой выборки
о независимости выборок
об однородности выборок
о равенстве средних значений выборок
Решение
А) Построение доверительных интервалов для математического ожидания, считая дисперсию неизвестной
Нам нужно сделать построение доверительного интервала для математического ожидания генеральной совокупности при неизвестной дисперсии.
С вероятностью P=95% (надежностью) можно утверждать, что искомое выборочное среднее принадлежит интервалу:
(X-S∙τεn-1; X+S∙τεn-1 )(1)
где
X - выборочное среднее (математическое ожидание генеральной совокупности);
S – выборочное стандартное отклонение (среднее квадратичное отклонение);
n - объем выборки;
- двустороння критическая распределения Стьюдента (T-распределения) с n-1 степенью свободы уровня доверия ε (ε=1-P= 1-0,95= 0,05)
Дисперсия выборки D= S2, выборочное стандартное отклонение (среднее квадратичное отклонение) S=D.
Расчет ведем в Excel.
Выборочное среднее X = СРЗНАЧ(B2:B26)= 9,98
Дисперсия D= ДИСП.В(B2:B26) =24,71
Выборочное стандартное отклонение (Среднее квадратичное отклонение) S= КОРЕНЬ(D) или СТАНДОТКЛОН.В(B2:B26) = 4,97
Двусторонняя критическая распределения Стьюдента = СТЬЮДЕНТ.ОБР(0,95;24)=1,711
Все вводные данные нам теперь известны, можем рассчитать доверительный интервал по формуле (1):
(9,98-4,97*1,71124; 9,98+4,97*1,71124 ) или (8,25;11,72)
Доверительный интервал для математического ожидания генеральной совокупности при неизвестной дисперсии составляет (8,25;11,72).
1б) Построение доверительных интервалов для математического ожидания, считая дисперсию равной единице
Построение доверительного интервала для математического ожидания генеральной совокупности при известном стандартном отклонении δ=1.
(X-σ∙tεn; X+σ∙tεn )(2)
где
X - выборочное среднее (математическое ожидание генеральной совокупности);
δ – генеральное стандартное отклонение (среднее квадратичное отклонение);
n - объем выборки;
t - квантиль стандартного нормального распределения уровня доверия 1 - /2
ε=1-P= 1-0,95= 0,05
Расчет ведем в Excel.
Выборочное среднее X = СРЗНАЧ(B2:B26)= 9,98
Среднее квадратичное отклонение δ=1
Уровень доверия стандартного нормального распределения 1 - /2=1-0,05/2=0,975
Обратное значение стандартного нормального распределения t = =НОРМ.СТ.ОБР(0,975)=1,960
Все вводные данные нам теперь известны, можем рассчитать доверительный интервал по формуле (2):
(9,98-1*1,96025; 9,98+1*1,96025 ) или (9,59;10,38)
Доверительный интервал для математического ожидания генеральной совокупности при известном стандартном отклонении δ=1 составляет (9,59;10,38).
Сведем наши расчеты доверительных интервалов для математического ожидания в (Табл. 1).
Таблица 1 – Выборка и расчет доверительных интервалов для математического ожидания
j хj
1 1,2
2 2,1
3 2,7
4 4,5
5 6,2
6 6,7
7 7,1
8 7,5
9 7,6
10 8,1
11 8,2
12 8,7
13 8,9
14 8,9
15 9,7
16 9,9
17 13,0
18 13,9
19 15,5
20 15,8
21 15,8
22 16,5
23 16,5
24 17,1
25 17,5
Расчет точечных данных и интервалов
Выборочное среднее (X_) 9,98
Дисперсия (S2) 24,71
Выборочное стандартное отклонение (S) 4,97
Двусторонняя критическая распределения Стьюдента (τε) 1,711
Диапазон а) 8,248
11,720
Дисперсия (δ2) 1
Квантиль стандартного нормального распределения уровня доверия 1 - ε/2 (tε) 1,960
Диапазон б) 9,592
10,376
2a) Построение доверительных интервалов для дисперсии, считая математическое ожидание неизвестным
Границы доверительного интервала для дисперсии S2 при неизвестном математическом ожидании:
(n∙S2τε+;n∙S2τε-),(3)
где
S2– дисперсия выборки;
n - объем выборки;
+, - - односторонние критические точки распределения хи-квадрат с (n-1) степенью свободы уровня доверия ε/2 и 1-ε/2 соответственно.
Расчет ведем в Excel.
Дисперсия S2= ДИСП.В(B2:B26) =37,73
Односторонняя критическая точка распределения хи-квадрат с (n-1) степенью свободы уровня доверия ε/2 + = ХИ2.ОБР(0,025;24)=12,40
Односторонняя критическая точка распределения хи-квадрат с (n-1) степенью свободы уровня доверия 1-ε/2 - = ХИ2.ОБР(0,975;24)=39,36
Все вводные данные нам теперь известны, можем рассчитать доверительный интервал по формуле (3):
(25*37,7339,36; 25*37,7312,40 ) или (23,96;76,06)
Доверительный интервал для дисперсии, считая математическое ожидание неизвестным, составляет (23,96; 76,06) с надежностью 95%, т. е. этот интервал
покрывает дисперсию (параметр S2) с надежностью 95%.
2б) Построение доверительных интервалов для дисперсии, считая мат ожидание равным 10
Границы доверительного интервала для дисперсии S2 при известном математическом ожидании α:
(n∙S2(α)tε+;n∙S2(α)tε-),(4)
где
S2(α)– дисперсия выборки с известным математическим ожиданием α;
n - объем выборки;
t+, t- - односторонние критические точки распределения хи-квадрат с n степенями свободы уровня доверия ε/2 и 1-ε/2 соответственно.
При этом вычисление дисперсии (S2(α)) при известном математическом ожидании выборки α делается по формуле:
S2(α) =1n j=1n(xj-α)2,(5)
где
α –математическое ожидание выборки;
n –объем выборки;
xj – элемент выборки.
Расчет ведем в Excel
.
Сумма j=1n(xj-α)2 =989,83
Дисперсия S2=989,83/25 =39,59
Односторонняя критическая точка распределения хи-квадрат с n степенями свободы уровня доверия ε/2 + = ХИ2.ОБР(0,025;25)=13,12
Односторонняя критическая точка распределения хи-квадрат с n степенями свободы уровня доверия 1-ε/2 - = ХИ2.ОБР(0,975;25)=40,65
Все вводные данные нам теперь известны, можем рассчитать доверительный интервал по формуле (3):
(25*39,5940,65; 25*39,5913,12 ) или (24,35;75,45)
Доверительный интервал для дисперсии при известном математическом ожидании α =10 составляет (24,35; 75,45) с надежностью 95%, т. е. этот интервал покрывает дисперсию (параметр S2) с надежностью 95%.
Сведем наши расчеты доверительных интервалов для дисперсии в (Табл. 2).
Таблица 2 – Выборка и расчет доверительных интервалов для дисперсии
j хj
хj-α (хj-α)2
1 3,3 -6,70 44,89
2 4,2 -5,80 33,64
3 5,5 -4,50 20,25
4 5,7 -4,30 18,49
5 6,2 -3,80 14,44
6 7,6 -2,40 5,76
7 8,1 -1,90 3,61
8 8,3 -1,70 2,89
9 8,5 -1,50 2,25
10 9,2 -0,80 0,64
11 9,5 -0,50 0,25
12 9,5 -0,50 0,25
13 9,7 -0,30 0,09
14 11,2 1,20 1,44
15 11,9 1,90 3,61
16 12,6 2,60 6,76
17 12,7 2,70 7,29
18 12,8 2,80 7,84
19 13,0 3,00 9,00
20 14,9 4,90 24,01
21 19,3 9,30 86,49
22 21,0 11,00 121,00
23 22,5 12,50 156,25
24 22,5 12,50 156,25
25 26,2 16,20 262,44
сумма 989,83
Расчет точечных данных и интервалов
Параметр Значение
Дисперсия (S2) 37,73
Односторонняя критическая точка распределения хи-квадрат с (n-1) степенью свободы уровня доверия ε/2 (τε+) 12,40
Односторонняя критическая точка распределения хи-квадрат с (n-1) степенью свободы уровня доверия 1-ε/2 (τε-) 39,36
Диапазон а) 23,96
76,06
Математическое ожидание (α) 10,00
Дисперсия (S2(α)) 39,59
Односторонняя критическая точка распределения хи-квадрат с n степенями свободы уровня доверия ε/2 (tε+) 13,12
Односторонняя критическая точка распределения хи-квадрат с n степенями свободы уровня доверия 1-ε/2 (tε-) 40,65
Диапазон б) 24,35
75,45
3а) Проверка гипотезы о нормальности первой выборки
Сгруппируем нашу выборку по 5 интервалам. В каждом из полученных 5 интервалов проведем подсчет количества наблюдений (ni) исходного распределения выборки, попавших в эти интервалы (Табл. 3).
Таблица 3- Группировка 1-й выборки
xi
Границы интервалов xi
Количество наблюдений ni
zi-1 zi
1,2 0 4 3
2,1 0 4
2,7 0 4
4,5 4 8 6
6,2 4 8
6,7 4 8
7,1 4 8
7,5 4 8
7,6 4 8
8,1 8 12 7
8,2 8 12
8,7 8 12
8,9 8 12
8,9 8 12
9,7 8 12
9,9 8 12
13,0 12 16 5
13,9 12 16
15,5 12 16
15,8 12 16
15,8 12 16
16,5 16 20 4
16,5 16 20
17,1 16 20
17,5 16 20
25
Решение о принятии или отвержении гипотезы принимается после вычисления статистики (χ2):
χ2 =i=1k(ni-n∙pi)2n∙pi,(6)
где
n – объем выборки;
ni – количество наблюдений в i-м интервале;
pi - теоретическая вероятность попадания в i-й интервал.
Теоретическая вероятность попадания в i-й интервал (pi):
pi = F((zi-Xср)/S)- F((zi-1-Xср)/S),(7)
где
zi-1,zi – границы i-го интервала;
Xср – среднее значение выборки х;
S – среднеквадратическое отклонение выборки x.
F(y) - интегральная функция распределения случайной величины y, вероятность того, что случайная величина окажется меньше нижней границы заданного интервала.
Сведем расчет χ2 – статистики согласно формул (7) и (6) в (Табл. 4).
Таблица 4 – Расчет χ2 – статистики
Границы интервалов xi
Количество наблюдений ni
Промежуточный. расчет параметров Интегральная функция распределения на границах интервалов Вероятность попадания в i-й интервал (pi), к6-к7 ni-npi
(ni-npi)2 /npi
zi-1 zi
(zi-Xср)/S (zi-1-Xср)/S Ф(к1) Ф(к2)
1 2 3 4 5 6 7 8 9 10
0 4 3 -1,20 -2,01 0,1143 0,0223 0,0920 0,70 0,21
4 8 6 -0,40 -1,20 0,3449 0,1143 0,2306 0,24 0,01
8 12 7 0,41 -0,40 0,6575 0,3449 0,3126 -0,81 0,08
12 16 5 1,21 0,41 0,8869 0,6575 0,2294 -0,74 0,09
16 20 4 2,01 1,21 0,9780 0,8869 0,0911 1,72 1,30
Итого 25 0,9557 1,70
Среднее (X ср) 9,98
Ср