Из генеральной совокупности извлечена выборка, которая представлена в виде интервального вариационного ряда.
а) Предполагая, что генеральная совокупность имеет нормальное распределение, построить доверительный интервал для математического ожидания с доверительной вероятностью γ=0,95.
б) Вычислить коэффициенты асимметрии и эксцесса, используя упрощенный метод вычислений, и сделать соответствующие предположения о виде функции распределения генеральной совокупности.
в) Используя критерий Пирсона, проверить гипотезу о нормальности распределения генеральной совокупности при уровне значимости α=0,05.
x 500-550 550-600 600-650 650-700 700-750 750-800
n 12 24 51 61 33 14
Решение
Нередко от интервального распределения выборки бывает удобно перейти к точечному (дискретному) распределению, взяв за новые выборочные значения признака середины частичных интервалов. В рассматриваемой задаче такое распределение, очевидно, имеет вид следующей таблицы:
x 525 575 625 675 725 775
n 12 24 51 61 33 14
Важнейшими числовыми характеристиками признака X являются, как известно, математическое ожидание, дисперсия и среднее квадратичное отклонение (с.к.o.). Точечными статистическими оценками этих параметров служат соответственно выборочное среднее x, выборочная дисперсия σx2=σn2 и исправленная выборочная дисперсия σn-12=s2, выборочное с.к.o.
σx=σn и исправленное выборочное с.к.o. σn-1=s , которые вычисляются по формулам:
x=1ni=1kxini
σx2=1ni=1kxi-x2ni
x2=1ni=1kxi2ni
σx2=x2-x2
s2=nn-1*σx2
s=s2; σx=σx2
где xi- выборочные значения (варианты) признака X
n- объем выборки
ni- частоты этих значений
По приведенным выше формулам вычислим точечные статистические оценки генеральных параметров распределения признака X , используя при этом данные из таблицы:
x 525 575 625 675 725 775 ∑
n 12 24 51 61 33 14 195
Находим выборочное среднее:
x=1ni=1kxini=1195525*12+575*24+625*51+675*61+725*33+775*14=656.03
Находим выборочную дисперсию, используя универсальную формулу ее вычисления σx2=x2-x2. Имеем:
x2=1ni=1kxi2ni=11955252*12+5752*24+6252*51+6752*61+7252*33+7752*14=434419.87
σx2=x2-x2=434419.87-656.032=4044.5091
Находим исправленную выборочную дисперсию:
s2=nn-1*σx2=195195-1*4044.5091≈4065.36
Находим выборочное с.к.о. и исправленное выборочное с.к.о.:
σx=σx2=4044.5091≈63.596
s=σn-1=4065.36≈63.76
Доверительный интервал (в котором с вероятностью γ будет находиться средняя генеральной совокупности) для нормально распределенной случайной величины с известными квадратичным отклонением σ, выборочной средней xB и объемом выборки n равен
xB-t*σn; xB+t*σn
где t – решение уравнения 2Фt=γ, а Фt- функция Лапласа, значения которой приведены в таблице Лапласа.
В нашем случае Фt=γ2=0.952=0.475
. По таблице Лапласа находим, что этому значению Фt соответствует t=1.96. Тогда доверительный интервал будет равен:
656.03-1.96*63.596195;656.03+1.96*63.596195
647.104;664.956
В этом интервале с вероятностью γ=0.95 будет находиться средняя генеральной совокупности.
б) Найдем значение коэффициента асимметрии и эксцесса:
AX=μ3σx3
Ek=μ4σx4-3
μ3=x-x3*nin
μ4=x-x4*nin
Упрощенный метод вычислений заключается в построении вспомогательной таблицы:
x n xini
x-x3
x-x3*ni
x-x4
x-x4*ni
525 12 6300 -2249635,844 -26995630,1 294769784,604 3537237415
575 24 13800 -532031,709 -12768761 43110529,358 1034652705
625 51 31875 -29877,574 -1523756,26 927101,113 47282156,8
675 61 41175 6826,561 416420,2377 129499,867 7899491,91
725 33 23925 328080,696 10826662,98 22627725,622 746714946
775 14 10850 1683884,831 23574387,64 200331778,377 2804644897
∑=3900 195 127925
-6470676,54 561896418,9 8178431611
μ3=-6470676.54195=-33182.96
μ4=8178431611195=41940674.9
AX=-33182.9663.5963=-0.129
Ek=41940674.963.5964-3=-0.436
Отрицательный эксцесс свидетельствует о том, что имеет место более или менее равномерное распределение величин интересующей нас случайной величины.
в) Пусть непрерывная случайная величина (признак) X представлена выборкой значений в виде интервального распределения, причем известны выборочное среднее x и исправленное выборочное с.к.о