Необходимо обобщить и проанализировать данные контрольной работы.
Построить вариационный ряд исследуемого признака (по возрастанию значений признака);
Определить частоту появления каждого значения признака 𝑓𝑖;
Определить относительную частоту появления каждого признака (статистический вес) 𝑤𝑖;
Определить среднюю арифметическую взвешенную вариационного ряда 𝒙̅ и квадрат средней;
Определить дисперсию вариационного ряда 𝐷𝑥;
Найти среднее квадратичное отклонение 𝜎𝑥;
Показать, что выполняется среднее квадратичное всегда больше квадрата средней;
Найти моду 𝑀0 и медиану 𝑀𝑒;
Найти коэффициент вариации ;
Построить график распределения значений вариационного ряда;
178181051625500Сравнить функцию распределения вариационного ряда с функцией нормального распределения,
оценив степень асимметрии и степень эксцесса , а также среднюю квадратичную
ошибку эксцесса .
Оценить сколько значений признака попадает в интервал ±, сколько − в интервал ± 2 , сколько – в интервал ±3.
Сделать вывод о том, можно ли отнести данное в задании эмпирическое распределение к типу кривых нормального распределения.
Вариант I.
В ходе изучения нового гипотензивного препарата в качестве одного их критериев его эффективности изучалась длительность лечения больных гипертонической болезнью III стадии в стационаре. Приведены результаты изучения сроков лечения больных гипертонической болезнью III стадии в стационаре N (в днях):
18, 25, 32, 21, 30, 25, 25, 28, 23, 25, 21, 30, 28, 25, 23, 18, 25, 32, 21, 23, 25, 28, 23, 25, 28, 30, 32, 28, 23, 30, 23.
Решение
Расположим данные в порядке возрастания:
18,18, 21, 21, 21, 23, 23, 23, 23, 23, 23, 25, 25, 25, 25, 25, 25, 25, 25, 28, 28, 28, 28, 28, 30, 30, 30, 30, 32, 32, 32 – это вариационный ряд.
2. Представим данный ряд в виде таблицы (с учетом повторений) и в порядке возрастания значений признака, получим ранжированный вариационный ряд.
Таблица 1 – Ранжированный вариационный ряд распределения больных гипертонической болезнью III стадии в стационаре по длительности лечения
xi
18 21 23 25 28 30 32 Σ
fi
2 3 6 8 5 4 3 31
Sf
2 5 11 19 24 28 31
xi– значение признака (длительность лечения в днях);
fi- его частота (количество больных).
Sf-накопленные частоты.
Сумма всех частот значений признака равна объему выборки:
fi=2+3+6+8+5+4+331.
3. Определим относительную частоту появления каждого признака (статистический вес) 𝑤𝑖.
wi=nin, где n- объем выборки.
Дискретный статистический ряд запишем в виде таблицы.
xi
18 21 23 25 28 30 32 Σ
wi
0,1 0,1 0,2 0,3 0,2 0,1 0,1 1
Определим среднюю арифметическую взвешенную вариационного ряда x и квадрат средней
x=xififi=18·2+21·3+23·6+25·8+28·5+30·4+32·32+3+6+8+5+4+3=79331=25,6 дн.
Определим квадраты всех вариант
xi
18 21 23 25 28 30 32 Σ
xi2
324 441 529 625 784 900 1024 4627
xi2fi
648 1323 3174 5000 3920 3600 3072 20737
i=1nxi2=324+441+529+625+784+900+1024=4627
i=1nxi2fi=648+1323+3174+5000+3920+3600+3072=20737
Определим дисперсию вариационного ряда 𝐷𝑥;
Dx=xi-x²fifi=18-25,62·2+21-25,62·3+23-25,62·6+25-25,62·8++28-25,62·5+30-25,62·4+32-25,62·32+3+6+8+5+4+3==451,5631=14,6
Находим среднее квадратичное отклонение 𝜎𝑥;
σx=Dx=14,6=3,8 дн.
Каждое значение ряда отличается от среднего значения 25,6 в среднем на 3,8 дней.
Среднее квадратическое отклонение всегда больше среднего линейного отклонения
. Между ними имеется такое соотношение:
σ=d π2=d·1,25
d=18-25,6·2+21-25,6·3+23-25,6·6+25-25,6·8++28-25,6·5+30-25,6·4+32-25,6·32+3+6+8+5+4+3=98,231=3,2
Таким образом σ=d·1,25=3,2·1,25=4 (3,8≈4).
8. Найдем моду 𝑀0 и медиану 𝑀𝑒;
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 25 (f = 8). Следовательно, мода равна 25 дней.
Mo=25 дн. Большинство больных находились в стационаре в среднем 25 дней.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота Sf будет > ∑f/2 = 19. Это значение xi = 25. Таким образом, медиана равна: Me=25 дн. То есть, половина больных находились в стационаре в среднем до 25 дней, вторая половина – больше 5 дней.
9. Коэффициент вариации определяется по формуле:
CV=σx∙100%=3,825,6∙100=14,8%.
Вывод. Коэффициент вариации 14,8%, что < 30%, свидетельствует о том, что совокупность больных является однородной, а вариация слабая. Полученным результатам можно доверять.
10. Распределение значений вариационного ряда изобразим графически с помощью полигона частот (рис.1).
Рисунок 1 – Полигон распределения частот
11. Сравним функцию распределения вариационного ряда с функцией нормального распределения.
Рассчитаем коэффициент асимметрии Пирсона, характеризующий асимметрию только в центральной части распределения, т.е. основной массы единиц, и независящие от крайних значений признака по формуле:
g=x -Moσ=25,6-253,8=0,158
Коэффициента асимметрии 0,158 свидетельствует о наличии правосторонней асимметрии