Дана выборка в виде интервальной таблицы частот. Найти точечные оценки: среднее, дисперсию (смещенную и несмещенную), моду и медиану.
Граница интервала 1-5 5-9 9-13 13-17 17-21 21-25 25-29
Частота 5 8 4 12 3 14 7
Решение
Важнейшими числовыми характеристиками признака X являются, как известно, математическое ожидание, дисперсия и среднее квадратичное отклонение (с.к.o.). Точечными статистическими оценками этих параметров служат соответственно выборочное среднее x, выборочная дисперсия (Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего)), σx2=σn2 и исправленная выборочная дисперсия (Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия)), которые вычисляются по формулам:
x=1n*i=1kxini
σx2=1n*i=1kxi-x2ni
или
σx2=x2-x2
x2=1n*i=1kxi2ni
s2=nn-1*σx2
где xi- выборочные значения (варианты) признака X, ni- частоты этих значений, n – объем выборки.
По приведенным выше формулам вычислим точечные статистические оценки генеральных параметров распределения признака X
. Составим расчетную таблицу для удобства вычислений:
Граница интервала Середина интервала, xi
ni
xini
xi2ni
1-5 3 5 15 45
5-9 7 8 56 392
9-13 11 4 44 484
13-17 15 12 180 2700
17-21 19 3 57 1083
21-25 23 14 322 7406
25-29 27 7 189 5103
∑ 53 863 17213
Находим выборочное среднее:
x=1ni=1kxini=86353=16.28
Находим выборочную дисперсию, используя универсальную формулу ее вычисления σx2=x2-x2. Имеем:
x2=1ni=1kxi2ni=1721353=324.77
σx2=x2-x2=324.77-16.282=59.7316
Находим исправленную выборочную дисперсию:
s2=nn-1*σx2=5353-1*59.7316≈60.88
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Mo=x0+h*n2-n1n2-n1+n2-n3где x0 – начало модального интервала; h – величина интервала; n2 –частота, соответствующая модальному интервалу; n1 – предмодальная частота; n3 – послемодальная частота.
Выбираем в качестве начала интервала 21, так как именно на этот интервал приходится наибольшее количество.
Mo=21+4*14-314-3+14-7=23,44
Наиболее часто встречающееся значение ряда – 23,44
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к