Распределение магазинов района по размеру торговой площади:
Торговая площадь магазинов, кв.м. Число магазинов
1500-2000 4
2000-2500 7
2500-3000 13
3000-3500 11
3500-4000 8
4000-4500 2
Итого 45
Постройте график вариационного ряда
Вычислите:
Характеристики центра распределения: среднее значение варьирующего признака, моду, медиану.
Показатели вариации: размах вариации, дисперсию и среднее квадратическое отклонение, коэффициент вариации.
Коэффициент асимметрии.
Сделайте письменный вывод по каждому показателю, рассчитанному в п.2.
Решение
Таблица для расчета показателей.
Группы
Середина интервала, xцентр
Кол-во, ni
xi * ni
Накопленная частота, S |x - xср|*ni
(x - xср)2*ni
Относительная частота, ni/n
1500 - 2000 1750 4 7000 4 4800 5760000 0.0889
2000 - 2500 2250 7 15750 11 4900 3430000 0.156
2500 - 3000 2750 13 35750 24 2600 520000 0.289
3000 - 3500 3250 11 35750 35 3300 990000 0.244
3500 - 4000 3750 8 30000 43 6400 5120000 0.178
4000 - 4500 4250 2 8500 45 2600 3380000 0.0444
Итого
45 132750 24600 19200000 1
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Средняя взвешенная (выборочная средняя)
EQ \x\to(x) = \f(∑xi • ni;∑ni) = \f(132750;45) = 2950
Мода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
EQ Mo = x0 + h \f(n2 - n1; (n2 - n1) + (n2 - n3))
где x0 – начало модального интервала; h – величина интервала; n2 –частота, соответствующая модальному интервалу; n1 – предмодальная частота; n3 – послемодальная частота.
Выбираем в качестве начала интервала 2500, так как именно на этот интервал приходится наибольшее количество.
EQ Mo = 2500 + 500 \f( 13 - 7; (13 - 7) + (13 - 11)) = 2875
Наиболее часто встречающееся значение ряда – 2875
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 2500 - 3000, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
EQ Me = x0 + \f(h;nme) \b( \f( ∑ni;2) - Sme-1 )
EQ Me = 2500 + \f(500;13) \b( \f( 45;2) - 11 ) = 2942.31
Таким образом, 50% единиц совокупности будут меньше по величине 2942.31
.
В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ≈ xср-Mo
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = xmax - xmin = 4500 - 1500 = 3000
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
EQ d = \f(∑|xi - \x\to(x)| • ni;∑ni) = \f(24600;45) = 546.67
Каждое значение ряда отличается от другого в среднем на 546.67
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
EQ D = \f(∑(xi - \x\to(x))2 ni;∑ni) = \f(19200000;45) = 426666.667
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).
EQ S2 = \f(∑(xi - \x\to(x))2 ni;∑ni-1) = EQ \f(19200000;44) = 436363.636
Среднее квадратическое отклонение.
EQ σ = \r(D) = \r(426666.667) = 653.197
Каждое значение ряда отличается от среднего значения 2950 в среднем на 653.197
Оценка среднеквадратического отклонения.
EQ s = \r(S2 ) = \r(436363.636) = 660.578
Относительные показатели вариации.
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
EQ v = \f(σ;\x\to(x)) = \f(653.197;2950)100% = 22.14%
Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.
Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.
EQ Kd = \f(d;\x\to(x)) = \f(546.67;2950)100% = 18.53%
Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней