Протокол отчета решения должен содержать следующие элементы:
Введение. Описывается, что является объектом исследования данной работе. Первичный статистический анализ данных. Оцените характер совокупности исходных данных с помощью средней, моды, медианы, показателей вариации (коэффициента вариации, дисперсии и среднеквадратичного отклонения), коэффициентов асимметрии и эксцесса. Сделайте вывод о характере распределения совокупностей. Необходимо также проинтерпретировать полученные значения в рамках рассматриваемых баз данных.
На уровне значимости 5% проверьте выборку на выбросы с помощью критерия Ирвина. Начертите ящичковую диаграмму. Если есть выбросы, то удалите их.
Определите вариационный ряд. Определите дискретный ряд распределения. Постройте полигон распределения. Определите интервальный ряд распределения. Постройте гистограмму полигон распределения.
Постройте доверительный интервал с надежностью 0,95 для математического ожидания показателя X. Сделайте выводы.
Таблица 1.1 – Исходные данные
№ Жилая площадь квартиры (кв. м)
1 51,40
2 46,00
3 34,00
4 31,00
5 65,00
6 17,90
7 39,00
8 80,00
9 37,80
10 57,00
11 20,00
12 40,00
13 36,90
14 20,00
15 16,90
16 32,00
17 58,00
18 36,00
19 68,00
20 67,50
21 15,30
22 50,00
23 31,50
24 34,80
25 46,00
26 52,30
27 27,80
28 17,30
29 44,50
30 19,10
a0 47,00
b0 280,00
Нужно полное решение этой работы?
Решение
Объектом исследования выступает жилая площадь квартир. Количество выборки – 30 ед.
Оценим характер совокупности исходных данных с помощью средней, моды, медианы, показателей вариации (коэффициента вариации, дисперсии и среднеквадратичного отклонения), коэффициентов асимметрии и эксцесса. Сделайте вывод о характере распределения совокупностей.
Таблица 1.2 – Таблица для расчета показателей
x |x – xср| (x – xср)2
51,40 24.47 598.62
46,00 22.87 522.88
34,00 22.47 504.75
31,00 21.87 478.15
65,00 20.67 427.11
17,90 19.77 390.72
39,00 19.77 390.72
80,00 11.97 143.2
37,80 8.77 76.85
57,00 8.27 68.34
20,00 7.77 60.32
40,00 5.77 33.25
36,90 4.97 24.67
20,00 3.77 14.19
16,90 2.87 8.22
32,00 1.97 3.87
58,00 0.77 0.59
36,00 0.23 0.05
68,00 4.73 22.4
67,50 6.23 38.85
15,30 6.23 38.85
50,00 10.23 104.72
31,50 11.63 135.33
34,80 12.53 157.08
46,00 17.23 296.99
52,30 18.23 332.45
27,80 25.23 636.72
17,30 27.73 769.14
44,50 28.23 797.12
19,10 40.23 1 618.72
Итого – 1 193 Итого – 417.47 Итого – 8 694.91
Простая средняя арифметическая:
м2
Имеются два показателя с одинаковым значением частоты f = 2. Ряд имеет две моды, т.е. является бимодальным.
Медиана – значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Находим середину ранжированного ряда: h = f/2 = 30/2 = 15. Ранжированный ряд включает четное число единиц, следовательно, медиана определяется как средняя из двух центральных значений: (36,90 + 37,80) / 2 = 37,35 м2.
Дисперсия характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Среднее квадратическое отклонение:
Каждое значение ряда отличается от среднего значения 39,77 в среднем на 17.024.
Коэффициент вариации – мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v > 30%, но v < 70%, то вариация умеренная.
Таблица 1.3 – Расчет центральных моментов
x (x – xср)2 (x – xcp)3 (x – xcp)4
15.30 598.62 -14 646.18 358 343.24
16.90 522.88 -11 956.62 273 408.14
17.30 504.75 -11 340.07 254 773.68
17.90 478.15 -10 455.57 228 628.49
19.10 427.11 -8 826.96 182 423.90
20.00 390.72 -7 723.25 152 662.99
20.00 390.72 -7 723.25 152 662.99
27.80 143.2 -1 713.64 20 506.56
31.00 76.85 -673.76 5 906.61
31.50 68.34 -564.93 4 670.05
32.00 60.32 -468.49 3 638.64
34.00 33.25 -191.77 1 105.86
34.80 24.67 -122.52 608.5
36.00 14.19 -53.44 201.29
36.90 8.22 -23.56 67.53
37.80 3.87 -7.61 14.96
39.00 0.59 -0.45 0.35
40.00 0.05 0.01 0.01
44.50 22.40 106.05 501.96
46.00 38.85 242.19 1 509.67
46.00 38.85 242.19 1 509.67
50.00 104.72 1 071.65 10 966.51
51.40 135.33 1 574.39 18 315.41
52.30 157.08 1 968.79 24 675.52
57.00 296.99 5 118.09 88 201.74
58.00 332.45 6 061.75 110 525.96
65.00 636.72 16 066.60 405 413.77
67.50 769.14 21 330.75 591 572.92
68.00 797.12 22 505.39 635 402.07
80.00 1 618.72 65 126.55 2 620 258.04
Итого 8 694.91 64 922.32 6 148 477.01
Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии: As = M3 / s3, где M3 – центральный момент третьего порядка; s – среднеквадратическое отклонение.
M3 = 64 922.32 / 30 = 2 164.08
As = 2 164,08 / 17,0243 = 0,439
Положительная величина указывает на наличие правосторонней асимметрии.
Оценка существенности показателя асимметрии дается с помощью средней квадратической ошибки коэффициента асимметрии
. Если выполняется соотношение |As|/sAs < 3, то асимметрия несущественная, ее наличие объясняется влиянием различных случайных обстоятельств. Если имеет место соотношение |As|/sAs > 3, то асимметрия существенная и распределение признака в генеральной совокупности не является симметричным.
В анализируемом ряду распределения наблюдается несущественная асимметрия (0.439 / 0.405 = 1.08 < 3).
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. Чаще всего эксцесс оценивается с помощью показателя: . Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный (Ex > 0), для более плосковершинных (сплюснутых) - отрицательный (Ex < 0), т.к