По исходным данным, представленным в таблице 1, составить два ряда распределения – один дискретный, другой интервальный. По каждому ряду выполнить группировку данных, определить абсолютные, относительные и интегральные частоты, определить средние арифметические и структурные величины, показатели вариации. Сделать обоснованные выводы о качественных особенностях ряда и проиллюстрировать результаты графиками (гистограмма и кумулята для интервального ряда, полигон и кумулята для дискретного ряда). Ручные расчеты дополнить данными, полученными с помощью надстройки «Описательная статистика» пакета Microsoft Excel (Файл – параметры - надстройки – анализ данных – описательная статистика), выявить и пояснить причины расхождения полученных результатов.
Таблица 1
Данные обследования рабочих строительного треста
Порядковый номер рабочего % выполнения норм в январе Число членов семьи
1 2 3
60 123 1
61 159 4
62 100 1
63 190 3
64 199 3
65 139 1
66 190 4
67 83 1
68 98 1
69 139 2
70 85 1
71 146 3
72 183 4
73 90 1
74 146 2
75 95 1
76 110 1
77 113 1
78 113 2
79 111 2
80 110 1
81 128 1
82 128 2
83 169 3
84 190 5
85 190 3
86 190 3
87 127 2
88 80 1
89 140 2
90 87 1
91 106 1
92 123 1
93 189 2
94 180 2
95 168 2
96 120 2
97 144 3
98 139 2
99 132 1
Решение
Составим дискретный ряд в таблице 1.1 по признаку «число членов семьи» для этого выделим уникальные значения числа членов семьи и посчитаем число их повторений.
Таблица 1.1 – Дискретный ряд
Число членов семьи Число рабочих, чел. В % к итогу Накопленная частота (S), чел.
1 17 42,5 17
2 12 30,0 29
3 7 17,5 36
4 3 7,5 39
5 1 2,5 40
Всего 40 100,0
Далее для расчетов составим таблицу 1.2.
Таблица 1.2 – Промежуточные расчеты по дискретному ряду
Число членов семьи (xi) Число рабочих (fi) xi*fi
1 17 17 -0,975 16,575 16,161
2 12 24 0,025 0,3 0,007
3 7 21 1,025 7,175 7,354
4 3 12 2,025 6,075 12,302
5 1 5 3,025 3,025 9,151
Всего 40 79 - 33,15 44,975
Среднее определим по формуле средней арифметической взвешенной:
чел.
Модой () называется значение признака, имеющее наибольшую частоту. То есть для данного ряда это 1 чел.
Медианой является 2 чел., так как половина суммы частот 20, а накопленная частота впервые превышает эту величину для второй варианты.
Размаха вариации:
R=Xmax - Xmin.
R=5-1=4 чел.
Среднее линейное отклонение:
чел.
Дисперсия:
.
Среднее квадратическое отклонение:
чел.
Коэффициентом осцилляции:
Относительное линейное отклонение:
Коэффициент вариации:
Таким образом, среднее число членов семьи составляет 2 чел. Совокупность неоднородна, так как коэффициент вариации более 33%
. В среднем отклонения числа членов семьи от среднего значения составляет 1 чел. или 53,7%. Больше всего членов семьи состоят из 1 чел., в половине семей человек менее 2, а в другой половине более.
Полигон и кумулята представлены на рисунках 1.1 и 1.2.
Рис. 1.1 – Полигон
Рис. 1.2 – Кумулята
По результатам анализа в Microsoft Excel с помощью описательной статистики имеем данные с рисунка 3.
Рис.3 – Результаты анализа по числу членов семьи
Видно, что мода, медиана и среднее не отличается. Видно, что различается дисперсия и среднее квадратическое отклонение, так как расчет нами производился по сгруппированным данным с использованием частот, а программой по исходным.
Для составления интервального ряда по выполнению нормы выработки рассчитаем число групп по формуле Стерджесса:
k=1+3,322lgN,
N – число единиц совокупности.
k=1+3,322lg (40) =6,32=6 групп.
Ширину интервала определим по формуле:
,
где хmax – максимальное значение признака;
хmin – минимальное значение признака;
k – количество групп.
Далее в таблице 1.3 формируем группы по правилу: нижняя граница первой группы – минимальное значение признака, остальных групп – верхняя граница предыдущей группы. Верхняя граница – это нижняя граница + ширина интервала и подсчитываем число рабочих в каждой группе.
Таблица 1.3 – Интервальный ряд
% выполнения норм в январе
Число рабочих, чел