Группировка статистических данных, статистическое изучение взаимосвязи явлений
На основании данных таблицы 1 по указанным признакам:
Произведите группировку рабочих, разделив их на 4 группы. Охарактеризуйте каждую группу и совокупность в целом средними и суммарными значениями по каждому показателю.
Рассчитайте количественную оценку связи между признаками, определите аналитическое выражение связи, изобразите графически фактические и теоретические значения признаков. Сделайте выводы об отсутствии или наличии взаимосвязи между признаками.
Таблица 1 - Данные о промышленно-производственном персонале компании «Астра» по состоянию на 01.09.2015 г.
№ п/п Возраст, лет Стаж работы, лет Дневная выработка, штук Выполнение норм выработки, % Тарифный разряд Зарплата, тыс.руб./мес.
1 19 1 28 99 3 4,2
2 21 1 35 101 4 4,5
3 39 20 68 98 6 7,2
4 41 20 65 100 5 6,6
5 27 9 55 120 5 5,55
6 40 20 65 115 6 7,5
7 24 6 45 100 3 4,5
8 47 25 68 125 5 7,2
9 32 14 55 110 5 5,4
10 22 2 40 112 3 4,5
11 29 13 56 105 5 5,55
12 26 5 48 108 4 4,8
13 34 12 50 120 4 5,25
14 44 20 65 100 5 6,6
15 20 1 42 95 4 4,65
16 22 1 40 112 3 4,5
17 24 2 42 95 4 4,8
18 46 26 70 80 6 8,4
19 45 25 70 102 6 8,4
20 36 17 60 123 4 5,4
21 37 18 55 95 4 5,1
22 35 18 71 105 6 9
23 46 25 60 110 5 7,5
24 44 25 70 105 6 9
25 44 25 62 99 6 7,8
Вариант 5. Дневная выработка и заработная плата.
Решение
Произведите группировку рабочих, разделив их на 4 группы.
Определим ширину интервала по формуле:
h=(Xmax-Xmin)/n, где
Xmax – максимальное значение признака;
Xmin – минимальное значение признака;
n – количество групп.
h=(71-28)/4=10,75≈11
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию. (таблица 1.1).
Таблица 1.1 – Сортировка ряда по возрастанию
№ п/п Дневная выработка, штук Зарплата, тыс.руб./мес.
1 28 4,2
2 35 4,5
10 40 4,5
16 40 4,5
15 42 4,65
17 42 4,8
7 45 4,5
12 48 4,8
13 50 5,25
5 55 5,55
9 55 5,4
21 55 5,1
11 56 5,55
20 60 5,4
23 60 7,5
25 62 7,8
4 65 6,6
6 65 7,5
14 65 6,6
3 68 7,2
8 68 7,2
18 70 8,4
19 70 8,4
24 70 9
22 71 9
Построим аналитическую группировку и представим ее в таблице 1.2.
Таблица 1.2 – Аналитическая группировка
Дневная выработка, шт. Кол-во работников, чел. ∑Общая дневная выработка Среднедневная выработка, шт./чел. Общая з/п, тыс. руб./мес. Средняя з/п, тыс. руб./мес. на чел.
28 - 39 2 63 31.5 8.7 4.35
39 - 50 6 257 42.83 27.75 4.63
50 - 61 7 391 55.86 39.75 5.68
61 - 72 10 674 67.4 77.7 7.77
Итого 25 1385
153,9
Наибольшее количество работников имеет дневную выработку в пределах 61-72 шт. – 10 человек. Их среднедневная выработка составляет 67,4 шт./чел., средняя заработная плата работников данной группы составляет 7,77 тыс
. руб. в месяц.
7 работников имеет дневную выработку в пределах 50-61 шт. Их среднедневная выработка составляет 55,86 шт./чел., средняя заработная плата работников данной группы составляет 5,68 тыс. руб. в месяц.
6 работников имеет дневную выработку в пределах 39-50 шт. Их среднедневная выработка 42,83 шт./чел., средняя заработная плата работников данной группы составляет 4,63 тыс. руб. в месяц.
Наименьшее количество работников имеет дневную выработку в пределах 28-39 шт. – 2 человека. Их среднедневная выработка составляет 31,5 шт./чел., средняя заработная плата работников данной группы составляет 4,35 тыс. руб. в месяц.
Для определения наличия связи между дневной выработкой и заработной платой работников составим уравнение регрессии методом наименьших квадратов.
Система нормальных уравнений.
a·n + b·∑x = ∑y
a·∑x + b·∑x2 = ∑y·x
Для расчета параметров регрессии построим расчетную таблицу 1.3
Таблица 1.3 – Расчетная таблица для уравнения регрессии
x y x2 y2 x * y
28 4.2 784 17.64 117.6
35 4.5 1225 20.25 157.5
40 4.5 1600 20.25 180
40 4.5 1600 20.25 180
42 4.65 1764 21.6225 195.3
42 4.8 1764 23.04 201.6
45 4.5 2025 20.25 202.5
48 4.8 2304 23.04 230.4
50 5.25 2500 27.5625 262.5
55 5.55 3025 30.8025 305.25
55 5.4 3025 29.16 297
55 5.1 3025 26.01 280.5
56 5.55 3136 30.8025 310.8
60 5.4 3600 29.16 324
60 7.5 3600 56.25 450
62 7.8 3844 60.84 483.6
65 6.6 4225 43.56 429
65 7.5 4225 56.25 487.5
65 6.6 4225 43.56 429
68 7.2 4624 51.84 489.6
68 7.2 4624 51.84 489.6
70 8.4 4900 70.56 588
70 8.4 4900 70.56 588
70 9 4900 81 630
71 9 5041 81 639
∑1385 153.9 80485 1007.1 8948.25
Для наших данных система уравнений имеет вид:
25a + 1385·b = 153.9
1385·a + 80485·b = 8948.25
Домножим уравнение (1) системы на (-55.4), получим систему, которую решим методом алгебраического сложения.
-1385a -76729 b = -8526.06
1385*a + 80485*b = 8948.25
Получаем:
3756*b = 422.19
Откуда b = 0.1124
Теперь найдем коэффициент «a» из уравнения (1):
25a + 1385*b = 153.9
25a + 1385*0.1124 = 153.9
25a = -1.78
a = -0.0712
Получаем эмпирические коэффициенты регрессии: b = 0.1124, a = -0.0712
Уравнение регрессии принимает вид:
y = 0,1124 x -0.0712
Рассчитаем коэффициент парной корреляции по формуле:
Для этого рассчитаем выборочные средние по формулам:
x=1385/25=55,4
y=153,9/25=6,156
xy=8948,25/25=357,93
Рассчитаем выборочные дисперсии по формулам:
S2(x)=80485/25-55,42=150,24
S2(y)=1007,1/25-6,1562=2,39
Рассчитаем среднеквадратическое отклонение по формулам:
S(x)=150,24=12,257
S (y)=2,39=1,545
Подставим результаты расчетов в формулу парной корреляции и получим:
rxy=(357,93-55,4*6,156)/(12,257*1,545)=0,892
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными).
Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между заработной платой работников (yi) и дневной выработкой (xi) высокая и прямая, так как коэффициент парной корреляции принимает положительное значение.
Определим коэффициент детерминации по формуле:
R2= (rxy)2
R2=(0,892)2=0,796
Значение коэффициент детерминации означает, что в 79,6% случаев изменение дневной выработки работников (хi) приводит к изменению заработной платы (yi)