Распределение 60 предприятий по затратам рабочего времени ξ (тыс. чел. дней) и выпуску продукции η (млн. руб.) представлено в таблице:
ξ
η 30-40 40-50 50-60 60-70 70-80 Итого
10-25 1 3 2
6
25-40 3 6 4 1
14
40-55
3 7 6 1 17
55-70
1 6 4 4 15
70-85
2 5 1 8
Итого 4 13 21 16 6 60
Необходимо:
вычислить групповые средние и , построить эмпирические линии регрессии;
предполагая, что между переменными ξ и η существует линейная корреляционная зависимость:
найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
вычислить коэффициент корреляции, на уровне значимости оценить его значимость и сделать вывод о тесноте и направлении связи между переменными ξ и η;
используя соответствующее уравнение регрессии, оценить средний выпуск продукции предприятия с затратами рабочего времени 55 тыс. чел. дней.
Решение
Преобразуем исходные данные и представим в виде корреляционной таблицы. Для этого вычислим середины каждого интервала. Обозначим варианты переменной ξ через , а варианты переменной η через . Получим:
Таблица 6.1
хi
уj 35 45 55 65 75 mу
17,5 1 3 2 6
32,5 3 6 4 1 14
47,5 3 7 6 1 17
62,5 1 6 4 4 15
77,5 2 5 1 8
mx 4 13 21 16 6 n=60
Эмпирическая линия регрессии η по строится по точкам , эмпирическая линия регрессии по η строится по точкам , где – групповые средние, которые вычисляются по формулам:
, .
Найдем групповые средние :
28,75;
и т.д.
Зависимость между значениями признака и групповыми средними называется корреляционной зависимостью η на . Ее можно записать с помощью таблицы:
хi 35 45 55 65 75
28,75 34,81 48,93 59,69 62,50
mx 4 13 21 16 6
С помощью аналогичных вычислений находим .
Корреляционная зависимость на η приведена в таблице:
уj 17,5 32,5 47,5 62,5 77,5 17,5
46,67 47,14 57,94 62,33 63,75 46,67
mу 6 14 17 15 8 6
В прямоугольной системе координат строим все точки, которые отвечают парам чисел . Соседние точки соединяем отрезками прямых. Полученная линия называется эмпирической линией регрессии η на .
Аналогично строим эмпирическую линию регрессии на η.
Вид этих линий позволяет предположить наличие корреляционной зависимости
.
Значения хi и уj в таблице заданы с равноотстоящими вариантами с шагом h1 = 10 для и с шагом h2 = 15 для η, поэтому для упрощения расчетов можно перейти к условным вариантам u и v по формулам:
,
где С1 и С2 – это такие значения х и у, которые стоят приблизительно в середине вариационного ряда и имеют самую большую частоту. В данном случае выбираем С1 = 55, С2 = 47,5, тогда
Получаем новую корреляционную таблицу:
u
v -2 -1 0 1 2 nv
-2 1 3 2 6
-1 3 6 4 1 14
0 3 7 6 1 17
1 1 6 4 4 15
2 2 5 1 8
nu 4 13 21 16 6 n=60
Проведем все необходимые расчеты:
.
Коэффициент корреляции rв рассчитываем по формуле :
0,598.
Получаем: 0 < |rв| <1, то есть Х и Υ – зависимые случайные величины, причем чем ближе |rв| к единице, тем ближе зависимость между и η к линейной зависимости. Для оценки тесноты линейной связи используется шкала Чеддока:
Таблица 6.2
Шкала Чеддока
Оценка Характеристика линейной связи
очень слабая
слабая
умеренная
заметная
сильная (высокая)
весьма сильная
В данном случае = 0,598, теснота линейной связи между факторами и η заметная, а так как величина положительная, то связь прямая