Распределение 110 предприятий по стоимости основных производственных фондов ξ (млн. руб.) и стоимости произведенной продукции η (млн. руб.) представлены в таблице:
η
ξ 1525 2535 3545 4555 5565 6575 Итого
515 17 4
21
1525 3 18 3
24
2535
2 15 5
22
3545
3 13 7
23
4555
6 14 20
Итого 20 24 21 18 13 14 n=110
Необходимо:
вычислить групповые средние и , построить эмпирические линии регрессии;
предполагая, что между переменными ξ и η существует линейная корреляционная зависимость:
найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать содержательную интерпретацию полученных уравнений;
вычислить коэффициент корреляции, на уровне значимости оценить его значимость и сделать вывод о тесноте и направлении связи между переменными ξ и η;
используя соответствующее уравнение регрессии, определить среднюю стоимость произведенной продукции, при стоимости основных производственных фондов 45 млн. руб.
Решение
1) Полученные в ходе обследования эмпирические данные представляют собой двумерную выборку, объем которой равен 110. По каждой переменной они представляют собой интервальный вариационный ряд. Для упрощения дальнейшей обработки заменим интервальные вариационные ряды их дискретными аналогами. Для этого каждый интервал разбиения, как по переменной , так и по переменной , будем характеризовать их срединным значением, для этого вычислим середины каждого интервала. Обозначим варианты переменной ξ через , а варианты переменной η через . Получим:
Таблица 2.1
уj
хi 20 30 40 50 60 70 mх
10 17 4
21
20 3 18 3
24
30
2 15 5
22
40
3 13 7
23
50
6 14 20
mу 20 24 21 18 13 14 110
Эмпирическая линия регрессии по η строится по точкам , эмпирическая линия регрессии η по строится по точкам , где – групповые средние, которые вычисляются по формулам:
, .
Найдем групповые средние :
; и т.д.
Зависимость между значениями признака η и групповыми средними называется корреляционной зависимостью на η. Ее можно записать с помощью таблицы:
хi 10 20 30 40 50
21,90 30 41,36 51,74 67
mx 21 24 22 23 20
С помощью аналогичных вычислений находим .
; и т.д.
Корреляционная зависимость η на приведена в таблице:
уj 20 30 40 50 60 70
11,5 19,2 30 37,2 44,6 50
mу 20 24 21 18 13 14
В прямоугольной системе координат строим все точки, которые отвечают парам чисел
. Соседние точки соединяем отрезками прямых. Полученная линия называется эмпирической линией регрессии η на .
Аналогично строим эмпирическую линию регрессии на η.
Вид этих линий позволяет предположить наличие корреляционной зависимости.
2) а) Проведем все необходимые расчеты:
.
1462,727;
0,797
1,117.
Уравнения регрессии на η имеет вид: .
Уравнение регрессии η на имеет вид:
В обозначениях данной задачи переменная η – стоимости произведенной продукции (млн. руб.) – это варианты уj , а переменная ξ – стоимость основных производственных фондов (млн. чел.) – это варианты хi. Поэтому зависимость η от ξ стоимости произведенной продукции от стоимости основных производственных фондов запишем в виде:
Коэффициент регрессии 1,117 показывает, что при увеличении стоимости основных производственных фондов на 1 млн. руб., средняя стоимость произведенной продукции растет в среднем на 1,117 млн. руб.
Уравнение обратной зависимости имеет вид:
.
Оно показывает, на сколько единиц в среднем нужно изменить переменную для того, чтобы увеличить переменную η на 1 единицу