Исследование влияния стоимости основных производственных фондов на производительность труда
На основе статистических данных представленных ниже, численно оценить зависимость между стоимостью основных производственных фондов (X) и производительностью труда (Y) (Таблица 1, Таблица 2).
Требуется:
Построить на графике диаграмму рассеяния (корреляционное поле)
Построить линейное уравнение парной регрессии и дать интерпретацию составленного уравнения
Вычислить среднюю ошибку аппроксимации A и дать словесное истолкование этого показателя
Вычислить стандартную ошибку регрессии Se и дать словесное истолкование этого показателя
Вычислить коэффициент корреляции r и дать словесное истолкование этого показателя
Вычислить коэффициент детерминации D и дать словесное истолкование этого показателя
Построить на основе исходных данных нелинейные регрессии, добавив на график экспоненциальную, логарифмическую, степенную и полиномиальную линию тренда
Дать сравнительную характеристику нелинейных регрессий (экспоненциальной, логарифмической, степенной и полиномиальной)
Предприятие Стоимость основных производственных фондов, млн. руб. Производительность труда (тонн/сутки)
Предприятие 1 2,1 22,1
Предприятие 2 2,3 23,5
Предприятие 3 2,9 24,6
Предприятие 4 3,3 25,9
Предприятие 5 3,8 27
Предприятие 6 4,8 29,6
Предприятие 7 5 30,2
Предприятие 8 6,2 33
Предприятие 9 6,7 34,6
Предприятие 10 6,8 35,3
Решение
Построим на графике диаграмму рассеяния (корреляционное поле)
Анализируя полученное изображение поля корреляции можно сделать вывод о том, что точки располагаются вдоль некоторой прямой линии, достаточно плотно, рассеиваясь около неё. Можно предположить, что связь между производительностью труда и стоимостью основных производственных фондов линейная, положительная, достаточно тесная.
Построим линейное уравнение парной регрессии и дадим интерпретацию составленного уравнения
Для расчета параметров a и b линейного уравнения регрессии составим систему нормальных уравнений относительно a и b:
Для определения следующих данных: , , , , , составим вспомогательную таблицу
x y x2 y2 x • y
2,1 22,1 4,41 488,41 46,41
2,3 23,5 5,29 552,25 54,05
2,9 24,6 8,41 605,16 71,34
3,3 25,9 10,89 670,81 85,47
3,8 27 14,44 729 102,6
4,8 29,6 23,04 876,16 142,08
5 30,2 25 912,04 151
6,2 33 38,44 1089 204,6
6,7 34,6 44,89 1197,16 231,82
6,8 35,3 46,24 1246,09 240,04
Сумма 43,9 285,8 221,05 8366,08 1329,41
Для наших данных система уравнений имеет вид
Домножим уравнение (1) системы на (-4,39), получим систему, которую решим методом алгебраического сложения.
Откуда b = 2,639, a = 16,997
Уравнение регрессии:
С увеличением стоимости основных производственных фондов на 1 млн
. руб. производительность труда увеличивается в среднем на 2,639 тонн/сутки.
Вычислим среднюю ошибку аппроксимации A и дадим словесное истолкование этого показателя
Для оценки качества параметров регрессии построим расчетную таблицу:
x y y(x) (yi-ycp)2 (y-y(x))2 |y - yx|:y
2,1 22,1 22,538 41,99 0,192 2,1
2,3 23,5 23,065 25,806 0,189 2,3
2,9 24,6 24,649 15,84 0,00236 2,9
3,3 25,9 25,704 7,182 0,0384 3,3
3,8 27 27,023 2,496 0,00054 3,8
4,8 29,6 29,662 1,04 0,00382 4,8
5 30,2 30,19 2,624 0,00011 5
6,2 33 33,356 19,536 0,127 6,2
6,7 34,6 34,675 36,24 0,00564 6,7
6,8 35,3 34,939 45,158 0,13 6,8
Сумма 43,9 285,8 285,8 197,916 0,688 43,9
Найдем величину средней ошибки аппроксимации , которая показывает среднее отклонение расчетных значений от фактических. Допустимый предел ее значений 8-10%.
В среднем, расчетные значения отклоняются от фактических на 0.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Вычислим стандартную ошибку регрессии Se и дадим словесное истолкование этого показателя
;
- необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии).
Стандартная ошибка регрессии рассматривается в качестве меры разброса данных наблюдений от смоделированных значений