Имеются следующие данные о выработке литья на одного работающего Х1(T), браке литья Х2 (%) и себестоимости 1 т литья Y (руб.) по литейным цехам заводов (табл. 4):
Таблица 4. Исходные данные
Х1 8 7 10 9 9 8 7 7
Х2 9 12 11 9 9 10 8 8
у 16 12 10 7 8 6 15 15
Необходимо:
а) найти уравнение множественной регрессии Y по X1 и X2;
б) оценить значимость этого уравнения и его коэффициентов на уровне α=0,05;
в) сравнить раздельное влияние на зависимую переменную каждой из объясняющих переменных, используя стандартизованные коэффициенты регрессии и коэффициенты эластичности;
г) найти 95%-ные доверительные интервалы для коэффициентов регрессии, а также для среднего и индивидуальных значений себестоимости 1 т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья – 5%.
Решение
С помощью пакета Анализ данных – Регрессия MS Excel найдем коэффициенты уравнения множественной регресси (рис. 5)
Рис. 5. Результаты регрессионного анализа
Модель множественной регрессии имеет вид:
Y=31,729-1,886х1-0,556х2
На основании величины показателя множественной корреляции (0,615) можно сделать вывод о заметной и прямой взаимосвязи между Себестоимостью 1 т литья и рассматриваемыми факторами.
Согласно значению коэффициента множественной детерминации (0,378) можно утверждать, что факторы, включенные в модель, позволяют на 37,8% объяснить вариацию Себестоимости 1 т литья.
Поскольку Значимость F <5%, то вероятность статистической незначимости коэффициента детерминации мала, и с надежностью 95% полученную модель множественной линейной регрессии можно считать статистически значимой.
Значимость коэффициентов регрессии оценим по столбцу P-значение. В случаях, когда p>0,05 коэффициент может считаться нулевым, это означает, что влияние соответствующей независимой переменной на зависимую переменную y недостоверно, и эта независимая переменная может быть исключена из модели.
В нашем случае оба коэффициента оказались «нулевыми», а значит обе независимые переменные не влияют на модель.
Средние частные коэффициенты эластичности Эyxi показывают, на сколько процентов от значения своей средней y изменяется результат при изменении фактора xi на 1% от своей средней xi и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии.
Средние коэффициенты эластичности для каждого фактора рассчитаем по соответствующей формуле:
(28)
Отсюда:
Эyx1=-1,886*8,12511,125=-1,38%
Эyx2=-0,556*9,511,125=-0,47%
С увеличением выработки литья х1 на 1% от ее среднего уровня себестоимость 1 т литья сокращается на 1,38 % от своего среднего уровня; при увеличении барка литья х2 на 1% себестоимость 1 т литья у сокращается на 0,47% от своего среднего уровня.
По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у признака фактора х1 чем признака фактора х2: 1,38% против 0,47%.
Вычислим стандартизованные βi коэффициенты по формулам:
(29)
(30)
Здесь среднеквадратические отклонения вычисляются по формулам:
(31)
β1=-1,886*1,0533,689=-0,54
β2=-0,556*1,3233,689=-0,20
Анализ βi показывает, что на себестоимость 1 т литья наибольшее влияние из двух исследуемых факторов с учетом уровня их вариации способен оказать фактор x1 – выработка литья на одного работающего, так как ему соответствует наибольшее (по абсолютной величине) значение β -коэффициента.
95-% доверительные интервалы для коэффициентов регрессии составляют:
a: от -0,323 до 63,781
b1: от -5,145 до 1,374
b2: от -3,151 до 2,039.
Определим прогнозное значение y при x1=40 т и х2=5%.
y=31,729-1,886*40-0,556*5=46,48 руб