Имеются данные о степени износа основных средств 22 предприятий и инвестициях в основные фонды (табл. 21).
Таблица 21. Данные об износе ОФ и инвестициях
Период Степень износа основных средств, % Инвестиции в основные фонды, млн. р.
1 39,4 266974
2 40,6 375958
3 42,2 408797
4 41,9 407086
5 42,4 670439
6 45,8 1165234
7 47,9 1504523
8 49,5 1360284
Установите форму зависимости и тесноту связи между степенью износа и инвестициями в основные фонды. Оцените значимость параметров уравнения регрессии и коэффициента корреляции. Сделайте выводы.
Решение
Построение уравнения регрессии
Примем следующие обозначения:
х – степень износа основных средств, %;
у – инвестиции в основные фонды, млн. р.
Построим график зависимости y = f(x) в прямоугольной системе координат:
Характер расположения точек на графике показывает, что связь между переменными может выражаться линейным уравнением регрессии:
y = a + bx
Параметры уравнения регрессии находим методом наименьших квадратов. Для этого строим вспомогательную таблицу регрессионного анализа
№ х y y*x x2
y2
1 39,4 266974 10518775,6 1552,36 71275116676
2 40,6 375958 15263894,8 1648,36 141344417764
3 42,2 408797 17251233,4 1780,84 167114987209
4 41,9 407086 17056903,4 1755,61 165719011396
5 42,4 670439 28426613,6 1797,76 449488452721
6 45,8 1165234 53367717,2 2097,64 1357770274756
7 47,9 1504523 72066651,7 2294,41 2263589457529
8 49,5 1360284 67334058 2450,25 1850372560656
Итого 349,7 6159295 281285847,7 15377,23 6466674278707
Среднее значение 43,713 769912 35160730,96 1922,15375 808334284838
σ 3.372 464295.154
σ2
11.37 215569989572
Рассчитаем параметры линейного уравнения парной регрессии yx=a+b⋅x.
Для этого воспользуемся формулами
b=covx, yσx2=x⋅y-x⋅yx2-x2=35160730,96-43,7125⋅7699121922,15375-43.71252=132436.9;
a=y-b⋅x=769912-132436.9⋅43.7125=-5019237.
Получили уравнение: yx=-5019237+132436.9⋅x.
Выборочные дисперсии:
Среднеквадратическое отклонение
Оценка тесноты связи между степенью износа и инвестициями в основные фонды
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции rxy для линейной регрессии (–1 ≤ rxy ≤ 1) по следующей формуле:
rxy=b⋅σxσy
rxy=132436.9⋅3.372464295.154=0,962.
Близость коэффициента корреляции к 1 указывает на тесную линейную связь между признаками
. В нашем примере связь между признаком y и фактором x весьма высокая и прямая.
Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент детерминации rxy2 (для линейной регрессии).
Коэффициент детерминации – квадрат коэффициента или индекса корреляции. Для оценки качества построенной модели регрессии можно использовать показатель (коэффициент, индекс) детерминации R2 либо среднюю ошибку аппроксимации.
Чем выше показатель детерминации или чем ниже средняя ошибка аппроксимации, тем лучше модель описывает исходные данные.
Коэффициент детерминации rxy2=0,925 показывает, что уравнением регрессии объясняется 92,5% дисперсии результативного признака, а на долю прочих факторов приходится лишь 7,5%.
Средняя ошибка аппроксимации – среднее относительное отклонение расчетных значений от фактических.
A=1,4618*100%=18,26%
В среднем, расчетные значения отклоняются от фактических на 18.26%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.
Оценка значимости уравнения регрессии, его коэффициентов, коэффициента детерминации
Оценка значимости всего уравнения регрессии в целом осуществляется с помощью F-критерия Фишера