Линейный множественный регрессионный анализ
Имеются следующие данные о курсе доллара , фондовом индексе и котировке акций за 10 дней
40,75 38,7 39,54 42,9 41,88 37,35 38,98 30,1 39,05 39,9
4,2 3,8 4,4 5,1 4,9 4,2 4,6 4,3 4,6 4,24
110 115 105 106 109 104 115 103 108 109
Провести линейный множественный регрессионный анализ. Проверить значимость модели. Проверить модель на мультиколлинеарность. Спрогнозируйте котировку акций, если курс доллара составит 36 руб., а значение фондового индекса равно 5,2.
Решение
Построим уравнение множественной регрессии с помощью инструмента «Регрессия» пакета «Анализ данных»
Получим решение:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,465077
R-квадрат 0,216297
Нормированный R-квадрат -0,00762
Стандартная ошибка 31,49248
Наблюдения 10
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 2 1916,066 958,0331 0,965977 0,426119
Остаток 7 6942,434 991,7763
Итого 9 8858,5
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 280,534 142,5081 1,968547 0,089683 -56,4442 617,5121 -56,4442 617,5121
х1
-0,56591 3,332984 -0,16979 0,869978 -8,44716 7,315346 -8,44716 7,315346
х2
-36,0874 30,79584 -1,17183 0,279601 -108,908 36,73317 -108,908 36,73317
Уравнение множественной регрессии имеет вид:
Y=280,534 - 0,566х1 -36,0874 х2
Множественный коэффициент корреляции R=0,465
Коэффициент детерминации R2=0,216
Связь между показателем Y и факторами Х высокая
Скорректированный коэффициент детерминации
R2=1-1-R2*n-1n-m-1=-0,00762
Значимость коэффициентов уравнения регрессии
Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 280,534 142,5081 1,968547 0,089683
>0,05 Значимость коэффициента не подтверждается
х1
-0,56591 3,332984 -0,16979 0,869978
>0,05 Значимость коэффициента не подтверждается
х2
-36,0874 30,79584 -1,17183 0,279601
>0,05 Значимость коэффициента не подтверждается
Проверим значимость уравнения в целом с помощью критерия Фишера
Табличное значение Fкрит по таблице значений F-критерия Фишера
при α = 0,05, k1 = m = 2 и k2 = n – m – 1 = 10 – 2 – 1 = 7 равно 4,74 (m – число параметров при переменной х).
df
SS MS F Значимость F
Регрессия 2 1916,066 958,0331 0,965977 0,426119
Остаток 7 6942,434 991,7763
Итого 9 8858,5
Fрасч=0,966 < Fкрит=4,74 , то коэффициент детерминации статистически не значим, уравнение регрессии статистически не надежно.
На основе матрицы коэффициентов корреляции проверим наличие мультиколлинеарности
х1
х2
у
х1
1
х2
0,430784 1
у -0,25012 -0,46159 1
В матрице нет межфакторного коэффициента корреляции >0,7