Построение модели множественной регрессии
Осуществите анализ матрицы парных корреляций на предмет мультиколлинеарности.
Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель множественной регрессии. Дайте экономическую интерпретацию коэффициентов модели регрессии.
Осуществите проверку выполнения предпосылок МНК.
Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, - и - коэффициентов.
Постройте (по лучшей модели) прогноз результативного признака, если предположить, что значения факторных признаков увеличатся относительно средних значений на 10 %.
Внесите рекомендации по совершенствованию управления процессом (организацией).
Решение
Осуществим анализ матрицы парных корреляций на предмет мультиколлинеарности.
Результаты корреляционного анализа
Так как значения коэффициентов парной корреляции между факторными признаками, взятые по модулю, меньше величины 0,8, то явление мультиколлинеарности отсутствует, и, следовательно, все факторные признаки можно включать в модель множественной регрессии.
Используя пошаговую множественную регрессию (метод исключения или метод включения), построим модель множественной регрессии. Дайте экономическую интерпретацию коэффициентов модели регрессии.
Выше на основе анализа матрицы корреляции и значений частныхкоэффициентов корреляции был сделан вывод о том, что мультиколлинеарность факторов отсутствует и в модель в первую очередьдолжен быть включен фактор х1. И была так же построена регрессионную модель показателя доллара США с помощью инструмента Регрессия, включающая в качестве факторной только переменную х1.
Попытаемся улучшить модель, введя в модель фактор х2. Результатымоделирования будут следующие:
Рис.4. Вывод итогов регрессии
На основании полученных данных можно записать уравнение множественной регрессии
Y= 31,535 – 0,238 ∙X1 + 0,193 ∙X2
Оценим качество построенной модели множественной регрессии по следующим направлениям:
Коэффициент детерминации = 0,930 достаточно стремится к 1, следовательно, качество модели можно признать высоким.
Все параметры модели значимы при уровне значимости 0,01 и 0,05.
Критерий Фишера F = 60,15 > Fтабл = 4,2565 , следовательно, уравнение регрессии признается статистически значимым и может быть использовано для анализа и прогнозирования экономических процессов.
Попытаемся еще улучшить модель, введя в модель фактор х3. Результаты моделирования будут следующие:
Рис.5. Вывод итогов регрессии
На основании полученных данных можно записать уравнение множественной регрессии
Y= 31,454 – 0,212 ∙X1 + 0,207 ∙X2 – 0,024 ∙X3
Оценим качество построенной модели множественной регрессии по следующим направлениям:
Коэффициент детерминации = 0,932 достаточно стремится к 1, следовательно, качество модели можно признать высоким.
Критерий Фишера F = 36,47 > Fтабл = 4,066 , следовательно, уравнение регрессии признается статистически значимым и может быть использовано для анализа и прогнозирования экономических процессов.
Наиболее приемлемой в нашем примере является модель множественной регрессии с включенными факторами Х1 и Х2. Только в этом случае значимы коэффициенты регрессии и коэффициент детерминации, прогнозные качества модели достаточно высоки.
Осуществите проверку выполнения предпосылок МНК.
а) Проверка равенства математического ожидания остаточной последовательности нулю
.
Вычислим среднее значение ряда остатков.
.
Так как , то модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего.
б) Проверка свойства гомоскедастичности
Расположим значения факторного признака в порядке возрастания.
Разделим совокупность наблюдений на две группы и для каждой группы с помощью программы Анализ данных в EXCEL, функция ЛИНЕЙН определим параметры уравнений регрессий и остаточные суммы квадратов.
Таблица 4
Расчётные значения
Уравнение регрессии Остаток
1 группа
2 группа
Расчетный критерий равен: .
Табличное значение F-критерия с и степенями свободы и при доверительной вероятности 0,95 равно 19.
Величина не превышает табличное значение F-критерия, следовательно, свойство гомоскедастичности выполняется.
в) Проверку независимости последовательности остатков (отсутствие автокорреляции) осуществим с помощью d-критерия Дарбина -Уотсона.
.
Расчетное значение критерия сравнивается с нижним и верхним критическими значениями статистики Дарбина-Уотсона. При n=12 и уровне значимости 5%, , .
Рис. 3. Множество возможных значений статистики .
Поскольку , то нет возможности определить автокорреляцию, требуются дополнительные исследования.
г) Случайные отклонения должны быть независимы от объясняющих переменных.
Так как , то
д) Проверку соответствия распределения остаточной последовательности нормальному закону распределения осуществим с помощью R/S-критерия. формуле:
.
Расчетное значение R/S-критерия сравнивается с табличными значениями (нижней и верхней границами данного отношения).
Нижняя и верхняя границы отношения при уровне значимости равны соответственно 2,67 и 3,57.
Расчетное значение отношения попадает в интервал между критическими границами, следовательно, с заданным уровнем значимости гипотеза о нормальности распределения принимается.
Оценим качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, - и - коэффициентов.
Оценим качество построенной модели множественной регрессии с помощью коэффициентов эластичности, - и - коэффициентов.
Коэффициент эластичности определяется:
, (1)
где - среднее значение соответствующего факторного признака,
- среднее значение результативного признака.
bi – коэффициенты регрессии соответствующих факторных признаков.
ß-коэффициент определяется по следующей формуле:
, (2)
где - среднеквадратическое отклонение (СКО) соответствующего факторного признака (рассчитывается как корень квадратный из дисперсии признака),
- СКО результативного признака.
∆-коэффициент определяется по следующей формуле:
, (3)
где - коэффициент парной корреляции результативного и соответствующего факторного признаков,
- коэффициент детерминации