Привести постановку задачи построения линейной регрессионной модели. Выбрать эндогенную переменную. Сделать предположения относительно знаков (положительный или отрицательный) параметров модели.
Исследование взаимосвязи данных показателей с помощью диаграммы рассеяния и коэффициента корреляции
Оценить коэффициент корреляции между объясняемой и объясняющей переменными. Проанализировать тесноту и направление связи между исследуемыми показателями и сделать вывод о возможности построения линейной модели парной регрессии
2. Оценка параметров модели парной регрессии
Оценить параметры модели с помощью:
с помощью функции ЛИНЕЙН.
Выпишите полученное уравнение регрессии. Дайте экономическую интерпретацию параметрам модели регрессии
3. Оценивание качества спецификации модели
Проверьте статистическую значимость регрессии в целом. Проверьте статистическую значимость оценок параметров. Оцените точность модели с помощью средней относительной ошибки аппроксимации. Сделайте выводы о качестве уравнения регрессии.
4. Проверка адекватности модели
Опишите процедуру и приведите результаты проверки адекватности модели, выбрав последнее наблюдение в качестве контрольного уровня.
5. Проверка предпосылки теоремы Гаусса-Маркова о гомоскедастичности случайных возмущений
Выполнить визуальный анализ гетероскедастичности с помощью графика. Привести поверку при помощи теста: Голдфельда-Квандта. Сделать выводы. При необходимости предложить вариант корректировки гетероскедастичности.
6. Проверка предпосылки теоремы Гаусса-Маркова об отсутствии автокорреляции случайных возмущений
Выполнить визуальный анализ автокорреляции остатков с помощью графика. Привести результаты тестирования на отсутствие автокорреляции случайных возмущений с помощью теста Дарбина -Уотсона. Сделать выводы. При необходимости предложить вариант корректировки автокорреляции.
7. Построение модели множественной регрессии, учитывающей сезонные колебания.
Введите необходимое количество фиктивных переменных, характеризующих степень влияния каждого квартала в отдельности. Постройте многофакторную модель динамики объясняющей переменной. Оцените качество и значимость модели и отдельных ее параметров. Поясните экономический смысл параметров при фиктивных переменных сдвига при исследовании сезонных колебаний.
8. Прогнозирование экзогенной переменной модели множественной регрессии
Использовать построенную многофакторную модель с фиктивными переменными для прогнозирования эндогенной переменной на ближайший квартал.
9. Представить результаты моделирования и прогнозирования в графическом формате
Решение
1. Построение спецификации эконометрической модели
Этап спецификации. Построение спецификации эконометрической модели (подробное описание объекта исследования), т.е. представление экономических зависимостей в математической форме. Необходимо выбрать эндогенную переменную. Сделать предположения относительно знаков (положительный или отрицательный) параметров модели на основе данных (исходной экономической информации).
Необходимо исследовать, как влияет Индекс реальной зарплаты на Индекс реального ВВП. Обозначим переменные:
Х - Индекс реальной зарплаты, экзогенная переменная
Y - Индекс реального ВВП, эндогенная переменная (результирующая)
Судя по экономическому смыслу переменных можно предположить наличие прямой линейной связи, знак параметра при переменной Х предполагаем положительным.
Исследование взаимосвязи данных показателей с помощью диаграммы рассеяния и коэффициента корреляции
Для создания диаграммы рассеяния нужно выделить два столбца данных со значениями показателей, включая их названия (метки) в первой строке матрицы данных, и выполнить следующие действия: на вкладке «Вставка» в группе «Диаграммы» выбрать тип диаграммы «Точечная», диаграмма добавится на лист.
Для того чтобы Microsoft Excel правильно определил переменные, объясняемая переменная Y должна быть расположена в правом из двух выделенных столбцов, а объясняющая переменная Х – в левом столбце.
Построим график диаграммы рассеяния зависимой переменной с экзогенным фактором.
Рис.1. Диаграмма рассеяния.
Вывод: Вытянутость облака точек на диаграмме рассеяния вдоль наклонной прямой позволяет сделать предположение, что существует некоторая объективная тенденция прямой линейной связи между значениями переменных x и y, т.е. в среднем, с увеличением Индекса реальной зарплаты, в среднем увеличивается Индекс реального ВВП.
Вычисление коэффициента корреляции
Чтобы вычислить корреляцию средствами Excel, можно воспользоваться функцией =КОРРЕЛ( ):
Оценим значимость коэффициента корреляции. Для этого рассчитаем значение t – статистики по формуле:
6,13.
Критическое значение t – статистики Стьюдента получим с помощью
функции СТЬЮДЕНТ.ОБР.2Х пакета Excel. В качестве аргументов функции
необходимо задать число степеней свободы равное n-2 (в нашем примере 39-
2=37) и значимость α (в нашем примере α равно 0,05). Если фактическое значение t – статистики, взятое по модулю больше критического, то с
вероятностью (1- α ) коэффициент корреляции значимо отличается от нуля.
11,01 2,03, коэффициент корреляции значимо отличается от нуля.
Вывод: Индекс реальной зарплаты оказывает весьма высокое влияние на Индекс реального ВВП, связь прямая.
2
. Оценка параметров модели парной регрессии
Применим в Excel функцию ЛИНЕЙН:
Полученное уравнение показывает, что с увеличением Индекса реальной зарплаты на 1, в среднем Индекс реального ВВП увеличивается на 0,369.
График построенной линейной регрессии на фоне корелляционного поля:
3. Оценивание качества спецификации модели
Проверим статистическую значимость регрессии в целом.
При анализе качества модели регрессии, в первую очередь, используется коэффициент детерминации, который определяется следующим образом:
0,504
Коэффициент детерминации показывает долю вариации (дисперсии) ре- зультативного признака, находящегося под воздействием изучаемых факторов, то есть определяет, какая доля вариации признака y учтена в модели и обуслов- лена влиянием на него факторов, включенных в модель. В данном случае эта доля составляет 50,4%.
Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый по формуле:
37,61
Критическое (табличное) значение F – статистики равно 4,1.
Расчетное значение больше табличного, значит оцененная регрессия в целом статистически значима
Проверим статистическую значимость оценок параметров.
Применяем критерий Стьюдента для проверки значимости параметров модели.
Критическое (табличное) значение t – статистики = 2,03
Оценки среднего квадратического отклонения (ско) оценок параметров получены выше:
С учетом этих значений границы доверительных интервалов параметров модели равны:
Значимость оценок параметров проверяется при помощи неравенства
Таким образом, регрессоры, включённые в спецификацию модели статистически значимо влияют на эндогенную переменную и вся модель в целом признается качественной.
Оценим точность модели с помощью средней относительной ошибки аппроксимации
5,51%.
Значение не превышает 8%, точность высокая.
В целом модель признается качественной по всем критериям.
4. Оценивание адекватности модели
Проведем проверку адекватности модели регрессии индекса реального ВВП РФ на индекс реальной зарплаты, выбрав последнее наблюдение в качестве контрольного уровня.
Алгоритм проверки адекватности модели состоит из следующих шагов:
1) результаты наблюдений разделяют на две части: обучающую (90-95% наблюдений) и контролирующую (оставшиеся наблюдения) выборки;
2) по обучающей выборке выполняется оценка (настройка) модели методом наименьших квадратов;
3) по оцененной модели строится прогноз значений эндогенной переменной из контролирующей выборки и доверительные интервалы для их истинных значений.
4) выполняется проверка: если значения из контролирующей выборки накрываются доверительным интервалом – модель признается адекватной, в противном случае, подлежит доработке