Проверить наличие аномальных наблюдений, используя метод Ирвина (α=5%).
Построить линейную модель временного ряда yt=a+b∙t, параметры которой оценить МНК. Пояснить смысл коэффициента регрессии.
Оценить адекватность посторенной модели на основе предпосылок теоремы Гаусса-Маркова.
Оценить качество модели, используя среднюю относительную погрешность аппроксимации, критерий Фишер и коэффициент детерминации.
Осуществить прогнозирование рассматриваемого показателя на год вперед (прогнозный интервал рассчитать при доверительной вероятности 70%).
Представить графически фактические значения показателя, результаты моделирования и прогнозирования.
Провести расчет параметров логарифмического, полиномиального (полином 2-й степени), степенного, экспоненциального и гиперболического трендов. На основании графического изображения и значения индекса детерминации выбрать наиболее подходящий вид тренда.
Составить уравнения нелинейной регрессии (гиперболической; степенной; показательной) По каждой модели: привести графики построенных уравнений регрессии; найти средние относительные ошибки аппроксимации, коэффициенты детерминации и коэффициенты эластичности. По этим характеристикам сравнить нелинейные модели между собой и сделать вывод.
Лучшую нелинейную модель сравнить с лучшей линейной моделью.
С помощью лучшей нелинейной модели осуществить точечное прогнозирование рассматриваемого показателя на год вперед. Сопоставить полученный результат с доверительным прогнозным интервалом, построенным при использовании линейной модели.
год Y6
2000 125,2
2001 126,1
2002 118,7
2003 152,2
2004 154,6
2005 156,2
2006 162,5
2007 171,1
2008 198,5
2009 223,1
2010 215,2
2011 229,6
Решение
Проверим наличие аномальных наблюдений.
Проверим наличие аномальных наблюдений с помощью критерия Ирвина:
Рассчитываем коэффициенты анормальности наблюдений (критерий Ирвина):
, ,
Если превышает табличное значение, то уровень считается аномальным и такие наблюдения нужно исключить из временного ряда и заменить их расчетными значениями (например, среднее из соседних значений). Рассчитаем коэффициенты критерия Ирвина:
, ,
Табличное значение критерия Ирвина при , .
Так как имеется одно значения критерия Ирвина которое равно табличному значению, значит, уровни можно принять не аномальным и их не следует удалить из рассмотрения.
Построить линейную модель Y(t) = a0 + a1t, параметры которой оценить МНК. Пояснить смысл коэффициента регрессии.
Построим линейную модель регрессии Y от t. Для проведения регрессионного анализа выполните следующие действия:
Выберите команду Сервис Анализ данных.
В диалоговом окне Анализ данных выберите инструмент Регрессия, а затем щелкните на кнопке ОК.
В диалоговом окне Регрессия в поле Входной интервал Y введите адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х введите адрес диапазона, который содержат значения независимой переменной t Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
Выберите параметры вывода. В данном примере Новая рабочая книга.
В поле График подбора поставьте флажок.
В поле Остатки поставьте необходимые флажки и нажмите кнопку ОК.
Результат регрессионного анализа содержится в нижеприведенных таблицах (табл. 1 и 0)
Таблица 1
Переменная Коэффициенты Стандартная ошибка t-статистика
Y-пересечение a0 101,9530303 6,70332835 15,20931468
t a1 10,37902098 0,910802969 11,39546239
Таблица 2.
ВЫВОД ОСТАТКА
Наблюдение Предсказанное Y Остатки
1 112,3320513 12,86794872
2 122,7110723 3,388927739
3 133,0900932 -14,39009324
4 143,4691142 8,730885781
5 153,8481352 0,751864802
6 164,2271562 -8,027156177
7 174,6061772 -12,10617716
8 184,9851981 -13,88519814
9 195,3642191 3,135780886
10 205,7432401 17,35675991
11 216,1222611 -0,922261072
12 226,5012821 3,098717949
Во втором столбце табл. 1 содержатся коэффициенты уравнения регрессии a0, a1.
Кривая роста зависимости объемов платежей от сроков (времени) имеет вид:
.
Оценить адекватность посторенной модели на основе предпосылок теоремы Гаусса-Маркова.
Выполнение предпосылок МНК может проверяться с помощью R/S – критерия
,
где соответственно наибольший и наименьший остатки с учетом знака;
среднее квадратическое (стандартное) отклонение ряда остатков:
.
Остатки признаются нормально распределенными, если .
где критические границы и числа наблюдений-критерия для принятого уровня значимости .
Значения остатков регрессии были получены в EXCEL при проведении регрессионного анализа
. Наибольший и наименьший остатки составляют: . Среднее квадратическое отклонение остатков равно
,
а критерий
Расчетное значение попадает в интервал (2,7 – 3,7), следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
Проверим выполнимость предпосылок МНК на гетероскедастичность с помощью критерия Голдфельда – Квандта:
В упорядоченных по возрастанию переменной Х исходных данных () выделим первые m=123=4,0≈4 и последние 4 уровней, средние 4 уровня не рассматриваем.
С помощью программы ЛИНЕЙН построим модель по первым четырем наблюдениям (регрессия-1), для этой модели остаточная сумма квадратов .
С помощью программы ЛИНЕЙН построим модель по последним пяти наблюдениям (регрессия-2), для этой модели остаточная сумма квадратов .
Рассчитаем статистику критерия: .
Критическое значение при уровне значимости и числах степеней свободы составляет (функция F.ОБР.ПХ).
Схема критерия:
Сравним , следовательно, свойство постоянства дисперсии остатков выполняется, модель гомоскедастичная.
Проверить регрессию на отсутствие автокорреляции остатков (Тест Дарбина - Уотсона).
Для расчета статистики DW проведем расчет в таблицей 2.
Таблица 2.
№ у уоцен ei2 ei-ei-1 (ei-ei-1)2
1 125,2 112,3320513 165,5841042 2 126,1 122,7110723 11,48483122 -9,479 89,852
3 118,7 133,0900932 207,0747835 -17,779 316,094
4 152,2 143,4691142 76,22836652 23,121 534,580
5 154,6 153,8481352 0,56530068 -7,979 63,665
6 156,2 164,2271562 64,43523629 -8,779 77,071
7 162,5 174,6061772 146,5595253 -4,079 16,638
8 171,1 184,9851981 192,7987273 -1,779 3,165
9 198,5 195,3642191 9,833121764 17,021 289,714
10 223,1 205,7432401 301,2571145 14,221 202,236
11 215,2 216,1222611 0,850565485 -18,279 334,123
12 229,6 226,5012821 9,602052926 4,021 16,168
∑ei2= 1186,27373 ∑(ei-ei-1)2= 1943,305261
Значение DW рассчитаем по формуле:
Определим граничные значения dL и dU статистик Дарбина-Уотсона при уровне значимости α=0,05 и построим на их основании соответствующие отрезки на интервале от 0 до 4. Значения dL и dU выбираются при k=1 и n =12:
dL = 0,97dU =1,33
cov>0 ? cov=0 ? cov<0
0 dL dU 4-dU 4-dL 4
0 0,97 1,33 2,67 3,03 4
Рисунок 1 – Интервальная шкала оценки статистики DW
Как видно из рисунка 1, полученное значение DW попадает в отрезок (1,33; 2,67), следовательно автокорреляция отсутствует.
4) Оценить качество модели, используя среднюю относительную погрешность аппроксимации, критерий Фишер и коэффициент детерминации.
Для оценки точности модели вычислим среднюю относительную ошибку аппроксимации
Таблица 3.
Номер
наблюдения
1 112,3320513 12,86794872 0,103
2 122,7110723 3,388927739 0,027
3 133,0900932 -14,39009324 0,121
4 143,4691142 8,730885781 0,057
5 153,8481352 0,751864802 0,005
6 164,2271562 -8,027156177 0,051
7 174,6061772 -12,10617716 0,074
8 184,9851981 -13,88519814 0,081
9 195,3642191 3,135780886 0,016
10 205,7432401 17,35675991 0,078
11 216,1222611 -0,922261072 0,004
12 226,5012821 3,098717949 0,013
- высокий уровень точности модели.
Коэффициент детерминации R-квадрат определен программой РЕГРЕССИЯ и составляет R2 = 0,928 = 92,8% .
Таким образом, вариация (изменение) числа собственных легковых автомобилей на 1000 человек населения (на конец года) Y на 92,8% объясняется по полученному уравнению вариацией времени.
Проверим значимость полученного уравнения с помощью F – критерия Фишера.
F – статистика определена программой РЕГРЕССИЯ и составляет .
Критическое значение Fкр= 4,96 найдено для уровня значимости =5% и чисел степеней свободы k1=p=1, k2=n-p-1=10 (F.ОБР.ПХ(5%; 1; 10).
Сравнение показывает: F = 129,86>Fкр= 4,96; следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель факторной переменной Х.
5) Осуществить прогнозирование рассматриваемого показателя на год вперед (прогнозный интервал рассчитать при доверительной вероятности 70%).
Для вычисления точечного прогноза в построенную модель подставляем соответствующие значения фактора :
Для построения интервального прогноза рассчитаем доверительный интервал