Проверить наличие аномальных наблюдений, используя метод Ирвина (α=5%).
Построить линейную модель временного ряда yt=a+b∙t, параметры которой оценить МНК. Пояснить смысл коэффициента регрессии.
Оценить адекватность посторенной модели на основе предпосылок теоремы Гаусса-Маркова.
Оценить качество модели, используя среднюю относительную погрешность аппроксимации, критерий Фишер и коэффициент детерминации.
Осуществить прогнозирование рассматриваемого показателя на год вперед (прогнозный интервал рассчитать при доверительной вероятности 70%).
Представить графически фактические значения показателя, результаты моделирования и прогнозирования.
Провести расчет параметров логарифмического, полиномиального (полином 2-й степени), степенного, экспоненциального и гиперболического трендов. На основании графического изображения и значения индекса детерминации выбрать наиболее подходящий вид тренда.
Составить уравнения нелинейной регрессии (гиперболической; степенной; показательной) По каждой модели: привести графики построенных уравнений регрессии; найти средние относительные ошибки аппроксимации, коэффициенты детерминации и коэффициенты эластичности. По этим характеристикам сравнить нелинейные модели между собой и сделать вывод.
Лучшую нелинейную модель сравнить с лучшей линейной моделью.
С помощью лучшей нелинейной модели осуществить точечное прогнозирование рассматриваемого показателя на год вперед. Сопоставить полученный результат с доверительным прогнозным интервалом, построенным при использовании линейной модели.
год Y10
2000 9221
2001 12280
2002 15839
2003 20534
2004 25927
2005 32543
2006 42444
2007 53937
2008 70308
2009 65303
2010 74411
2011 90402
Решение
Проверим наличие аномальных наблюдений.
Проверим наличие аномальных наблюдений с помощью критерия Ирвина:
Рассчитываем коэффициенты анормальности наблюдений (критерий Ирвина):
, ,
Если превышает табличное значение, то уровень считается аномальным и такие наблюдения нужно исключить из временного ряда и заменить их расчетными значениями (например, среднее из соседних значений). Рассчитаем коэффициенты критерия Ирвина:
, ,
λi
0,1
0,1
0,2
0,2
0,2
0,4
0,4
0,6
0,2
0,3
0,6
Табличное значение критерия Ирвина при , .
Так как имеется одно значения критерия Ирвина которое равно табличному значению, значит, уровни можно принять не аномальным и их не следует удалить из рассмотрения.
Построить линейную модель Y(t) = a0 + a1t, параметры которой оценить МНК. Пояснить смысл коэффициента регрессии.
Построить линейную модель , параметры которой оценить МНК ( - расчетные, смоделированные значения временного ряда):
Для вычисления параметров модели следует воспользоваться формулами. Промежуточные расчеты приведены в таблице 1.
Табл. 1.
№ t Y Остатки
1 1 9221 -33541,42 -5,5 30,25 184477,79 1585,13 7635,87 58306538,07
2 2 12280 -30482,42 -4,5 20,25 137170,88 9071,91 3208,09 10291854,76
3 3 15839 -26923,42 -3,5 12,25 94231,96 16558,69 -719,69 517950,31
4 4 20534 -22228,42 -2,5 6,25 55571,04 24045,47 -3511,47 12330403,06
5 5 25927 -16835,42 -1,5 2,25 25253,13 31532,25 -5605,25 31418794,90
6 6 32543 -10219,42 -0,5 0,25 5109,71 39019,03 -6476,03 41938923,20
7 7 42444 -318,42 0,5 0,25 -159,21 46505,81 -4061,81 16498272,26
8 8 53937 11174,58 1,5 2,25 16761,88 53992,59 -55,59 3089,83
9 9 70308 27545,58 2,5 6,25 68863,96 61479,37 8828,63 77944778,88
10 10 65303 22540,58 3,5 12,25 78892,04 68966,15 -3663,15 13418636,33
11 11 74411 31648,58 4,5 20,25 142418,63 76452,93 -2041,93 4169459,37
12 12 90402 47639,58 5,5 30,25 262017,71 83939,71 6462,29 41761255,01
сумма 78 513149 0,00 0 143 1070609,5 513149 0,00 308599955,98
среднее 6,5 42762,42 0,00 0,00
89217,46
0,00
,
= 42762,42+7496,78 ∙ 6,5= – 5901,65.
Кривая роста зависимости оборота розничной торговли на душу населения (в фактически действовавших ценах) от сроков (времени) имеет вид:
.
При увеличении времени t на 1 год оборот розничной торговли на душу населения (в фактически действовавших ценах) увеличивается в среднем на 7486,78 руб .
Оценить адекватность посторенной модели на основе предпосылок теоремы Гаусса-Маркова.
Выполнение предпосылок МНК может проверяться с помощью R/Sкритерия
,
где соответственно наибольший и наименьший остатки с учетом знака;
среднее квадратическое (стандартное) отклонение ряда остатков:
.
Остатки признаются нормально распределенными, если .
где критические границы и числа наблюдений-критерия для принятого уровня значимости .
Значения остатков регрессии были получены в EXCEL при проведении регрессионного анализа
. Наибольший и наименьший остатки составляют: . Среднее квадратическое отклонение остатков равно
,
а критерий
Расчетное значение попадает в интервал (2,7 – 3,7), следовательно, выполняется свойство нормальности распределения. Модель по этому критерию адекватна.
Проверим выполнимость предпосылок МНК на гетероскедастичность с помощью критерия Голдфельда – Квандта:
В упорядоченных по возрастанию переменной Х исходных данных () выделим первые m=123=4,0≈4 и последние 4 уровней, средние 4 уровня не рассматриваем.
С помощью программы ЛИНЕЙН построим модель по первым четырем наблюдениям (регрессия-1),
ЛИНЕЙН
3749,8 5094
262,55453 719,0351869
0,9902901 587,0897717
203,97511 2
70305000 689348,8
для этой модели остаточная сумма квадратов .
С помощью программы ЛИНЕЙН построим модель по последним пяти наблюдениям (регрессия-2),
ЛИНЕЙН
6939 2246,5
3358,8934 35467,75136
0,6809074 7510,713981
4,2677732 2
240748605 112821649
для этой модели остаточная сумма квадратов .
Рассчитаем статистику критерия: .
Критическое значение при уровне значимости и числах степеней свободы составляет (функция F.ОБР.ПХ).
Схема критерия:
Сравним , следовательно, свойство постоянства дисперсии остатков не выполняется, модель гетероскедастичная.
Проверить регрессию на отсутствие автокорреляции остатков (Тест Дарбина - Уотсона).
Для расчета статистики DW проведем расчет в таблицей 2.
Таблица 2.
№ у уоцен ei2 ei-ei-1 (ei-ei-1)2
1 9221 1585,128205 58306538,07
2 12280 9071,907925 10291854,76 -4427,780 19605233,251
3 15839 16558,68765 517950,3074 -3927,780 15427453,531
4 20534 24045,46737 12330403,06 -2791,780 7794034,007
5 25927 31532,24709 31418794,9 -2093,780 4383913,517
6 32543 39019,02681 41938923,2 -870,780 758257,321
7 42444 46505,80653 16498272,26 2414,220 5828459,559
8 53937 53992,58625 3089,830865 4006,220 16049800,930
9 70308 61479,36597 77944778,88 8884,220 78929369,979
10 65303 68966,14569 13418636,33 -12491,780 156044560,580
11 74411 76452,92541 4169459,372 1621,220 2628355,195
12 90402 83939,70513 41761255,01 8504,220 72321762,566
∑ei2= 308599956 ∑(ei-ei-1)2= 379771200,4
Значение DW рассчитаем по формуле:
Определим граничные значения dL и dU статистик Дарбина-Уотсона при уровне значимости α=0,05 и построим на их основании соответствующие отрезки на интервале от 0 до 4. Значения dL и dU выбираются при k=1 и n =12:
dL = 0,97dU =1,33
cov>0 ? cov=0 ? cov<0
0 dL dU 4-dU 4-dL 4
0 0,97 1,33 2,67 3,03 4
Рисунок 1 – Интервальная шкала оценки статистики DW
Как видно из рисунка 1, полученное значение DW попадает в отрезок (0,97; 1,33), следовательно определить наличие автокорреляция не представляется возможным, требуются дополнительные исследования.
4) Оценить качество модели, используя среднюю относительную погрешность аппроксимации, критерий Фишер и коэффициент детерминации.
Для оценки точности модели вычислим среднюю относительную ошибку аппроксимации
Таблица 3.
Номер
наблюдения
1 1585,128205 7635,871795 0,828
2 9071,907925 3208,092075 0,261
3 16558,68765 -719,6876457 0,045
4 24045,46737 -3511,467366 0,171
5 31532,24709 -5605,247086 0,216
6 39019,02681 -6476,026807 0,199
7 46505,80653 -4061,806527 0,096
8 53992,58625 -55,58624709 0,001
9 61479,36597 8828,634033 0,126
10 68966,14569 -3663,145688 0,056
11 76452,92541 -2041,925408 0,027
12 83939,70513 6462,294872 0,071
Сумма 2,098
- уровень точности модели удовлетворительный.
Коэффициент детерминации R-квадрат определен программой РЕГРЕССИЯ и составляет R2 = 0,963 = 96,3% .
Таким образом, вариация (изменение) оборота розничной торговли на душу населения (в фактически действовавших ценах) Y на 96,3% объясняется по полученному уравнению вариацией времени.
Проверим значимость полученного уравнения с помощью F – критерия Фишера.
F – статистика определена программой РЕГРЕССИЯ и составляет .
Критическое значение Fкр= 4,96 найдено для уровня значимости =5% и чисел степеней свободы k1=p=1, k2=n-p-1=10 (F.ОБР.ПХ(5%; 1; 10).
Сравнение показывает: F = 259,73>Fкр= 4,96; следовательно, уравнение модели является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенной в модель факторной переменной Х.
5) Осуществить прогнозирование рассматриваемого показателя на год вперед (прогнозный интервал рассчитать при доверительной вероятности 70%).
Для вычисления точечного прогноза в построенную модель подставляем соответствующие значения фактора :
Для построения интервального прогноза рассчитаем доверительный интервал