Имеются данные об объеме платных услуг населению, млн. рублей для Томской области за 2010- 2018 г. г.
год
2010 2011 2012 2013 2014 2015 2016 2017 2018
Объем платных услуг 30829 31989 34432 39887 42020 45857 46866 49425 51910
На основе полученных данных требуется:
1. Построить график динамики объема платных услуг населению.
2. С помощью метода серий проверить гипотезу о наличии тренда во временном ряде.
3. Рассчитать коэффициенты автокорреляции. Проверить наличие циклических колебаний во временном ряде.
4. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99.
5. С помощью трендовой модели сделать прогноз объема платных услуг населению на 2021 г.
Решение
1.Проверим гипотезу о наличии тренда во временном ряде.
Построим поле корреляции:
Рис. 1.
По виду траектории можно сказать, что объем платных услуг населению для Томской области содержит тренд (склонность к росту зависимой переменной).
С помощью критерия «восходящих» и «нисходящих» серий сделать вывод о присутствии или отсутствии тренда:
Согласно критерию «восходящих и нисходящих» серий гипотеза случайности проверяется следующим образом
1) Для исходного ряда образуется последовательность , последующему правилу:
Таблица 1
T выпуске продукции на предприятии
1992 30829
1993 31989 1160 +
1994 34432 2443 +
1995 39887 5455 +
1996 42020 2133 +
1997 45857 3837 +
1998 46866 1009 +
1999 49425 2559 +
2000 51910 2485 +
В дальнейшем рассматриваются только плюсы и минусы, нулине участвуют в анализе.
2)Подсчитывается — число серий в последовательности Под серией понимается последовательность подряд идущих плюсов или минусов. Один отдельно стоящий плюс или минус тоже считается серией.
3)Определяется — протяженность самой длинной серии.
4)В условиях случайности временного ряда число серий недолжно быть слишком маленьким, а протяженность самой длинной серии — слишком большой. Если нарушается хотя бы одно из следующих двух неравенств, то гипотеза случайности отвергается для приблизительно 5%-ного уровня значимости:
где
,
Так как нарушаются оба неравенства, то гипотеза случайности отклоняется, во временном ряду отсутствует тренд.
2.Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде.
Для этого составляем первую вспомогательную таблицу.
Таблица 2
1 30829
2 31989 30829 -10809,3 -9334,13 100894890,66 116839885,6 87125889,52
3 34432 31989 -8366,25 -8174,13 68386773,28 69994139,06 66816319,52
4 39887 34432 -2911,25 -5731,13 16684737,66 8475376,563 32845793,77
5 42020 39887 -778,25 -276,13 214894,28 605673,0625 76245,02
6 45857 42020 3058,75 1856,88 5679716,41 9355951,563 3447984,77
7 46866 45857 4067,75 5693,88 23161260,03 16546590,06 32420212,52
8 49425 46866 6626,75 6702,88 44418276,91 43913815,56 44928533,27
9 51910 49425 9111,75 9261,88 84391889,53 83023988,06 85782328,52
Сумма 342386 321305 0 0,00 343832438,75 348755419,5 353443306,88
Среднее значение 42798,25 40163,13
Следует заметить, что среднее значение получается путем деления не на 9, а на 8, т.к
. у нас теперь на одно наблюдение меньше.
Теперь вычисляем коэффициент автокорреляции первого порядка:
.
Вывод: в данном ряду динамики имеется тенденция, так как
Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка.
Таблица 3
1 30829
2 31989
3 34432 30829 -9910,43 -8011,00 79392443,29 98216594,47 64176121,00
4 39887 31989 -4455,43 -6851,00 30524141,14 19850843,76 46936201,00
5 42020 34432 -2322,43 -4408,00 10237265,14 5393674,47 19430464,00
6 45857 39887 1514,57 1047,00 1585756,29 2293926,61 1096209,00
7 46866 42020 2523,57 3180,00 8024957,14 6368412,76 10112400,00
8 49425 45857 5082,57 7017,00 35664403,71 25832532,33 49238289,00
9 51910 46866 7567,57 8026,00 60737328,29 57268137,33 64416676,00
Сумма 310397 271880 0,00 0,00 226166295,00 215224121,71 255406360,00
Среднее значение 44342,43 38840
Следовательно
.
Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу.
Таблица 4
Лаг Коэффициент автокорреляции уровней
1 0,979324
2 0,964643
3 0,965878
4 0,949354
5 0,979178
6 0,977773
Коррелограмма:
Рис. 2.
Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний.
3.Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии снадежностью 0,99.
Находим параметры уравнения методом наименьших квадратов.Система уравнений МНК:
a0n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y∙t
Для наших данных система уравнений имеет вид:
9a0 + 45a1 = 373215;
45a0 + 285a1 = 2033545.
Из первого уравнения выражаем а0 и подставим во второе уравнениеПолучаем a1 = 2791,17, a0 = 27512,5.
Таблица 5
t y t2 y2 t · y y(t) (yi-ycp)2 (y-y(t))2
1 30829 1 950427241 30829 30303,667 113195413,778 275975,111
2 31989 4 1023296121 63978 33094,833 89857760,444 1222867,361
3 34432 9 1185562624 103296 35886,000 49509986,778 2114116,000
4 39887 16 1590972769 159548 38677,167 2500615,111 1463696,694
5 42020 25 1765680400 210100 41468,333 304336,111 304336,111
6 45857 36 2102864449 275142 44259,500 19260395,111 2552006,250
7 46866 49 2196421956 328062 47050,667 29134805,444 34101,778
8 49425 64 2442830625 395400 49841,833 63308544,444 173750,028
9 51910 81 2694648100 467190 52633,000 109028402,778 522729,000
45 373215 285 15952704285 2033545 373215 476100260 8663578,333
Уравнение тренда:
y = 2791,17· t + 27512,5
Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Коэффициент тренда b = 2791,17 показывает среднее изменение объема платных услуг населению для Томской области с изменением периода времени t на единицу его измерения