Для анализа зависимости между изменением цен на молоко и молокопродукты и потреблением белка населением города было проведено выборочное обследование и получены следующие данные за 10 месяцев:
Месяц Потребление белка
в среднем за месяц
в расчете на душу населения (г) Индекс цен на молоко
и молокопродукты
(в % к январю)
Январь 2000 100
Февраль 2010 108
Март 2022 115
Апрель 2040 118
Май 2057 122
Июнь 2075 126
Июль 2092 132
Август 2108 139
Сентябрь 2128 143
Октябрь 2150 145
1) Определите функциональную форму трендовых уравнений регрессии для изучаемых признаков и рассчитайте их параметры.
2) Найдите линейный коэффициент корреляции между изучаемыми признаками:
а) по исходным уровням ряда;
б) по первым разностям уровней рядов;
в) по отклонениям от тренда.
3) Сделайте вывод о степени тесноты связи между изучаемыми признаками.
4) Определите параметры уравнения парной линейной регрессии по первым разностям и поясните их смысл.
Решение
Введем обозначения переменных.
Yt – Потребление белка в среднем за месяц в расчете на душу населения (г)
Xt – Индекс цен на молоко и молокопродукты (в % к январю)
1) Для выбора функции тренда в переменных Xt и Yt построим корреляционные поля и визуально оценим форму связи.
Потребление белка в среднем за месяц в расчете на душу населения (г) Yt
имеет тенденцию к росту, линия роста имеет выпуклость (вниз). Для моделирования тренда выберем полином второго порядка
Yt=a+b1t+b2t2
Индекс цен на молоко и молокопродукты (в % к январю) Xt
имеет тенденцию к росту, линия роста и имеет три точки смены выпуклости. Для моделирования тренда выберем полином четвертого порядка.
Xt=a+b1t+b2t2+b3t3+b4t4
Для расчета параметров обоих трендов проводим линеаризацию, преобразуя путем замены переменных уравнения к линейному виду, и проводим регрессионный анализ.
Тренд в Yt
Результаты:
Качество подгонки характеризуется индексом детерминации R2 : на 99,95% изменения Потребления белка Yt обусловлено временем.
Уравнение тренда в целом значимо с надежностью 95%, так как Значимость F менее 5%.
Уравнение тренда записывается по коэффициентам
Yt=1985,7+11,765∙t+0,462∙t2
Все коэффициенты значимы с надежностью 95%, так как Р-значения для них менее 5%.
Средняя ошибка аппроксимации А = 0,066% – точность аппроксимации очень высокая.
Тренд в Xt
Результаты:
Индекс детерминации R2 = 0,9994; на 99,94% изменения Индекса цен на молоко Xt обусловлено временем.
Уравнение тренда в целом значимо с надежностью 95%, так как Значимость F менее 5%.
Уравнение тренда записывается по коэффициентам
Xt=83,5+20,945∙t-5,407∙t2+0,707∙t3-0,031∙t4
Все коэффициенты значимы с надежностью 95%, так как Р-значения для них менее 5%.
Средняя ошибка аппроксимации А = 0,33% – точность аппроксимации очень высокая.
2) Рассчитаем линейный коэффициент корреляции, используя функцию Excel = КОРРЕЛ
а) по исходным уровням ряда
Корреляция между исходными уровнями ряда r(Yt;Xt) = 0,985 говорит о наличии очень сильной прямой связи в переменных Yt и Xt, хотя с точки зрения “экономики” зависимость между количеством потребляемого белка (Yt) и индексом цен на молоко (Xt) маловероятна.
б) по первым разностям уровней рядов
Первые разности уровней ряда – это разности между соседними уровнями ряда
.
Yt = Yt – Yt-1
Xt = Xt – Xt-1
Составляя первые разности, которые по сути являются темпами роста, мы автоматически очищаем данные от влияния времени, если тренд линеен