В таблице для каждого варианта заданы три временных ряда: первый из них представляет валовой национальный продукт (ВНП, в млрд $) за 10 лет уt, второй и третий ряд – потребление (млрд $) х1t и инвестиции (млрд $) х2t.
Требуется:
а) вычислить матрицу коэффициентов парной корреляции и проанализировать тесноту связи между показателями;
б) построить линейную и нелинейную модели регрессии, описывающие зависимость уt от факторов х1t и х2t;
в) оценить качество моделей. Вычислить среднюю ошибку аппроксимации и коэффициент детерминации;
г) проанализировать влияние факторов на зависимую переменную (β-коэффициент) и оценить их значимость, найти доверительный интервал;
д) проверить остатки на нормальность распределения;
е) определить точечные прогнозные оценки ВНП для 5 наблюдений (объясняющие переменные задать самостоятельно);
Все полученные результаты необходимо интерпретировать.
Номер наблюдения (t=1, 2,…, 10)
Вариант 4
43 47 50 48 67 57 61 59 65 54
30 34 32 36 39 44 45 41 46 47
28 24 26 29 33 31 24 33 35 34
Решение
А) вычислить матрицу коэффициентов парной корреляции и проанализировать тесноту связи между показателями;
Парные коэффициенты корреляции рассчитываются по формуле:
rx,y=(xi-x)∙(yi-y)(xi-x)2∙(yi-y)2
где n – объем выборки, xi - значение факторного признака, yi - значение результативного признака, x – среднее значение факторного признака, y – среднее значение результативного признака.
Используя инструмент «Корреляция» пакета «Анализ данных» в Excel получим матрицу парных коэффициентов корреляции:
y x1 x2
y 1
x1 0,717489 1
x2 0,535 0,537046 1
Как видно из полученной матрицы:
- rYX1=0.7175, следовательно, между переменными Yt и Х1t наблюдается высокая прямая связь, увеличение объёма потребления существенно влияет на увеличение ВНП;
- rYX2=0.535, следовательно, между переменными Yt и Х2t наблюдается заметная прямая связь, увеличение объёма инвестиций приводит к увеличению ВНП;
- rX1Х2=0.5370, следовательно, между переменными Х1t и Х2t наблюдается заметная прямая связь, мультиколлинеарность отсутствует.
б) построить линейную и нелинейную модели регрессии, описывающие зависимость уt от факторов х1t и х2t;
Используя инструмент «Регрессия» пакета «Анализ данных» в Excel найдём регрессионные модели и их характеристики.
Для линейной модели получим:
Отсюда линейная модель имеет вид:
y=11,702+0,7911x1t+0,4118x2t
Применим многошаговый регрессионный анализ и удалим из модели переменную с наименьшим значением t-статистики (x2) и получим следующие регрессионные оценки.
Новая линейная модель имеет вид:
y=18,1075+0,9389x1t
Для нелинейной (степенной) модели построим логарифмическую регрессию:
Логарифмическая регрессия:
lny=ln(1,1513)+0,6227lnx1t+0,1678lnx2t
Нелинейная модель:
y=3,1622∙x1t0,6227∙x2t0,1678
Применим многошаговый регрессионный анализ и удалим из модели переменную с наименьшим значением t-статистики (ln(x2)) и получим следующие регрессионные оценки.
Логарифмическая регрессия:
lny=ln(1,4414)+0,6985lnx1t
Нелинейная модель:
y=4,2267∙x1t0,6985
в) оценить качество моделей
. Вычислить среднюю ошибку аппроксимации и коэффициент детерминации.
В линейной модели коэффициент детерминации равен R2 = 0,5148, т.е. на 51,48% модель объясняет зависимость ВНП от объёма потребления