Цель работы – повторение теоретического материала, укрепление умений и получение навыков решения типовых задач по курсу эконометрики по теме: «Модель множественной регрессии».
Задачи:
расчет параметров множественной линейной регрессии;
составление матриц парных и частных коэффициентов корреляции;
проведение оценки значимости уравнения множественной регрессии;
проведение оценки силы связи факторов с результатом с помощью средних коэффициентов эластичности.
Имеются данные 12 месяцев по району города о рынке вторичного жилья (у – стоимость квартиры, тыс. у.е., x1 – размер жилой площади, м2 , x2 – размер кухни, м2 ). Данные приведены в таблице 1.
Таблица 1
№ у x1
x2
1 13,00 37,00 6,20
2 16,40 60,90 10,00
3 17,00 60,00 8,50
4 15,20 52,10 7,40
5 14,20 40,10 7,00
6 10,50 30,40 6,20
7 20,00 43,00 7,50
8 12,00 32,10 6,40
9 15,60 35,10 7,00
10 12,50 32,00 6,20
11 13,20 33,00 6,00
12 14,60 32,50 5,80
Требуется:
Рассчитайте параметры линейного уравнения множественной регрессии.
Дайте оценку силы связи факторов с результатом с помощью средних коэффициентов эластичности.
Оцените статистическую зависимость параметров и уравнения регрессии в целом с помощью соответственно критериев Стьюдента и Фишера (α=0,01).
Рассчитайте среднюю ошибку аппроксимации. Сделайте вывод.
Составьте матрицы парных и частных коэффициентов корреляции и укажите информативные факторы.
Решение
Рассчитайте параметры линейного уравнения множественной регрессии.
Для удобства расчетов составим вспомогательную таблицу 2.
Таблица 2
№ у x1
x2
yx1
yx2
x1x2
x1² x2² у²
1 13,00 37,00 6,20 481,00 80,60 229,40 1 369,00 38,44 169,00
2 16,40 60,90 10,00 998,76 164,00 609,00 3 708,81 100,00 268,96
3 17,00 60,00 8,50 1 020,00 144,50 510,00 3 600,00 72,25 289,00
4 15,20 52,10 7,40 791,92 112,48 385,54 2 714,41 54,76 231,04
5 14,20 40,10 7,00 569,42 99,40 280,70 1 608,01 49,00 201,64
6 10,50 30,40 6,20 319,20 65,10 188,48 924,16 38,44 110,25
7 20,00 43,00 7,50 860,00 150,00 322,50 1 849,00 56,25 400,00
8 12,00 32,10 6,40 385,20 76,80 205,44 1 030,41 40,96 144,00
9 15,60 35,10 7,00 547,56 109,20 245,70 1 232,01 49,00 243,36
10 12,50 32,00 6,20 400,00 77,50 198,40 1 024,00 38,44 156,25
11 13,20 33,00 6,00 435,60 79,20 198,00 1 089,00 36,00 174,24
12 14,60 32,50 5,80 474,50 84,68 188,50 1 056,25 33,64 213,16
Сумма 174,20 488,20 84,20 7 283,16 1 243,46 3 561,66 21 205,06 607,18 2 600,90
среднее 14,52 40,68 7,02 606,93 103,62 296,81 1 767,09 50,60 216,74
На основе данных таблицы 2 определим средние квадратические отклонения признаков:
σy=y2-y2=216,74-14,522= 2,45;
σx1=x12-x12=1 767,09-40,682= 10,58;
σx2=x22-x22=50,60-7,022= 1,17.
Рассчитаем парные коэффициенты корреляции:
ryx1=yx1-y×x1σyσx1=606,93-14,52×40,68 2,45× 10,58 = 0,630;
ryx2=yx2-y×x2σyσx2=103,62-14,52×7,02 2,45× 1,17= 0,616;
rx1x2=x1x2-x1×x2σx1σx2=296,81-40,68×7,02 10,58× 1,17 = 0,918.
Коэффициенты парной корреляции указывают на умеренную связь каждого фактора с результатом у, а также весьма высокую межфакторную зависимость (факторы x1 и x2 явно коллинеарны, т.к. rx1x2 = 0,918 >0,7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Находим коэффициенты чистой регрессии и параметр a:
b1=σyσx1×ryx1-ryx2×rx1x21-rx1x22=2,4510,58×0,630-0,616×0,9181-0,9182= 0,096;
b2=σyσx2×ryx2-ryx1×rx1x21-rx1x22=2,451,17×0,616-0,630×0,9181-0,9182= 0,497;
a=y-b1x1-b2x2=14,52-0,096×40,68-0,497×7,02= 7,138.
Таким образом, получим уравнение множественной регрессии:
y = 7,138+0,096 × x1 +0,497× x2.
Уравнение регрессии показывает, что при увеличении размера жилой площади на 1 м2 (при неизменном уровне размера кухни) стоимость квартиры увеличивается в среднем на 0,096 тыс
. у.е., а при увеличении размера кухни на 1 м2 (при неизменном уровне размера жилой площади) стоимость квартиры увеличивается в среднем на 0,497 тыс. у.е.
Дайте оценку силы связи факторов с результатом с помощью средних коэффициентов эластичности.
Средние коэффициенты эластичности:
Э1=b1×x1y=0,096×40,6814,52=0,268;
Э2=b2×x2y=0,497×7,0214,52=0,240.
При увеличении фактора x1 на 1% результат у изменяется всего на 0,268%. При увеличении фактора x2 на 1% результат у изменяется всего на 0,240%. Влияние на результат фактора x1 чуть выше чем фактора x2.
Оцените статистическую зависимость параметров и уравнения регрессии в целом с помощью соответственно критериев Стьюдента и Фишера (α=0,01).
Предварительно определим множественный коэффициент корреляции и детерминации, для чего составим вспомогательную таблицу 3, в которой определим модельные значения у, а также аппроксимации.
Таблица 3
№ y
y-y
y-y2
A,%
1 13,76 -0,76 0,58 5,83
2 17,93 - 1,53 2,35 9,35
3 17,10 - 0,10 0,01 0,59
4 15,80 -0,60 0,36 3,94
5 14,45 - 0,25 0,06 1,78
6 13,13 -2,63 6,90 25,0
Продолжение таблицы 3
№ y
y-y
y-y2
A,%
7 14,98 5,02 25,22 25,11
8 13,39 - 1,39 1,93 11,58
9 13,97 1,63 2,64 10,42
10 13,28 - 0,78 0,61 6,24
11 13,28 - 0,08 0,01 0,58
12 13,13 1,47 2,16 10,07
Сумма 174,20 0,00 42,83 110,52
среднее 14,52 0,00 3,57 9,21
Коэффициент множественной корреляции:
Ryx1x2=1-y-y2nσy2=1-3,572,452= 0,637.
Коэффициент множественной корреляции указывает на умеренную связь всех выбранных факторов с результатом.
Коэффициент множественной детерминации:
Ryx1x22= 0,406
Значение коэффициента указывают на то, что вариация у на 40,6% описывается вариацией включенными в модель факторами x1 и x2. Качество подбора плохое.
Оценим статистическую значимость параметров регрессии с помощью критерия Стьюдента.
Найдем стандартные ошибки коэффициентов регрессии:
mb1=σy×1-Ryx1x22σx1×1-rx1x22×1n-3=2,45× 1-0,406 10,58×1-0,9182×112-3= 0,150;
mb2=σy×1-Ryx1x22σx2×1-rx1x22×1n-3=2,45× 1-0,406 1,17×1-0,9182×1n-3=1,357.
Фактическое значение t-критерия Стьюдента:
tb1=b1mb1=0,0960,150= 0,638;
tb2=b2mb2=0,4971,357=0,366.
По таблице Стьюдента с уровнем значимости α = 0,01 и степенями свободы k=12-2-1=9, либо пользуясь встроенной функцией Excel «СТЬЮДРАСПОБР», заполнив необходимые поля диалогового меню и находим tкрит= 3,250