Для объяснения продажной цены двухкомнатных квартир (price) в пригородах некоего мегаполиса из всех таких квартир, проданных в течение одного и того же года, случайным образом были отобраны 39 квартир. По каждой сделке были получены значения следующих показателей:
price – цена квартиры в млн. рублей,
totsp – общая площадь квартиры в кв.м.,
livsp – жилая площадь квартиры в кв. м.,
kitsp –площадь кухни в кв. м.,
othsp – прочая площадь квартиры в кв. м. (totsp = livsp+kitsp+othsp),
brick – переменная равна 1, если дом кирпичный или монолитный, и равна 0 иначе.
Были рассчитаны коэффициенты корреляции между всеми парами показателей, причем коэффициент корреляции между totsp и livsp оказался равен 0,91, остальные коэффициенты корреляции по модулю не превосходили 0,5. Отметим также, что между totsp и brick коэффициент корреляции был равен 0,46. Далее по МНК были оценены 4 модели, в которых зависимой переменной выступала цена квартиры price. (В скобках – стандартные ошибки).
(1) (2) (3) (4)
const 0,088
(0,062) 0,102
(0,070) 0,096
(0,056) 0,111
(0,097)
totsp
0,227
(0,239) - 0,255
(0,055) 0,465
(0,051)
livsp
0,112
(0,095) 0,205
(0,086) - -
kitsp
0,134
(0,044) 0,140
(0,022) - -
othsp
- 0,090
(0,028) - -
brick 0,098
(0,021) 0,260
(0,012) 0,252
(0,022) -
R2 0,786 0,791 0,756 0,704
А. Какая проблема имеет место в 1-м уравнении? Как она проявляется?
Б. Для модели (2) проверьте гипотезу о том, что увеличение на 1 кв. м. что жилой площади, что площади кухни, что прочей площади изменяет цену квартиры одинаково.
В. В модели (3) проинтерпретируйте коэффициент при переменной brick (Напоминание: сначала надо проверить его значимость). Проверьте гипотезу о том, что коэффициент при brick меньше 0,3.
Г. Можно ли было ожидать заранее, что выбрасывание из модели (3) существенного фактора brick приведет к увеличению оценки при факторе totsp? Ответ обоснуйте соответствующей формулой.
Нужно полное решение этой работы?
Решение
А.
Теоретическая модель, соответствующая выборочному уравнению (1):
Price = β0 + β1* totsp + β2* livsp + β3* kitsp + β5* brick + ε (*)
В выборке переменные totsp и livsp очень сильно коррелированны (коэффициент корреляции 0,91 близок к 1). То есть проблемой в 1-м уравнении может являться мультиколлинеарность.
Проверим гипотезы о значимости отличия от нуля коэффициентов при этих переменных.
H0: β1= 0
HA: β1≠ 0
tстат = (0,227– 0)/0,239 ≈0,95.
Выберем уровень значимости 0,05. Число степеней свободы для уравнения (1) равно 39 – 5=34. Поэтому
tкрит(0,05, 34) = 2,032.
Так как |tстат| < tкрит, гипотеза H0 не отвергается при уровне значимости 0,05, то есть коэффициент при переменной totsp незначимо отличен от нуля, то есть переменная «общая площадь квартиры» не влияет на цену квартиры.
H0: β2= 0
HA: β2≠ 0
tстат = (0,112– 0)/0,095 ≈1,179.
tкрит(0,05, 34) = 2,032.
Так как |tстат| < tкрит, гипотеза H0 не отвергается при уровне значимости 0,05, то есть коэффициент при переменной livsp незначимо отличен от нуля, то есть переменная «жилая площадь квартиры» не влияет на цену квартиры.
Из-за мультиколлинеарности коэффициенты при коррелированных переменных оказались незначимо отличными от нуля, то есть переменные, которые, безусловно, являются важными детерминантами цены квартиры, из-за мультколлинеарности оказались не влияющими на цену квартиры.
Б. Теоретическая модель, соответствующая выборочному уравнению (2):
Price = β0 + β2* livsp + β3* kitsp+ β4* othsp + β5* brick + ε (**)
Интерпретация коэффициента β1 при факторе Livsp: при увеличении жилой площади на 1 кв
. м. цена квартиры увеличивается в среднем на β2 млн. рублей (при неизменности значений остальных объясняющих переменных модели).
Интерпретация коэффициента β3 при факторе Kitsp: при увеличении площади кухни на 1 кв. м. цена квартиры увеличивается в среднем на β3 млн. рублей (при неизменности значений остальных объясняющих переменных модели).
Интерпретация коэффициента β4 при факторе othsp: при увеличении прочей площади на 1 кв. м. цена квартиры увеличивается в среднем на β4 млн. рублей (при неизменности значений остальных объясняющих переменных модели).
Таким образом, гипотеза о том, что жилой площади, что площади кухни, что прочей площади изменяет цену квартиры одинаково, это гипотеза о том, что коэффициенты при этих трех площадях равны.
H0: β2= β3= β4
НА: не H0
Так как нулевая гипотеза – это гипотеза о равенстве нескольких коэффициентов модели регрессии, для ее проверки используем тест Фишера.
Пусть H0 истинна. Как тогда выглядит наша исходная модель (**). Преобразуем ее с учетом проверяемой гипотезы:
Price = β0 + β2* Livsp + β2* Kitsp+ β2* othsp + β5* Brick + ε , то есть
Price = β0 + β2 * (Livsp + Kitsp+ othsp) + β5* Brick + ε
Но в скобках стоит общая площадь апартаментов, то есть Totsp. Поэтому окончательно преобразованная модель записывается так:
Price = β0 + β2 * Totsp + β5* Brick + ε.
Или, если соответственно поменять номер переменной при Totsp,
Price = β0 + β1* Totsp + β5* Brick + ε. (***)
То есть, это теоретическая модель для выборочного уравнения (3).
Таким образом, имеем длинную модель (**), для которой выборочное уравнение имеет коэффициент детерминации, равный 0,791, и короткую модель (***), для которой выборочное уравнение имеет коэффициент детерминации, равный 0,756