Запишите уравнение многофакторной регрессии и определите для нее минимальный объем выборки. Дайте экономическую интерпретацию полученной модели. Если известно, что а=b1=b2=b3=b4=b5=, b6=b7=b8=.
Укажите, какие фиктивные переменные использованы в модели.
Проверьте факторы на мультиколлинеарность и устраните её.
Запишите новое уравнение многофакторной регрессии, после устранения мультиколлинеарности.
Решение
Т.к. , а=-9,74, b1=-24,00, b2=1,25, b3=0,20, b4=0,80, b5=0,09, b6=6,40, b7=13,44, b8=-0,39.
1. Уравнение многофакторной регрессии имеет вид:
Коэффициенты модели имеют следующий смысл:
b1: Квартиры в районе 2 стоят в среднем на 24 тыс. $ дешевле, чем в районе 1.
b2: При увеличении количества комнат на 1 стоимость квартиры возрастает в среднем на 1,25 тыс. $.
b3: При увеличении общей площади на 1 м2 стоимость квартиры возрастает в среднем на 0,20 тыс. $.
b4: При увеличении жилой площади на 1 м2 стоимость квартиры возрастает в среднем на 0,80 тыс. $.
b5: При увеличении площади кухни на 1 м2 стоимость квартиры возрастает в среднем на 0,09 тыс. $.
b6: Квартиры на средних этажах в среднем дороже на 6,40 тыс
. $, чем на крайних.
b7: Квартиры в кирпичных домах в среднем дороже на 13,44 тыс. $, чем в панельных.
b8: При увеличении срока сдачи дома на 1 месяц стоимость квартиры снижается в среднем на 0,39 тыс. $.
Определим минимальный объем выборки:
Следовательно, для получения статистической значимости модели необходимо собрать данные минимум о 45 квартирах.
2. В модели присутствует 3 фиктивные переменные, введенные для обозначения качественных признаков квартир: район (x1), этаж (x6), тип дома (x7).
3. Оценим наличие мультиколлинеарности по матрице парных коэффициентов корреляции:
X1 X2 X3 X4 X5 X6 X7 X8 Y
X1 1
X2 0,101 1
X3 -0,166 0,829 1
X4 -0,091 0,893 0,964 1
X5 -0,320 0,649 0,804 0,839 1
X6 -0,035 0,162 0,170 0,167 0,067 1
X7 0,094 -0,143 -0,07 -0,108 -0,15 0,075 1
X8 -0,224 -0,287 -0,175 -0,211 -0,08 -0,21 -0,032 1
Y -0,305 0,690 0,899 0,885 0,855 0,260 0,023 -0,184 1
В матрице парных коэффициентов межфакторной корреляции встречается 5 значений, превышающих по модулю 0,7, следовательно, мультиколлинеарными являются пять факторов: x2 и x3; x2 и x4; x3 и x4; x3 и x5; x4 и x5.
В паре x2 и x3 фактор x2 характеризуется более слабой связью с результативной переменной (0,690), следовательно, его можно удалить из модели.
В паре x3 и x4 фактор x4 характеризуется более слабой связью с результативной переменной (0,885), следовательно, его можно удалить из модели.
В паре x3 и x5 фактор x5 характеризуется более слабой связью с результативной переменной (0,855), следовательно, его можно удалить из модели.
Таким образом, для устранения мультиколлинеарности из модели удалены три фактора: x2, x4, x5 (количество комнат, жилая площадь, площадь кухни).
4