Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры на основе только значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.
Наиболее широкое применение получили следующие схемы построения уравнения множественной регрессии:
метод включения – дополнительное введение фактора;
метод исключения – отсев факторов из полного его набора.
Вторая схема пошаговой регрессии основана на последовательном
Исключении факторов с помощью t-критерия. Она заключается в том, что после построения уравнения регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьшее значение t-критерия. После этого получают новое уравнение множественной регрессии и снова производят оценку значимости всех оставшихся коэффициентов регрессии. Если и среди них окажутся незначимые, то опять исключают фактор с наименьшим значением t-критерия. Процесс исключения факторов останавливается на том шаге, при котором все регрессионные коэффициенты значимы.
Решение
Используя пошаговую регрессию (метод исключения), построим модель формирования спроса в зависимости от значимых факторов.
Шаг 1:Построим модель линейной регрессии формирования цены квартиры от всех факторов (x1, x2, x3, x4):
y= 113,97-6,10*x1+0.53*x2+2,59*x3+10,99*x4
Проанализируем полученные данные, используя протокол линейной регрессии :
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,963692
R-квадрат 0,928701
Нормированный R-квадрат 0,900182
Стандартная ошибка 1,493298
Наблюдения 15
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 4 290,4612 72,6153 32,56382 1,04E-05
Остаток 10 22,29938 2,229938
Итого 14 312,7606
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 113,9672 35,63222 3,198432 0,009517 34,57369 193,3608
х1 -6,09813 0,893976 -6,82136 4,62E-05 -8,09003 -4,10623
х2 0,534522 0,450206 1,187283 0,262553 -0,4686 1,537644
х3 2,59013 0,847933 3,05464 0,012155 0,700818 4,479442
х4 10,99374 3,82975 2,870615 0,016651 2,460522 19,52695
Коэффициент детерминации (R2=0,9287) и (R2 нормированный=0,9002) высокий, незначимость модели (F=1,04×10-5) очень низкая, модель значимая, вычисляем табличное значение t-критерия Стьюдента=2,200985 (при вероятности=0,05) и сравниваем с табличными значениями t-статистика. Исключим из рассмотрения фактор x2 с самым низким по модулю значением t-статистика = 1,187.
Шаг 2: Построим модель линейной регрессии формирования спроса от факторов (x1, x3, x4):
y= 141,71-6,61*x1+2,22*x3+10,69*x4
Проанализируем полученные данные, используя протокол линейной регрессии:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,958463
R-квадрат 0,918651
Нормированный R-квадрат 0,896465
Стандартная ошибка 1,520849
Наблюдения 15
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 3 287,3178 95,7726 41,40657 2,77E-06
Остаток 11 25,44279 2,312981
Итого 14 312,7606
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 141,7142 27,39404 5,173176 0,000307 81,42034 202,0081
х1 -6,61024 0,797486 -8,28885 4,65E-06 -8,36549 -4,85498
х3 2,224757 0,804696 2,764718 0,0184 0,453633 3,99588
х4 10,69062 3,891732 2,747007 0,018992 2,124972 19,25626
Коэффициент детерминации (R2=0,91865) и (R2 нормированный=0,8965) высокий
. Значимость модели (F=2,77×10-5) выросла, по сравнению с первой моделью - очень высокая, значимая. Вычисляем табличное значение t-критерия Стьюдента=2,178813 (при вероятности = 0,05) и сравниваем с табличными значениями t-статистика, все оставшиеся факторы значимы.
Из данного уравнения видно, что при увеличении цены товара x1 на 1 руб. спрос падает на 6,61 тыс. шт., также при увеличении цены на второй подобный товар на 1 руб. спрос растет на 2,22 тыс. шт. При росте среднего дохода населения на 1 тыс. руб. спрос растет на 10,69 тыс. шт.
Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ-коэффициентов.
Качество модели улучшилось. Коэффициент детерминации (R2=0,9187) близок к 1, что означает хорошее качество модели, т.е