С помощью метода наименьших квадратов на основании данных 31-60 Таблицы 2 построить линейную модель зависимости цены квартиры от ее общей площади и района, в котором расположена квартира. Оценить значимость модели в целом. Сделать вывод о том, как район влияет на стоимость квартиры.
Решение
В модели требуется учесть качественный признак “Район”. Так как исходные данные содержат три варианта района, нужно ввести две бинарные переменные следующим образом:
dist1=1 если район Гражданка0 для других районов; dist2=1 если район Юго-Запад0 для других районов
Модель зависимости будет иметь вид
Y=a+b1*Sобщ+b2*dist1+b3*dist2
Y – стоимость квартиры, тыс. долл.
Sобщ – общая площадь, кв. м
dist1 и dist2 описаны выше.
Решим задачу построения уравнения в MS Excel с использованием инструмента Регрессия пакета “Анализ данных”.
Выполняем команду Данные Анализ данных Регрессия, выделяем входные интервалы зависимой переменной Y и факторов X1, dist1 и dist2:
Excel выводит результаты регрессионного анализа в таблицы.
Параметры уравнения находим в столбце Коэффициенты
Записываем уравнение:
Y=-2,290+0,505*Sобщ+5,276*dist1+3,386*dist2
Для оценки значимости уравнения в целом нам нужна расчетная F-статистика (Фишера)
. Она находится в таблице Дисперсионный анализ.
Рядом выводится вероятность того, что расчетное значение F-статистики будет меньше табличного, то есть вероятность того, что регрессия “в целом” незначима.
Fрасч = 85,61
Вероятность P ( Fрасч < Fтабл) = 0,000. Эта вероятность меньше выбранного уровня значимости 0,05, поэтому делаем вывод, что регрессия в целом значима.
Статистическая значимость параметров уравнения
Y=-2,290+0,505*Sобщ+5,276*dist1+3,386*dist2
оценивается с помощью расчетных t-статистик и вероятностей в столбце Р-значение
Р-значение – это вероятность того, что соответствующая расчетная t-статистика параметра уравнения будет меньше табличного значения распределения Стьюдента.
Если Р-значение > 0,05 , то нужно сделать вывод, что параметр незначим, если Р-значение < 0,05 – параметр значим.
У нас Р-значение параметра b3 при факторе dist2 равно 0,061 – это больше чем 0,05 , следовательно параметр b3 незначим и фактор dist2 не влияет на стоимость.
Проанализируем смысл параметров.
Параметр b1 = 0,505 при факторе Sобщ показывает, что при увеличении общей площади на 1 кв