Пусть по данным бюджетного обследования случайно выбранных семей изучалась зависимость накопления У от дохода x1 расходов на питание x2 и стоимости имущества x3. Исходные данные (у.е.).
у x1
x2
x3
2 40 10 60
7 55 15 40
5 45 12 40
4 30 8 15
2 30 10 90
7 60 20 30
6 50 15 30
Необходимо:
1. Оценить коэффициенты линейной регрессии
2. Оценить статистическую значимость коэффициентов
3. Определить R2 и
4. Оценить статистическую надежность уравнения регрессии, рассчитав F-критерия Фишера .
5.Выявить наиболее значимые факторы, воздействующие на результативный признак.
Решение
1.По методу наименьших квадратов найдем оценки коэффициентов множественной линейной регрессионной модели Построим матрицу XTX
;
Находим обратную матрицу (XTX)-1
Вектор оценок коэффициентов регрессии равен
таким образом, получаем уравнение регрессии:
.
2. Оценим статистическую значимость коэффициентов
Построим дополнительную таблицу 2
Таблица 2
у ух
у-ух
у-ух2
у-уср2
2 3.324 -1.324 1.753 7.367
7 5.975 1.025 1.05 5.224
5 4.747 0.253 0.0638 0.0816
4 3.896 0.104 0.0108 0.51
2 1.525 0.475 0.226 7.367
7 7.552 -0.552 0.304 5.224
6 5.981 0.0194 0.000375 1.653
Итого
3,408 27,429
Оценка дисперсии равна:
se2=(Y-Y(X))T(Y-Y(X))=3.408
Несмещенная оценка дисперсии равна:
Найдем оценку ковариационной матрицы вектора k = S2• (XTX)-1
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
Проведем оценку значимости коэффициентов регрессии с помощью t-критерия Стьюдента.
Tтабл (n-m-1;α/2) = (3;0.025) = 4,177
Статистическая значимость коэффициента регрессии b0 не подтверждается
.
Статистическая значимость коэффициента регрессии b1 не подтверждается.
Статистическая значимость коэффициента регрессии b2 не подтверждается.
Статистическая значимость коэффициента регрессии b3 не подтверждается.
3. Определим R2 и
Найдем скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным коэффициентом детерминации.
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
4.С помощью F-критерия Фишера оценим статистическую надежность уравнения регрессии и коэффициента детерминации R2
Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1= 3 и k2= n-m-1 = 7-3 - 1 = 3, Fkp(3;3) = 9,28
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно (совместная незначимость коэффициентов при факторах xi подтверждается)
5.Выявим наиболее значимые факторы, воздействующие на результативный признак.
Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели