Исследователь, изучающий детерминанты подростковой преступности, имеет следующие данные за 2007 год по 43 городам в некоторой стране: А – число арестов в городе на 1000 подростков; Р – число семей в городе, живущих за чертой бедности; S – число семей в городе с одним родителем, G – число девочек на 1000 подростков. Он получает выборочное уравнение:
 = 1,17 + 0,88*Р + 0,57*S – 0,23*G
с.о. (0,34) (0,30) (0,18) (0,08)
R2 = 0,681, n=43.
Запишите теоретическую модель, соответствующую этому уравнению.
Проинтерпретируйте коэффициент при факторе G.
Проинтерпретируйте коэффициент детерминации.
Проведите тест на общую значимость модели.
Значимо ли отличен от нуля коэффициент при факторе S?
Можно ли утверждать, что теоретический коэффициент при факторе Р меньше 1?
Можно ли утверждать, что теоретический коэффициент при факторе G больше -0,5?
Решение
N = 43 – размер выборки
m = 4 – число оцениваемых параметров уравнения
a) Теоретическая модель
A = β0 + β1*P + β2*S + β3*G + ε
Число степеней свободы k = n – m = 43 – 4 = 39
b) Интерпретация коффициента при факторе G
Коэффициент при факторе G равен 0,23. При увеличении на 1 числа девочек на 1000 подростков (G), при неизменности остальных факторов уравнения, число арестов на 1000 подростков снижается в среднем на 0,23.
c) Интерпретация коэффициента детерминации
Коэффициент детерминации R2 = 0,681. Совокупное изменение факторов P (число семей в городе, живущих за чертой бедности), S (число семей в городе с одним родителем) и G (число девочек на 1000 подростков) объясняет 68,1% изменения числа арестов на 1000 подростков (А).
d) Тест на общую значимости модели
Нулевая гипотеза H0: β1 = β2 = β3 = 0
Альтернативная гипотеза: HA: не H0 (есть ненулевой коэффициент)
В случае, если нулевая гипотеза справедлива, “длинная” исходная модель принимает “короткий” вид: A = β0 + ε с выборочным уравнением A=β0
Коэффициент детерминации короткого уравнения равен 0, так как оно не содержит факторов, объясняющих поведение зависимой переменной.
Расчетная F-статистика для проверки нулевой гипотезы будет такой:
F=R2(m-1)(1-R2)(n-m)=0,6811-0,681∙43-43=27,752
Критическое значение распределения Фишера при уровне значимости 0,05 и числе степеней свободы k1 = m – 1 = 3, k2 = n – m = 39
Fкрит=F0,05;3;39=2,85
Так как F>Fкрит то гипотеза H0 отвергается при уровне значимости 0,05.
Модель в целом значима.
e) Проверка значимости отличия о нуля коэффициента при факторе S
Нулевая гипотеза H0: β2 = 0
Альтернативная гипотеза HA: β2 ≠ 0
Расчетная t-статистика
t=β2с.о.(β2)=0,570,18=3,167
Критическое значение распределения Стьюдента при уровне значимости 0,05 и числе степеней свободы k = n – m = 39
tкрит=t0,05;39=2,02
Так как t>tкрит то гипотеза H0 отвергается при уровне значимости 0,05.
Коэффициент при факторе S значимо отличен от нуля.
f) Можно ли утверждать, что теоретический коэффициент при факторе Р меньше 1?
Нулевая гипотеза H0: β1 = 1
Альтернативная гипотеза HA: β1 < 1
Расчетная t-статистика
t=β1-1с.о.(β1)=0,88-10,30=-0,4
Уровень значимости 0,05, число степеней свободы k = 39
Критическое левостороннее значение по таблице распределения Стьюдента при уровне значимости 0,05 и числе степеней свободы k = 39
tкритлево0,05;39=-1,68
Так как t>tкрит (-0,4>-1,68) то гипотеза H0 не может быть отвергнута при уровне значимости 0,05.
Нельзя утверждать, что коэффициент при факторе P меньше 1.
g) Можно ли утверждать, что теоретический коэффициент при факторе G больше -0,5?
Нулевая гипотеза H0: β3 = -0,5
Альтернативная гипотеза HA: β1 > -0,5
Расчетная t-статистика
t=β3-(-0,5)с.о.(β3)=-0,23+0,50,08=3,375
Уровень значимости 0,05, число степеней свободы k = 39
Критическое правостороннее значение по таблице распределения Стьюдента при уровне значимости 0,05 и числе степеней свободы k = 39
tкритправо0,05;39=1,68
Так как t>tкрит (3,375>1,68) то гипотеза H0 отвергается при уровне значимости 0,05.
Можно утверждать, что коэффициент при факторе P больше 1.