Статистические данные содержат сведения о 25 случайным образом отобранных работниках сферы обслуживания.
Y зарплата в тысячах рублей
X стаж работы
female =1 для женщин, =0 для мужчин.
Кроме того, исследователи предположили, что в сфере обслуживания зарплата может зависеть от внешней привлекательности. Поэтому они добавили переменные, характеризующие внешность работника:
belav
=1 для работников, чья внешняя привлекательность оценивалась исследователями как ниже средней, =0 для других,
aver =1 для тех, чья внешность оценивалась как средняя, =0 других,
abovav
=1 для сотрудников с внешностью выше среднего, =0 для других,
Исследователь оценил две модели, в каждой из которых зависимой переменной выступала переменная Y:
(1) (2)
const
-1,203
(0, 712) -0,887
(0,560)
X 1,51
(0,60) 1,62
(0,55)
female 0,72
(0,29) 0,65
(0,22)
belav
-1,84
(0,52) -
aver 1,99
(1,22) -
R2 0,75 0,58
(а) Какая категория показателя «внешняя привлекательность» является эталонной для данной модели?
(б) Проинтерпретируйте коэффициенты при переменных belav и aver (коэффициент при переменной belav значим, коэффициент при переменной aver незначим).
(в) Влияет ли внешность на размер заработной платы? (Проведите тест для обоснования ответа)
(г) В модели (2) проинтерпретируйте коэффициент при переменной female (коэффициент значим).
Нужно полное решение этой работы?
Решение
N = 25 – размер выборки
(а)
В модели (1) показатель “внешняя привлекательность” присутствует в виде переменных belav и aver. Следовательно, так как в модели (1) отсутствует переменная abovav, то эта категория и является эталонной.
То есть эталонными считаются люди с внешностью выше среднего.
(б)
Сначала проверим значимость отличия от нуля коэффициентов при переменных belav и aver. В модели (1) 5 параметров.
Зададим уровень значимости 0,05. Критическое значение распределения Стьюдента при уровне значимости 0,05 и числе степеней свободы k = 25 – 5 = 20.
tкрит (0,05; 20) = 2,086
1) Коэффициент при переменной belav : β3 = 1,84 , с.о.( β3 ) = 0,52
H0: β3 = 0
HA: β3 ≠ 0
tстат = 1,84 / 0,52 = -3,54.
| tстат | > tкрит, поэтому гипотеза H0: β3 = 0 отвергается при уровне значимости 0,05. Коэффициент β3 при переменной belav значимо отличен от нуля (значим).
2) Коэффициент при переменной aver : β4 = 1,99 , с.о.( β4 ) = 1,22
H0: β4 = 0
HA: β4 ≠ 0
tстат = 1,99 / 1,22 = 1,63.
| tстат | < tкрит, гипотеза H0: β4 = 0 не отвергается при уровне значимости 0,05
. Коэффициент β4 при переменной aver незначимо отличен от нуля (незначим).
Теперь можно интерпретировать коэффициенты. Зависимая переменная Y (модель lin-lin).
Коэффициент при переменной belav значим при уровне 5%.
Зарплата работников с внешностью ниже средней (belav = 1) на 1,84 тысячи рублей ниже чем зарплата работников с внешностью выше среднего (эталонной).
Коэффициент при переменной aver незначим при уровне 5%.
Зарплата работников со средней внешностью не отличается от зарплаты работников с внешностью выше среднего (эталонной).
(в)
Теоретическая “длинная” модель, соответствующая оцененному уравнению (1)
Y = β0 + β1* X + β2* female + β3* belav + β4* aver + ε
Записываем гипотезу о незначимости влияния внешности на размер заработной платы:
H0: β3 = β4 = 0
HA: есть коэффициент не равный 0.
Гипотеза H0 является гипотезой о наличии линейных ограничений на коэффициенты модели регрессии, для проверки используется критерий Фишера.
Если нулевая гипотеза истинна, то “длинная” модель принимает “короткий” вид:
Y = β0 + β1* X + β2* female + ε
Оценка “короткой” модели задана в условии (модель (2)).
Таким образом:
размер выборки n = 25
длинная модель (1): коэффициент детерминации равен 0,75, число параметров равно 5;
короткая модель (2): коэффициент детерминации равен 0,58;
число ограничений на коэффициенты (в нулевой гипотезе) равно 2.
F-статистика для проверки нулевой гипотезы
F=(0,75-0,58)2(1-0,75)(25-5)=6,8
Критическое значение распределения Фишера при уровне значимости 0,05 и числе степеней свободы k1 = 2, k2 = 25 – 5 = 20
Fкрит0,05;2;20=3,493
Так как F>Fкрит то гипотеза H0 отвергается при уровне значимости 0,05.
Делаем вывод, что внешность сотрудников влияет на размер заработной платы.
(г)
Теоретическая модель, соответствующая оцененному уравнению (2)
Y = β0 + β1* X + β2* female + ε
Сначала проверим значимость коэффициента.
В модели (2) 3 параметра.
Коэффициент при переменной female : β2 = 0,65 , с.о.( β2 ) = 0,22
H0: β2 = 0
HA: β2 ≠ 0
t = 0,65 / 0,22 = 2,95.
При уровне значимости 0,05 и числе степеней свободы k = 25 – 3 = 22
tкрит (0,05; 22) = 2,074.
t > tкрит, поэтому гипотеза H0: β2 = 0 отвергается при уровне значимости 0,05.
Коэффициент β2 при переменной female значимо отличен от нуля, пол сотрудника влияет на размер зарплаты.
Теперь можно интерпретировать коэффициент.
Зависимая переменная Y, модель lin-lin.
Переменная female = 1 если сотрудник – женщина и = 0 если сотрудник – мужчина.
Коэффициент при переменной female β2 = 0,65 говорит о том, что зарплата женщин (female = 1) в среднем на 0,65 тысяч рублей выше, чем зарплата мужчин (female = 0).