Статистические данные содержат сведения о 44 случайным образом отобранных работниках сферы обслуживания.
Y зарплата в тысячах рублей
X стаж работы
female =1 для женщин, =0 для мужчин.
Кроме того, исследователи предположили, что в сфере обслуживания зарплата может зависеть от внешней привлекательности. Поэтому они добавили переменные, характеризующие внешность работника:
belav
=1 для работников, чья внешняя привлекательность оценивалась исследователями как ниже средней, =0 для других,
aver =1 для тех, чья внешность оценивалась как средняя, =0 других,
abovav
=1 для сотрудников с внешностью выше среднего, =0 для других,
striking =1 для поразительно красивых сотрудников, =0 для других.
Исследователь оценил две модели, в каждой из которых зависимой переменной выступала переменная lnY:
(1) (2)
const -1,203
(0, 712) -0,887
(0,560)
X 0,151
(0,060) 0,162
(0,055)
female 0,072
(0,029) 0,065
(0,022)
belav
- 0,384
(0,277) -
abovav
0,199
(0,122) -
striking 0,151
(0,035) -
R2 0,63 0,48
(а) Какая категория показателя «внешняя привлекательность» является эталонной для данной модели?
(б) Проинтерпретируйте коэффициенты при переменных belav и striking (коэффициент при belav незначим, коэффициент при striking значим)
(в) Влияет ли внешность на размер заработной платы? (Проведите тест для обоснования ответа)
(г) Проинтерпретируйте коэффициент при переменной female в модели (2) (коэффициент значим).
Нужно полное решение этой работы?
Решение
N = 44 размер выборки
(а) Эталонная категория показателя «внешняя привлекательность» для данной модели
Так как в модели (2) отсутствует фиктивная переменная aver, то она и является эталонной категорией фактора “внешняя привлекательность” в модели (2) (эталонными считаются люди со средней привлекательностью).
(а) Проинтерпретируйте коэффициенты при переменных belav и striking
Прежде чем интерпретировать коэффициенты при фиктивных переменных внешней привлекательности в (2) надо проверить значимость их отличия от нуля.
В модели (1) 6 параметров
1) Коэффициент при переменной belav : β3 = 0,384 , с.о.( β3 ) = 0,277
H0: β3 = 0
HA: β3 ≠ 0
tстат = (0,384 – 0)/0,277 ≈ -1,39.
При уровне значимости 0,05 и числе степеней свободы k = 44 – 6 = 38 критическое значение распределения Стьюдента
tкрит (0,05; 38) = 2,024.
Так как | tстат | < tкрит, то гипотеза H0: β3 = 0 не отвергается при уровне значимости 0,05 коэффициент β3 при переменной belav незначимо отличен от нуля.
2) Коэффициент при переменной striking : β5 = 0,151 , с.о.( β5 ) = 0,035
H0: β5 = 0
HA: β5 ≠ 0
tстат = (0,151 – 0)/0,035 ≈ 4,31.
Уровень значимости 0,05 , число степеней свободы k = 38 , tкрит (0,05; 38) = 2,024.
Так как | tстат | > tкрит, то гипотеза H0: β5 = 0 отвергается при уровне значимости 0,05 коэффициент β5 при переменной striking значимо отличен от нуля.
Интерпретируем
. Зависимая переменная ln Y.
Коэффициент при переменной belav незначимо отличен от нуля при уровне значимости 5%. Поэтому зарплата работников с привлекательностью ниже средней в среднем не отличается от зарплаты работников со средней привлекательностью (эталонная категория).
Коэффициент при переменной striking значимо отличен от нуля при уровне значимости 5%. Поэтому зарплата поразительно красивых сотрудников ( striking = 1) на 15,1% выше чем зарплата сотрудников со “средней” внешностью (β5 = 0,151 , модель log-lin).
(в) Влияет ли внешность на размер заработной платы?
Записываем теоретическую модель, соответствующую оцененному уравнению (1)
ln Y = β0 + β1* X + β2* female + β3* belav + β4* abovav + β5* striking + ε
Записываем гипотезу о незначимости влияния внешности на размер заработной платы:
H0: β3 = β4 = β5 = 0
HA: есть коэффициент не равный 0.
Гипотеза H0 является гипотезой о наличии линейных ограничений на коэффициенты модели регрессии), поэтому проверять ее нужно по критерию Фишера.
В случае если нулевая гипотеза справедлива, “длинная” модель (*) принимает “короткий” вид:
ln Y = β0 + β1* X + β2* female + ε
Оценка “короткой” модели задана в условии (модель (2)).
Имеем: размер выборки n = 44
длинная модель (1): коэффициент детерминации равен 0,63, число параметров равно 6;
короткая модель (2): коэффициент детерминации равен 0,48;
число ограничений на коэффициенты (в нулевой гипотезе) равно 3.
F-статистика для проверки нулевой гипотезы будет такой
F=(0,63-0,48)3(1-0,63)(44-6)=5,135
Критическое значение распределения Фишера при уровне значимости 0,05 и числе степеней свободы k1 = 3, k2 = 44 – 6 = 38
Fкрит0,05;3;38=2,85
Так как F>Fкрит то гипотеза H0 отвергается при уровне значимости 0,05.
Делаем вывод, что внешность сотрудников влияет на размер заработной платы.
(г) Проинтерпретируйте коэффициент при переменной female в модели (2)
Теоретическая модель, соответствующая оцененному уравнению (2)
ln Y = β0 + β1* X + β2* female + ε
Сначала проверим значимость отличия коэффициента от нуля.
В модели (2) 3 параметра
Коэффициент при переменной female : β2 = 0,065 , с.о.( β2 ) = 0,022
H0: β2 = 0
HA: β2 ≠ 0
t = (0,065 – 0)/0,022 ≈ 2,955.
При уровне значимости 0,05 и числе степеней свободы k = 44 – 3 = 41
tкрит (0,05; 41) = 2,020.
Так как t > tкрит, то гипотеза H0: β2 = 0 отвергается при уровне значимости 0,05 коэффициент β2 при переменной female значимо отличен от нуля, пол сотрудника влияет на размер зарплаты.
Интерпретируем