Исследуется зависимость между заработной платой рабочего за месяц у ($), х возрастом рабочего (лет) и фиктивной переменной D– пол рабочего.
1. Необходимо построить модель с фиктивной переменной D, которая принимает два значения: 1 если пол рабочего мужской; 0 если пол женский.
2. Проверить статистическую значимость коэффициентов. Сделать выводы.
Решение
Общий вид линейного уравнения с фиктивной переменной: . В данной задаче переменная z принимает значений 1, если рабочий является мужчиной; 0 – женщиной.
В Excel находим коэффициенты уравнения. a0= 72,83, a1=-13,29, b= 7,16. Наша модель множественной регрессии выглядит следующим образом:
Таким образом, для мужчин(z=1) уравнение принимает вид y=59,54+7,16x, а для женщин (z=0) y=72,83+7,16x
Коэффициенты уравнения говорят о том, что с увеличением возраста на 1 год, зарплата рабочего увеличивается на 7,16 долларов
. При этом у мужчин зарплата в среднем на 13,29 долларов меньше, чем у женщин того же возраста. Исходные и смоделированные данные представлены на графике ниже.
Коэффициент множественной детерминации – это доля объясняющей дисперсии экзогенной переменной в её общей дисперсии.
В нашем случае
Коэффициент множественной детерминации говорит о том, что 73,80% вариации результата (зарплаты) объясняется вариацией представленных в уравнении факторов (возрастом и полом рабочего), то есть уравнение регрессии достаточно объясняет вариацию объёма продаж