Имеются данные о сотрудниках страховой компании Сборы за месяц
.pdf
Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥
Имеются данные о сотрудниках страховой компании:
Сборы за месяц, тыс. р. 259 234 205 232 210 224 233 214
Возраст, лет 37 49 32 45 31 56 34 51
Опыт аналогичной работы да да нет да нет нет да да
Сборы за месяц, тыс. р. 238 211 220 218 199 213 239 250
Возраст, лет 47 44 32 29 36 46 57 54
Опыт аналогичной работы да нет да да нет нет нет да
По имеющимся данным постройте модель регрессии для характеристики зависимости сборов за месяц от возраста сотрудника и опыта аналогичной работы. Для признака «опыт аналогичной работы» введите в модель фиктивную переменную сдвига. Оцените параметры модели, проверьте ее статистическую значимость, обоснуйте с помощью теста Чоу целесообразность включения фиктивной переменной в модель.
Нужно полное решение этой работы?
Решение
Введем фиктивную переменную
Для удобства проведения расчетов поместим результатыпромежуточных расчетов в таблицу:
Таблица 1
№
259 37 1 9583 259 37 1369 1 67081
234 49 1 11466 234 49 2401 1 54756
205 32 0 6560 0 0 1024 0 42025
232 45 1 10440 232 45 2025 1 53824
210 31 0 6510 0 0 961 0 44100
224 56 0 12544 0 0 3136 0 50176
233 34 1 7922 233 34 1156 1 54289
214 51 1 10914 214 51 2601 1 45796
238 47 1 11186 238 47 2209 1 56644
211 44 0 9284 0 0 1936 0 44521
220 32 1 7040 220 32 1024 1 48400
218 29 1 6322 218 29 841 1 47524
199 36 0 7164 0 0 1296 0 39601
213 46 0 9798 0 0 2116 0 45369
239 57 0 13623 0 0 3249 0 57121
250 54 1 13500 250 54 2916 1 62500
сумма 3599 680 9 153856 2098 378 30260 9 813727
ср.знач. 224,9375 42,5 0,5625 9616 131,125 23,625 1891,25 0,5625 50857,94
Найдем средние квадратические отклонения признаков:
Для нахождения параметров линейного уравнения множественнойрегрессии
необходимо решить систему линейных уравнений относительно неизвестных параметров воспользоваться готовыми формулами.
Рассчитаем сначала парные коэффициенты корреляции:
Находим но формулам коэффициенты чистой регрессии и параметр :
Таким образом, получили следующее уравнение множественнойрегрессии:
Уравнение регрессии показывает, что при увеличении возраста сотрудника на 1 год (при неизменном опыте аналогичной работы) сборов за месяц увеличивается в среднем на 0,73 тыс
. руб., а при наличии опыта аналогичной работы на 1% (при неизменном возрасте сотрудника) сборов за месяц увеличивается в среднем на 19,51 тыс. руб.
Средняя ошибка аппроксимации:
Качество модели, исходя из относительных отклонений по каждомунаблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
Коэффициент множественной корреляции определить через матрицыпарных коэффициентов корреляции:
,
где
определитель матрицы парных коэффициентов корреляции;
определитель матрицы межфакторной корреляции.Находим:
Коэффициент множественной корреляции:
Коэффициент множественной корреляции указывает на сильную связь всего набора факторов с результатом.
Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата