Множественная линейная регрессия Данные № Производит труда
.pdf
Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥
Множественная линейная регрессия
Данные:
№ Производит. труда, млн. руб. на 1 рабочего (у) Энерговооруженность квт-час на 1 рабочего(х1) Доля рабочих ручного труда в общей числ. рабочих (%)(х2)
1 9,8 4,8 40
2 6,7 2,8 59
3 12,4 7 38
4 6,9 3,8 57
5 11,8 5,5 31
6 7,3 3 56
7 8,4 3,4 45
8 10,7 5,2 35
9 11,1 5,4 32
10 7,3 2,9 54
Условия:
Определите эндогенные и экзогенные переменные задачи. Выдвинете гипотезу о виде связи между зависимой и независимыми переменными и запишите соответствующую модель.
Найдите оценки параметров модели из задания 1, запишите полученное оценочное уравнение множественной регрессии и поясните экономический смысл его параметров при переменных. Задачу решить в Пакете анализа данных MS Excel.
Определите парные коэффициенты корреляции с помощью инструмента Корреляция MS Excel. Между какими показателями коэффициент корреляции наибольший, сделайте выводы. Выясните возможную мультиколлинеарность в модели.
Используя найденные парные коэффициенты корреляции, вычислить частные коэффициенты корреляции. Сделайте выводы.
Определить коэффициент детерминации, множественный коэффициент корреляции, скорректированный коэффициент детерминации, сделайте выводы.
Найдите коэффициенты эластичности по всем переменным. Определите, какой фактор оказывает наибольшее влияние на У.
Запишите уравнение регрессии в стандартизованном виде.
Определить значимость параметров модели. Определите доверительные интервалы для параметров множественной регрессии.
Дайте оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера.
Проверьте выполнение условий Гаусса-Маркова на основе критерия Дарбина-Уотсона и теста Спирмена. Сделайте выводы.
Подведите общий итог: можно ли использовать данную модель для прогноза? Если нет, то, как следует изменить модель для ее практического использования?
Нужно полное решение этой работы?
Решение
Эндогенная переменная для нашей задачи является производительность труда, 2 экзогенные - энерговооруженность и доля рабочих ручного труда в общей численности рабочих.
Для выявления связи между зависимой и независимыми переменными построим поле корреляции.
Рис.2. Поле корреляции
Таким образом, можно утверждать, что связь между энерговооруженностью и производительностью труда прямая сильная т.е. с увеличением энерговооруженности на ед. возрастает производительность труда.Связь между долей рабочих ручного труда в общей численности рабочих и производительностью труда обратная сильная т.е. с увеличением долей рабочих ручного труда в общей численности рабочих на ед. возрастает производительность труда.
2.Для получения уравнения регрессии используем "Сервис"→"Анализ данных"→"Регрессия". Указываем исходные эндогенные и экзогенные переменные, а также заданный уровень значимости. Получаем следующий результат.
Рис.1. Результат множественной регрессии
Запишем уравнение регрессии:
Коэффициент показывает, что при увеличении энерговооруженности на 1 квт-час на 1 рабочего следует ожидать повышения производительности труда на 0,834 млн. руб. на 1 рабочего.
Коэффициент показывает, что при доли рабочих ручного труда в общей численности рабочих на 1 % следует ожидать понижения производительности труда на 0,098 млн. руб. на 1 рабочего.
3. Определим парные коэффициенты корреляции с помощью инструмента Корреляция MS Excel.
Рис.2. Результаты инструмента Корреляция MS Excel
Связь между у и х1=0,950 – связь сильная прямая
Связь между у и х2=-0,942 – связь сильная обратная
Наибольшее влияние на результативный признак оказывает фактор x1(r = 0,950)
В нашем случае все парные коэффициенты корреляции |r|<0.7, что говорит об отсутствии мультиколлинеарности факторов
4.На основании частных коэффициентов можно сделать вывод об обоснованности включения переменных в регрессионную модель
. Если значение коэффициента мало или он незначим, то это означает, что связь между данным фактором и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели.
EQ ryx1/x2 = EQ \f(ryx1 - ryx2·rx1x2;\r((1-r2yx2)(1-r2x1x2)))
Теснота связи низкая.
5. Найдем коэффициент множественной корреляции по формуле (или воспользуемся дальнейшими результатами п.2)
.
Связь между признаком Y и факторами Xi сильная
Коэффициент детерминации равен .
Это значит, что изменение производительности труда на 97,8% зависит от изменения исследуемых факторов, а на долю других факторов приходится 2,2% изменения результативного показателя.
Более объективной оценкой является скорректированный коэффициент детерминации:
6. Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.
Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E2| < 1. Следовательно, его влияние на результативный признак Y незначительно.
7. Искомое уравнение в стандартизованном масштабе: ty=β1tx1+β2tx2
Расчет β-коэффициентов можно выполнить и по формулам:
Стандартизированная форма уравнения регрессии имеет вид:
ty = 0.051x1 -0.046x2
8. Tтабл (n-m-1;α/2) = (7;0.05) = 2.365
>2.365
Статистическая значимость коэффициента регрессии b0 подтверждается.
>2.365
Статистическая значимость коэффициента регрессии b1 подтверждается.
>2.365
Статистическая значимость коэффициента регрессии b2 подтверждается