Проверить наличие коллинеарности и мультиколлинеарности. Отобрать неколлинеарные факторы.
2. Построить уравнение линейной регрессии.
3. Определить коэффициент множественной корреляции.
4. Проверить адекватность уравнения при уровнях значимости 0,05 и 0,01.
5. Построить частные уравнения регрессии.
6. Определить средние частные коэффициенты эластичности.
7. Построить уравнение линейной множественной регрессии в стандартизированном масштабе.
8. Оценить информативность факторов на основе уравнения линейной регрессии в стандартизированном масштабе.
9. Вычислить частные коэффициенты корреляции.
10. Оценить их значимость при уровнях значимости 0,05 и 0,01.
11. Оценить информативность факторов на основе частных коэффициентов корреляции.
12. Проверить гипотезу о гомоскедастичности ряда остатков с уровнем значимости α = 0,05.
Решение
Проверить наличие коллинеарности и мультиколлинеарности. Отобрать неколлинеарные факторы.
Для проверки наличия коллинеарности или мультиколлинеарности необходимо построить корреляционную матрицу, используя СервисАнализ данныхКорреляция табличного процессора MS Excel.
Рис. 2.1. Корреляционная матрица, построенная для всех независимых переменных x1,…,x6 и зависимой переменной у.
Из рисунка 2.1 следует, что x1 коллинеарна с переменными x2,…,x6, так как коэффициенты корреляции между ними больше 0,7. Заметим, что x2 коллинеарна с переменными x1,x3, x5,x6, так как коэффициенты корреляции между ними больше 0,7. Также x3 коллинеарна с переменными x1,x2, x5, x6, так как коэффициенты корреляции между ними больше 0,7. Переменная x4 коллинеарна с переменными x1, так как коэффициенты корреляции между ними больше 0,7. Переменная x6 коллинеарна с переменными x1,x2, x3,x5, так как коэффициенты корреляции между ними больше 0,7. Видим, что сразу из рассмотрения можем исключить переменные x1,x2,x3 из-за коррелированности со всеми показателями. Наблюдается корреляция между x5 и x6, необходимо оставить переменную x6, так как она сильнее влияет на зависимую переменную y чем x5.
Таким образом, в линейное уравнение множественной регрессии могут быть включены независимые переменные x4 и x6, так как коэффициент корреляции между ними меньше 0,7.
2. Построить уравнение линейной регрессии.
Используя СервисАнализ данныхРегрессия построим уравнение линейной регрессии.
Рис. 2.2. Вывод итогов, содержащей регрессионные коэффициенты для переменных, включенных в регрессию
Из приведенной таблицы (Рис. 2.2), получается следующее множественное регрессионное уравнение, содержащие две независимые переменные:
3. Определить коэффициент множественной корреляции.
Указанный коэффициент множественной корреляции R, наряду с коэффициентом детерминации R2 и скорректированным коэффициентом детерминации приведен в верхней таблице рабочего листа вывода итогов (Рис. 2.3).
Рис. 2.3. Вывод итогов, содержащий R, R2 и скорректированный R2.
4. Проверить адекватность уравнения при уровнях значимости 0,05 и 0,01.
Проверка значимости уравнения регрессии основана на использовании F-критерии Фишера. Фактическое значение Фишера Fфакт берется из таблицы "Дисперсионный анализ" листа вывода итогов (Рис. 2.4):
Рис. 2.4. Вывод итогов, содержащий результаты дисперсионного анализ.
Из рисунка 2.4 получается, что Fфакт = 159,49
Для определения критического значения Fкрит используется встроенная функция MS Excel «FРАСПОБР».
Видим, что критическое значение при уровне значимости α=0,05: Fкрит=3,885. Так как расчетное значение Fфакт = 159,491 больше Fкрит=3,885, то с вероятностью p=0,95 (где p=1-α) можно утверждать, что полученное регрессионное уравнение является адекватным.
Критическое значение при уровне значимости α=0,01: Fкрит=6,927. Так как расчетное значение Fфакт =159,491 больше Fкрит=6,927, то с вероятностью p=0,99 (где p=1-α) можно утверждать, что полученное регрессионное уравнение является адекватным
. Если Fфакт меньше Fкрит, то делается обратный вывод.
5. Построить частные уравнения регрессии.
Строятся частные регрессионные уравнения, предварительно определив средние значения зависимой и независимых переменных, входящих в регрессионное уравнение. В нашем случае:
Частное уравнение регрессии характеризует взаимосвязь зависимой переменной у от независимой xi при неизменном уровне всех остальных (значения всех остальных переменных считается равным их среднему)
Частное уравнения зависимости у от независимой x4 будет иметь следующий вид:
Частное уравнения зависимости у от независимой x4 будет иметь следующий вид:
6. Определить средние частные коэффициенты эластичности.
Найдем средний коэффициент эластичности для множественной регрессии:
.
В табл. 2.1 представлен расчет средних частных коэффициентов эластичности множественной регрессии.
Таблица 2.1. Расчет среднего частного коэффициента эластичности множественной регрессии
Переменная Эластичность, %
x4 1,44
x6 -1,87
7. Построить уравнение линейной множественной регрессии в стандартизированном масштабе.
Предварительно, необходимо перейти к новым зависимой ty и независимым переменным , стандартизировав исходные переменные по формулам (Рис. 2.5):
(l=1,2,…,p),
где
- средняя арифметическая y (функция MS Excel СРЗНАЧ( )),
- средняя арифметическая xl (функция MS Excel СРЗНАЧ( )),
- среднеквадратическое отклонение y (функция MS Excel СТАНДОТКЛОН( )),
- среднеквадратическое отклонение xl (функция MS Excel СТАНДОТКЛОН( )).
Для проверки корректности стандартизации необходимо рассчитать все средние и среднеквадратические отклонения для новых переменных. Все средние должны быть 0, а среднеквадратические отклонения 1.
Рис. 2.5. Стандартизированные исходные переменные
Построим корреляционную матрицу (Рис. 2.6).
Рис. 2.6. Корреляционная матрица
Анализируя полученную таблицу, приходим к выводу, что полученные результаты для стандартизированных переменных идентичны результатам, полученным по данным без преобразований. Следовательно, для исследования используем tx4 и tx6.
Построим уравнение регрессии для переменных в стандартизированном масштабе, используя СервисАнализ данныхРегрессия.
Рис. 2.7. Уравнение регрессии в стандартизированном масштабе
Получим:
.
8. Оценить информативность факторов на основе уравнения линейной регрессии в стандартизированном масштабе.
Cделаем заключение о наиболее информативных независимых переменных по значениям коэффициентов регрессии и направлении их влияния на ty. (Чем больше по модулю коэффициент регрессии для независимой переменной, тем большее влияние оказывает эта переменная на зависимую ty).
Анализируя полученное уравнение регрессии в стандартизированном масштабе, приходим к выводу, что наибольшее влияние оказывает переменная
tx6.
9. Вычислить частные коэффициенты корреляции.
Расчет частного коэффициента корреляции между стандартизированными y и xi необходимо произвести по формуле:
,
где
- общий коэффициент детерминации,
- коэффициент детерминации, полученный при исключении стандартизированной переменной xi из регрессионного уравнения.
В нашем случае количество переменных p будет равно 2.
В табл