Логотип Автор24реферат
Задать вопрос
%
уникальность
не проверялась
Контрольная работа на тему:

Построение многофакторных регрессионных моделей и их интерпретация

уникальность
не проверялась
Аа
16033 символов
Категория
Эконометрика
Контрольная работа
Построение многофакторных регрессионных моделей и их интерпретация .pdf

Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥

Условие

Сформулировать постановку задачи Определить цель проведения корреляционно-регрессионного анализа. Выделить исследуемый показатель и набор факторов. Провести анализ исходных данных Проверка достаточности наблюдений Расчет статистических характеристик Проверка независимости наблюдений Проверка однородности данных Провести корреляционный анализ Оценить парные связи Оценить множественные связи Выявить коллинеарные факторы Построить поля корреляции Выявить направление связи Оценить надежность показателей тесноты связи Обосновать вид многофакторной регрессионной модели и оценить ее параметры рассчитать параметры уравнения регрессии используя метод последовательного исключения факторов из модели, исключить статистически ненадежные факторы записать полученное многофакторное уравнение регрессии провести проверку предпосылок применения метода наименьших квадратов Оценить качество построенной модели Рассчитать и оценить среднюю относительную ошибку аппроксимации Оценить коэффициент множественной детерминации Оценить F-критерий Провести интерпретацию полученных результатов Дать интерпретацию построенного уравнения регрессии Рассчитать бетта-коэффициенты и дать их интерпретацию Рассчитать коэффициенты эластичности и дать их интерпретацию Рассчитать доли влияния каждого их факторов, включенных в модель Отразить на графике фактические и модельные значения показателя. Примечание: отчет о выполненной работе представить в электронном виде.

Нужно полное решение этой работы?

Решение

Потяни, чтобы посмотреть
1. Постановка задачи
а. Целью настоящей работы является освоение методов описательной статистики и корреляционно-регрессионного анализа с применением пакета MS Excel на примере данных о значении факторного и результативных признаков.
b. Данными для анализа выступает выборка из результатов 50 наблюдений за значением результативного признака y и соответствующими ему значениями каждого из пяти факторных признаков x1…x5:
№ y x1 x2 x3 x4 x5
1 9,1 30505 212 1881,2 5,2 174
2 10,5 39701 215 2484 6,03 200
3 9,5 8092 99 613,6 3,8 179
4 9,2 9579 113 709,1 3,92 172
5 10 5836 121 793,9 2,28 121
6 8,2 17636 132 1027,8 8,42 180
7 8,5 11839 192 1205,3 4,19 107
8 9,4 16936 233 1586,4 3,88 157
9 8,7 6498 104 615,4 3,3 154
10 9,1 19750 145 1537,4 4,55 190
11 9,5 29748 206 2527,9 5,08 166
12 9,4 29781 216 1914,1 4,26 176
13 10,7 34253 189 2106,8 6,1 199
14 9,3 8995 107 644,9 3,9 174
15 8,9 9768 111 718,9 3,93 159
16 11,2 4936 65 522,1 2,32 150
17 8,3 18705 134 1028,5 8,4 184
18 8,1 11717 185 1109,4 4,13 107
19 9,7 15461 218 1409,9 3,68 152
20 8,7 6723 100 618,5 3,37 161
21 9,4 17836 112 1317,9 4,9 189
22 9,2 28991 269 2338,6 4,96 166
23 9 31064 312 2017,6 3,75 166
24 10,7 38729 206 2137,1 5,9 208
25 8,7 10096 140 697 3,9 153
26 9 10640 148 702,5 3,82 154
27 12,2 4160 54 390,1 2,26 167
28 8,4 20864 150 116,4 7,89 194
29 8,3 12744 219 1108,3 4,05 115
30 8,9 29185 165 1454,2 3,7 177
31 8 5544 121 630,6 3,15 155
32 8,6 13222 117 914 4,49 153
33 9 27498 321 1865,2 3,63 160
34 10,3 38003 209 2110,5 5,78 200
35 8,5 11198 167 766,9 3,77 158
36 8,2 10674 173 695,4 3,68 140
37 12,5 4547 56 396,8 2,23 185
38 7,9 24073 200 1240,8 7,71 187
39 8 11490 231 1007,9 3,93 110
40 7,9 7879 135 714,8 3,69 156
41 7,5 5308 122 374,3 3,05 144
42 8,3 12306 115 882,2 4,48 153
43 9,4 35900 275 1400,2 4,7 166
44 8,8 28185 348 1860,8 3,63 154
45 10,5 35934 200 1877,4 5,57 204
46 8,5 12284 190 792,7 3,55 156
47 8,5 11259 198 723,8 3,41 155
48 12,2 4865 69 482,6 2,2 180
49 8,3 29435 263 1512 7,14 162
50 7,4 10296 250 901,7 3,7 107
2. Анализ исходных данных
а. Число наблюдений должно в 6-8 раз превосходить количество факторов. Число факторов равно 5, следовательно, число наблюдений 50 является достаточным для построения модели.
b. Выполним оценку статистических характеристик, используя надстройку «Описательная статистика»:
y x1 x2 x3 x4 x5
Среднее 9,16 17613,36 172,64 1169,71 4,39 162,72
Стандартная ошибка 0,16 1544,82 9,73 88,24 0,21 3,59
Медиана 8,95 12525,00 170,00 1017,85 3,91 161,50
Мода 8,50 #Н/Д 121,00 #Н/Д 3,90 166,00
Стандартное отклонение 1,16 10923,49 68,81 623,96 1,52 25,36
Дисперсия выборки 1,35 119322742,15 4735,46 389329,15 2,30 642,90
Эксцесс 1,41 -1,00 -0,13 -0,73 1,14 0,22
Асимметричность 1,24 0,61 0,45 0,58 1,15 -0,56
Интервал 5,10 35541,00 294,00 2411,50 6,22 101,00
Минимум 7,40 4160,00 54,00 116,40 2,20 107,00
Максимум 12,50 39701,00 348,00 2527,90 8,42 208,00
Сумма 458,10 880668,00 8632,00 58485,40 219,36 8136,00
Счет 50 50 50 50 50 50
c. Для проверки независимости наблюдений используем критерий серий, основанный на медиане выборки. Для этого для каждого признака выполним данную процедуру.
Сравним каждое значение показателя с медианой: поставим знак +, если значение больше медианы; знак ‒, если значение меньше медианы и пропустим его, если оно равно медиане. Подсчитаем число серий подряд идущих плюсов или минусов υ(n), а также длину самой большой серии τ(n). Проверим выполнение неравенств:
υ(n)>[12(n+1-1,96n-1)]τ(n)<[3,3(lgn+1)]
Расчетные значения критерия для переменных:
y x1 x2 x3 x4 x5
υ(n) 24 24 21 20 30 24
τ(n) 5 4 5 4 4 5
В данном случае критические значения равны:
1250+1-1,9650-1=183,3lg50+1=8
Для каждой переменной выполнены оба неравенства, следовательно, на уровне значимости 0,05 подтверждается независимость наблюдений.
d . Для оценки однородности данных определим коэффициент вариации для каждой переменной:
v=σx∙100%
y x1 x2 x3 x4 x5
Среднее 9,16 17613,36 172,64 1169,71 4,39 162,72
Стандартное отклонение 1,16 10923,49 68,81 623,96 1,52 25,36
V 12,68% 62,02% 39,86% 53,34% 34,60% 15,58%
Коэффициент вариации не превышает 33% для переменных y, x5. Следовательно, эти данные однородны.
Коэффициент вариации превышает 33% для переменных х1, х2, х3, х4. Следовательно, эти данные неоднородны.
3. Корреляционный анализ
а. Для оценки парных связей в модели построим матрицу парных коэффициентов корреляции:
  y x1 x2 x3 x4 x5
y 1,00
x1 0,12 1,00
x2 -0,29 0,67 1,00
x3 0,13 0,88 0,70 1,00
x4 -0,25 0,58 0,25 0,37 1,00
x5 0,47 0,53 -0,11 0,32 0,46 1,00
Результативный признак y имеет слабую парную связь с факторами х1, х2, х3, х4 и умеренную связь с фактором х5.
б. Оценим коэффициент множественной корреляции между признаком y и группой факторов х1….х5:
Ry|x1…x5=1-ΔΔyy
где Δ − определитель матрицы парных коэффициентов корреляции, Δyy − алгебраическое дополнение элемента ryy этой корреляционной матрицы.
Для вычисления определителей используем функцию МОПРЕД.
Ry|x1…x5=1-0,010,02=0,76
Связь между признаком y и группой факторов х1….х5 тесная (коэффициент множественной корреляции больше 0,7).
c. Связь между факторами х1 и х3, х2 и х3 тесная (коэффициенты парной корреляции больше 0,7), следовательно, в модели присутствует мультиколлинеарность. Совместное включение коллинеарных факторов в модель нежелательно.
d. Построим поля корреляции между y и каждым из факторов:
На каждом из полей корреляции облако точек является достаточно бесформенным (не образует выраженной прямой линии с положительным или отрицательным наклоном), что подтверждает вывод относительно отсутствия тесной парной связи между результативным признаком и факторами.
e. Парная связь между результативным признаком и факторами х1, х3, х5 прямая (коэффициенты парной корреляции положительны). Парная связь между результативным признаком и факторами х2, х4 обратная (коэффициенты парной корреляции отрицательны).
f. Оценим надежность показателей тесноты связи на основе критерия Стьюдента. Для парных коэффициентов корреляции между признаком y и факторами вычислим статистику:
t=rn-1-11-r2
Т-Статистика - расчетное значение
x1 0,81
x2 -2,09
x3 0,91
x4 -1,80
x5 3,68
Критическое значение критерия для 50-1-1 степеней свободы и уровня значимости 0,05 равно 2,01.
Расчетное значение критерия по модулю превышает критическое для коэффициентов корреляции между признаком y и факторами х2, х5. Следовательно, эти коэффициенты корреляции значимы на уровне 0,05 (связь статистически подтверждается).
Остальные коэффициент не значимы на уровне 0,05 (расчетные значения критерия по модулю меньше критического).
Для множественного коэффициента корреляции между признаком y и группой факторов вычислим статистику:
t=rn-5-11-r2
t=0,7650-5-11-0,762=7,83
Критическое значение критерия для 50-5-1 степеней свободы и уровня значимости 0,05 равно 2,02.
Расчетное значение критерия по модулю превышает критическое, следовательно, множественный коэффициент корреляции значим на уровне 0,05 (связь статистически подтверждается).
4. Построение многофакторной регрессионной модели
a. Построим уравнение множественной регрессии, используя все факторы:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,76
R-квадрат 0,58
Нормированный R-квадрат 0,53
Стандартная ошибка 0,79
Наблюдения 50,00
Дисперсионный анализ
  df SS MS F Значимость F
Регрессия 5,00 38,54 7,71 12,27 0,00
Остаток 44,00 27,64 0,63
Итого 49,00 66,18      
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 8,61 1,50 5,73 0,00 5,58 11,64
x1 0,00005 0,00 1,23 0,23 0,00 0,00
x2 -0,01 0,00 -2,68 0,01 -0,02 0,00
x3 0,00044 0,00 1,00 0,32 0,00 0,00
x4 -0,49 0,10 -4,91 0,00 -0,69 -0,29
x5 0,02 0,01 2,21 0,03 0,00 0,03
Модель имеет вид:
y=8,61+0,00005x1-0,01x2+0,00044x3-0,49x4+0,02x5
b
50% задачи недоступно для прочтения
Переходи в Кампус, регистрируйся и получай полное решение
Получить задачу
Больше контрольных работ по эконометрике:
Все Контрольные работы по эконометрике
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты