Необходимо проверить рабочие гипотезы:
1. Проверьте наличие аномальных объектов, последовательно исключите их.
2. На основе рабочих гипотез постройте систему структурных уравнений и проведите их идентификацию
3. Проанализируйте результаты построения приведённых уравнений
4. Оцените надёжность и качество структурных уравнений расчётом коэффициента автокорреляции отклонений и средней ошибки аппроксимации.
5. Иллюстрируйте результаты графиками фактических и расчётных значений результатов.
Решение
1. Проверим исходное множество на наличие в нём территорий с аномальными значениями признаков. Примером цензурирования данных является удаление аномальных наблюдений в соответствии с правилом трех сигм. Согласно этому правилу практически все наблюдения нормально распределенного признаках отклоняются от своего математического ожидания р менее чем на три средних квадратических отклонения σ: . Наблюдения, не попадающие в интервал, признаются аномальными.
Используем формулы:
.
Строим таблицу.
Y1 Y2 Y3 X1 X2 X3
1 6,46 6,804 11,6 4,28 5,26 30,6
2 9,07 6,899 11,7 3,98 5,94 35,7
3 6,46 5,063 11,3 3,43 5,4 36,3
4 5,54 5,115 8,1 3,13 4,98 33,1
5 9,27 7,616 12,9 4,56 6,3 36,9
6 4,63 5,995 9,8 2,95 5,18 35,8
7 4,26 3,69 11 2,78 4,62 35
8 3,45 4,571 9,4 2,94 4,56 32,4
9 3,21 3,498 11,9 3,09 4,32 33,9
10 3,73 4,048 9,4 2,95 4,38 38,4
11 2,89 3,422 9,3 2,27 4,8 29,3
12 3,34 3,226 12,1 2,53 4,52 29,1
13 3 3,124 14,9 2,57 4,42 32,9
14 3,43 4,333 8,3 2,53 4,52 30,3
15 3,56 4,148 8,8 2,57 4,4 33,8
16 6,22 17,078 5,2 3,69 5 30,2
17 4,4 3,685 9,5 2,93 4,74 34,5
18 2,89 4,042 7,3 2,16 4,64 35,3
19 3,41 3,268 6,4 2,41 4,3 33,4
20 3,27 3,785 9,6 2,32 4,4 32,6
21 3,57 3,392 8 2,52 4,44 37
22 3,52 4,318 5,9 2,42 4,62 31,9
23 3,81 4,595 11,5 2,92 4,58 30,5
Итого 103,39 115,715 223,9 67,93 110,32 768,9
Средняя 4,50 5,03 9,73 2,95 4,80 33,43
СКО 1,80 2,85 2,31 0,63 0,51 2,58
Дисперсия 3,24 8,10 5,34 0,40 0,26 6,66
Из таблицы видим, что:
- по Y1: - аномальных наблюдений нет;
- по Y2: - аномальное наблюдение №17, исключаем его;
- по Y3: - аномальных наблюдений нет;
- по Х1: - аномальных наблюдений нет;
- по Х2: - аномальных наблюдений нет;
- по Х3: - аномальных наблюдений нет.
Исключаем только регион №17.
2. На основе рабочих гипотез построим систему структурных уравнений и проведем их идентификацию.
Модель 1:
Y1=-3,484+0,167Y3+0,190X3.
Модель 2:
Y2=0,891-0,16Y1-0,686Y3+3,929X1.
Модель 3:
Y3=0,381-0,429Y2+2,407X2.
В нашей задаче система уравнений для описания выдвигаемых рабочих гипотез будет иметь следующий вид:
Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос – имеют ли решения каждое из уравнений и система в целом
. Воспользуемся счётным правилом, по которому в каждом уравнении системы необходимо сравнить HY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.
Результаты идентификации структурных уравнений и всей системы.
Номер уравнения Число эндогенных переменных в уравнении, H Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D Сравнение параметров H и D+1 Решение об идентификации уравнения
1 2 2 2>2-1 Не идентифицирована
2 3 2 2= 3-1 Точно идентифицировано
3 2 2 1 > 2-1 Не идентифицирована
Вся система уравнений в целом Не идентифицирована
3.В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким образом, чтобы идентификация была возможна.
4. Оценим надёжность и качество структурных уравнений расчётом коэффициента автокорреляции отклонений и средней ошибки аппроксимации.
Определим коэффициент автокорреляции отклонений по формуле:
, где е – отклонение фактических значений от теоретических. Строим таблицу.
Для модели 1.
№ ei
ei-1 2 2
1 2,181 - - - - 0,338
2 3,803 2,181 8,293 14,462 4,756 0,419
3 1,145 3,803 4,355 1,312 14,462 0,177
4 1,369 1,145 1,568 1,873 1,312 0,247
5 3,574 1,369 4,892 12,774 1,873 0,386
6 -0,339 3,574 -1,212 0,115 12,774 0,073
7 -0,757 -0,339 0,257 0,573 0,115 0,178
8 -0,805 -0,757 0,609 0,648 0,573 0,233
9 -1,748 -0,805 1,407 3,055 0,648 0,544
10 -1,668 -1,748 2,915 2,781 3,055 0,447
11 -0,758 -1,668 1,264 0,574 2,781 0,262
12 -0,737 -0,758 0,558 0,543 0,574 0,221
13 -2,268 -0,737 1,671 5,143 0,543 0,756
14 -0,241 -2,268 0,548 0,058 5,143 0,070
15 -0,861 -0,241 0,208 0,742 0,058 0,242
16 3,085 -0,861 -2,657 9,516 0,742 0,496
17 -1,567 3,085 -4,833 2,455 9,516 0,542
18 -0,535 -1,567 0,838 0,286 2,455 0,157
19 -1,056 -0,535 0,565 1,116 0,286 0,323
20 -1,327 -1,056 1,402 1,762 1,116 0,372
21 -0,056 -1,327 0,074 0,003 1,762 0,016
22 -0,433 -0,056 0,024 0,188 0,003 0,114
Итого -2,181 0,433 22,745 59,979 64,547 6,613
Получаем:
Так как значение коэффициент около 0,3 по модулю, то можно утверждать об отсутствии автокорреляции остатков.
Определим среднюю ошибку аппроксимации:
%.
Можно сделать вывод, что модель неточная, так как средняя ошибка аппроксимации превышает 8-10%.
Для модели 2.
№ ei
ei-1 2 2
1 -1,90983 - - - - 0,281
2 -0,14984 -1,910 0,286 0,022 3,647 0,022
3 -0,51688 -0,150 0,077 0,267 0,022 0,102
4 -1,62949 -0,517 0,842 2,655 0,267 0,319
5 -0,85622 -1,629 1,395 0,733 2,655 0,112
6 0,978895 -0,856 -0,838 0,958 0,733 0,163
7 0,106229 0,979 0,104 0,011 0,958 0,029
8 -0,86913 0,106 -0,092 0,755 0,011 0,190
9 -0,85415 -0,869 0,742 0,730 0,755 0,244
10 -1,38663 -0,854 1,184 1,923 0,730 0,343
11 0,456219 -1,387 -0,633 0,208 1,923 0,133
12 1,232273 0,456 0,562 1,518 0,208 0,382
13 2,840358 1,232 3,500 8,068 1,518 0,909
14 -0,25429 2,840 -0,722 0,065 8,068 0,059
15 -0,2325 -0,254 0,059 0,054 0,065 0,056
16 6,251663 -0,233 -1,454 39,083 0,054 0,366
17 0,135825 6,252 0,849 0,018 39,083 0,034
18 -2,15496 0,136 -0,293 4,644 0,018 0,659
19 0,889449 -2,155 -1,917 0,791 4,644 0,235
20 -1,33948 0,889 -1,191 1,794 0,791 0,395
21 -1,4698 -1,339 1,969 2,160 1,794 0,340
22 0,732291 -1,470 -1,076 0,536 2,160 0,159
Итого 1,909831 -0,732 3,355 66,996 70,107 5,532
Получаем:
Так как значение коэффициент ниже 0,3 по модулю, то можно утверждать об отсутствии автокорреляции остатков.
Определим среднюю ошибку аппроксимации:
%.
Можно сделать вывод, что модель неточная, так как средняя ошибка аппроксимации превышает 8-10%.
Для модели 3.
№ ei
ei-1 2 2
1 1,480 - - - - 0,128
2 -0,016 1,480 -0,024 0,000 2,189 0,001
3 0,096 -0,016 -0,002 0,009 0,000 0,008
4 -2,071 0,096 -0,198 4,289 0,009 0,256
5 0,625 -2,071 -1,295 0,391 4,289 0,048
6 -0,475 0,625 -0,297 0,226 0,391 0,048
7 1,084 -0,475 -0,515 1,175 0,226 0,099
8 0,006 1,084 0,007 0,000 1,175 0,001
9 2,624 0,006 0,017 6,883 0,000 0,220
10 0,215 2,624 0,564 0,046 6,883 0,023
11 -1,164 0,215 -0,250 1,355 0,046 0,125
12 2,226 -1,164 -2,591 4,953 1,355 0,184
13 5,222 2,226 11,623 27,274 4,953 0,351
14 -1,100 5,222 -5,742 1,209 27,274 0,132
15 -0,390 -1,100 0,429 0,152 1,209 0,044
16 0,113 -0,390 -0,044 0,013 0,152 0,022
17 -2,513 0,113 -0,284 6,316 0,013 0,344
18 -2,927 -2,513 7,356 8,567 6,316 0,457
19 0,254 -2,927 -0,744 0,065 8,567 0,026
20 -1,611 0,254 -0,409 2,594 0,065 0,201
21 -3,747 -1,611 6,035 14,037 2,594 0,635
22 2,068 -3,747 -7,750 4,279 14,037 0,180
Итого -1,480 -2,068 5,885 83,834 81,745 3,535
Получаем:
Так как значение коэффициент ниже 0,3 по модулю, то можно утверждать об отсутствии автокорреляции остатков.
Определим среднюю ошибку аппроксимации:
%.
Можно сделать вывод, что модель неточная, так как средняя ошибка аппроксимации превышает 8-10%.
5