Нелинейные модели регрессии и их линеаризация
Даны следующие статистические данные
регион Y X1
1 30,90 20372
2 33,04 17039
3 32,90 15569
4 34,67 20505
5 33,76 15409
6 33,42 19984
7 34,10 14320
8 33,79 18188
9 34,50 20263
10 35,31 29948
11 33,32 14981
12 34,79 16988
13 33,36 16788
14 35,30 17377
15 32,33 15602
16 33,60 18040
17 34,15 18876
Построить корреляционное поле и выдвинуть гипотезу о форме зависимости между рассматриваемыми показателями.
Построить уравнение регрессии
Оценить параметры и само уравнение регрессии.
Решение
Построим корреляционное поле и выдвинуть гипотезу о форме зависимости между рассматриваемыми показателями.
По виду поля корреляции можно предположить наличие линейной корреляционной зависимости Y по Х1 между двумя рассматриваемыми переменными. Но возможно и построение полиномиальной модели.
Построить уравнение регрессии:
Уравнение квадратичной парной регрессии имеет вид:
у = а0+а1х1+а2x2,
тогда, согласно МНК, будем иметь
В этой функции искомыми величинами являются параметры а0, а1, а2, поэтому, согласно необходимых условий экстремума функции, нужно, чтобы
,,
Продифференцируем данную функцию по всем переменным:
Это система нормальных уравнений в случае выбора квадратичной функции в качестве эмпирической функции.
Для расчетов построим вспомогательную таблицу (табл
. 1).
Таблица 12
№ п/п х у х2 х 3 х4 у х у х2
1 20372 30,9 415018384 8,45475E+12 1,7224E+17 629494,8 12824068066
2 17039 33,04 290327521 4,94689E+12 8,429E+16 562968,6 9592421294
3 15569 32,9 242393761 3,77383E+12 5,8755E+16 512220,1 7974754737
4 20505 34,67 420455025 8,62143E+12 1,7678E+17 710908,4 14577175717
5 15409 33,76 237437281 3,65867E+12 5,6376E+16 520207,8 8015882607
6 19984 33,42 399360256 7,98082E+12 1,5949E+17 667865,3 13346619756
7 14320 34,1 205062400 2,93649E+12 4,2051E+16 488312 6992627840
8 18188 33,79 330803344 6,01665E+12 1,0943E+17 614572,5 11177844994
9 20263 34,5 410589169 8,31977E+12 1,6858E+17 699073,5 14165326331
10 29948 35,31 896882704 2,68598E+13 8,044E+17 1057464 31668928278
11 14981 33,32 224430361 3,36219E+12 5,0369E+16 499166,9 7478019629
12 16988 34,79 288592144 4,9026E+12 8,3285E+16 591012,5 10040120690
13 16788 33,36 281836944 4,73148E+12 7,9432E+16 560047,7 9402080452
14 17377 35,3 301960129 5,24716E+12 9,118E+16 613408,1 10659192554
15 15602 32,33 243422404 3,79788E+12 5,9254E+16 504412,7 7869846321
16 18040 33,6 325441600 5,87097E+12 1,0591E+17 606144 10934837760
17 18876 34,15 356303376 6,72558E+12 1,2695E+17 644615,4 12167760290
Сумма 310249 573,24 5870316803 1,16207E+14 2,4288E+18 10481894 1,98888E+11
Подставим полученные данные в систему уравнений:
Решим систему уравнений по правилу Крамера:
,
,
.
Уравнение регрессии имеет вид:
Оценить параметры и само уравнение регрессии.
Коэффициент детерминации определяется по формуле:
Вычислим:
Множественный коэффициент детерминации , показывает, что около 12,7% вариации зависимой переменной учтено в модели и обусловлено влиянием включенного и на 87,3% — другими факторами, не включенными в модель.
Среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации по формуле:
Найдем величину средней ошибки аппроксимации :
.
В среднем, расчетные значения отклоняются от фактических на 2,15% поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии