Подобрать линейное уравнение регрессии, установить коэффициенты детерминации и ошибку регрессии, по критерию Фишера оценить надежность регрессии, построить график.
Подобрать наиболее адекватную нелинейную модель регрессии и сравнить ее показатели с линейным уравнением регрессии. Оценить надежности по критерию Фишера. Построить график.
Сделать выводы.
X: 1 4 5 7 8 10 11 13 15 17
Y: 2 8 10 12 13 14 15 19 21 24
Решение
1. Линейной уравнение регрессии вида 𝒚 = 𝜶 + 𝜷𝒙 + 𝜺.
Для оценки параметров линейного уравнения регрессии воспользуемся Excel, функцией:
𝒃 = ЛИНЕЙН(массив 𝒚;массив 𝒙),
𝒂 = 𝒚̅ − 𝒃𝒙̅. 𝒚̅=13,80, 𝒙̅=9,10.
𝒂 =13,08-9,80*1,26=2,32
Оценка параметров уравнения по выборочным данным методом МНК приводит к уравнению регрессии вида: 𝒚̂ = 2,32 + 1,26𝒙.
Чтобы можно было сравнивать разные уравнения регрессии, рассчитаем коэффициент детерминации 𝑹 𝟐 и стандартную ошибку регрессии S.
𝑹 𝟐 = 𝒗𝒂𝒓(𝒚̂) / 𝒗𝒂𝒓(𝒚) = 𝟎,989.
Для нахождения S воспользуемся Excel, функцией:
𝑺 = СТОШYX(массив 𝒚; массив 𝒙). 𝑺 = 1, 02.
Построение графика функции у(х) в Мастере диаграмм дает линейное уравнение регрессии (рисунок 1):
Рис.1. График линейного уравнения регрессии
Как видим, программная обработка данных не изменила коэффициент детерминации с 0,9778 до 0,9778.
Коэффициент эластичности Э = 𝒃𝒙̅ /𝒚̅ = 1,26*9,10/13,80=0,83.
Это означает, что с увеличением х на 1% у возрастет в среднем на 0,83%.
При рассмотрении парной линейной регрессии для нахождения 𝑭набл использовалось выражение
𝑭набл = 𝑹 𝟐 (𝒏 − 𝟐)/(𝟏 – 𝑹𝟐) = 0,9778*8/(1-0,9778)=351,75
Критическое значение по таблице Фишера при уровне значимости 0,05 и к1=1, к2=8 дает Fкрит=5,32. Таким образом нулевая гипотеза отвергается и уравнение регрессии статистически значимое и надежное.
Т.к
. Fкрит < Fнабл, из чего следует, что уравнение регрессии статистически значимо.
2. Нелинейной уравнение регрессии вида 𝒚 = 𝜶 + 𝜷x + ε.
Произведем замену переменной 𝒛 = х.
Уравнение примет вид: 𝒚 = 𝜶 + 𝜷𝒛 + 𝜺, т.е. станет линейным.
Для расчета параметров методом наименьших квадратов построим вспомогательную таблицу №1.
Таблица 1
Номер наблюдения z у у
(y-ŷх)2 (y-ycp)2
1 1,00 2 1 2,00 1,20 0,64 139,24
2 2,00 8 4 16,00 7,90 0,01 33,64
3 2,24 10 5 22,36 9,49 0,26 14,44
4 2,65 12 7 31,75 12,24 0,06 3,24
5 2,83 13 8 36,77 13,46 0,21 0,64
6 3,16 14 10 44,27 15,70 2,89 0,04
7 3,32 15 11 49,75 16,73 3,01 1,44
8 3,61 19 13 68,51 18,67 0,11 27,04
9 3,87 21 15 81,33 20,47 0,29 51,84
10 4,12 24 17 98,95 22,14 3,45 104,04
Сумма 28,79 138,00 91,00 451,69 138,00 10,92 375,60
Среднее значение 2,88 13,80 9,10 45,17 13,80 1,09 37,56
Параметры уравнения регрессии рассчитаем по формулам:
B=yz-yzz2-z2=145,17-2,88*13,809,10-2,882=6,71
a=y-bx=13.80-2,88*6,71=-5,51
Применим метод МНК для оценки тех же параметров, в итоге получили уравнение линейной регрессии:
𝒚̂ = -5,51+6,71𝒛, 𝑹 𝟐 = 𝒗𝒂𝒓(𝒚̂)/ 𝒗𝒂𝒓(𝒚) = 0,971, 𝑺 = 0,172
3. В качестве уравнения регрессии рассмотрим нелинейной уравнение 𝒚 = 𝜶 + 𝜷/ 𝒙 + 𝜺.
Воспользуемся подстановкой 𝒛 = 𝟏/ 𝒙 .
Тогда уравнение примет линейный вид 𝒚 = 𝜶 + 𝜷𝒛 + 𝜺.
Таблица 22
Номер наблюдения z у у
(y-ŷх)2 (y-ycp)2
1 1,00 2 1,0000 2,0000 -0,08 4,34 139,24
2 0,25 8 0,0625 2,0000 13,12 26,17 33,64
3 0,20 10 0,0400 2,0000 14,00 15,97 14,44
4 0,14 12 0,0204 1,7143 15,00 9,01 3,24
5 0,13 13 0,0156 1,6250 15,32 5,36 0,64
6 0,10 14 0,0100 1,4000 15,76 3,08 0,04
7 0,09 15 0,0083 1,3636 15,92 0,84 1,44
8 0,08 19 0,0059 1,4615 16,16 8,06 27,04
9 0,07 21 0,0044 1,4000 16,34 21,69 51,84
10 0,06 24 0,0035 1,4118 16,48 56,55 104,04
Сумма 2,11 138,00 1,17 16,3762 138,00 151,07 375,60
Среднее значение 0,21 13,80 0,12 1,6376 13,80 15,11 37,56
Параметры уравнения парной линейной регрессии у = а+ bх рассчитаем по формулам:
B=yz-yzz2-z2=1.6376-0.21*13.800.12-0.212=-17.60
a=y-bx=13.80+17.60*0.21=17.52
Воспользовавшись МНК, оценим те же параметры и в итоге получили уравнение линейной регрессии 𝒚̂ = 17.52-17.60𝒛, на основании которого установлены:𝑹 𝟐 = 𝒗𝒂𝒓(𝒚̂) / 𝒗𝒂𝒓(𝒚) = 0.598, 𝑺 = 𝟎, 191.
В заключение необходимо построить графики функций y(x) и 𝒚̂(𝒙) для третьего варианта.
Замечание: На рисунке 2 представлена аппроксимация данных с помощью логарифмической функции, которая обеспечила достижение хорошего приближения также с высоким коэффициентом детерминации 𝑹 𝟐 = 0,8845
Рис.2