Подобрать линейное уравнение регрессии, установить коэффициенты детерминации и ошибку регрессии, по критерию Фишера оценить надежность регрессии, построить график.
Подобрать наиболее адекватную нелинейную модель регрессии и сравнить ее показатели с линейным уравнением регрессии. Оценить надежности по критерию Фишера. Построить график.
Сделать выводы.
X: 1 2 5 6 9 10 12 14 18 20
Y: 2 5 10 12 13 14 15 17 21 24
Решение
1. Линейной уравнение регрессии вида 𝒚 = 𝜶 + 𝜷𝒙 + 𝜺.
Для оценки параметров линейного уравнения регрессии воспользуемся Excel, функцией:
𝒃 = ЛИНЕЙН(массив 𝒚;массив 𝒙)= 1,02
𝒂 = 𝒚̅ − 𝒃𝒙̅. 𝒚̅=13,30, 𝒙̅=9,70.
𝒂 =13,30-1,02*9,70=3,42
Оценка параметров уравнения по выборочным данным методом МНК приводит к уравнению регрессии вида: 𝒚̂ = 3,42+1,02𝒙.
Чтобы можно было сравнивать разные уравнения регрессии, рассчитаем коэффициент детерминации 𝑹 𝟐 и стандартную ошибку регрессии S.
𝑹 𝟐 = 𝒗𝒂𝒓(𝒚̂) / 𝒗𝒂𝒓(𝒚) = 0,959.
Для нахождения S воспользуемся Excel, функцией:
𝑺 = СТОШYX(массив 𝒚; массив 𝒙). 𝑺 = 1, 426.
Построение графика функции у(х) в Мастере диаграмм дает линейное уравнение регрессии (рисунок 1):
Рис.1. График линейного уравнения регрессии
Как видим, программная обработка данных увеличила коэффициент детерминации с 0,959 до 0,9593.
Коэффициент эластичности Э = 𝒃𝒙̅ /𝒚̅ = 1,02*9,70/13,30=0,74. Это означает, что с увеличением дохода на 1% расходы на потребление овощей и фруктов возрастут в среднем на 0,74%.
При рассмотрении парной линейной регрессии для нахождения 𝑭набл использовалось выражение
𝑭набл = 𝑹 𝟐 (𝒏 − 𝟐)/(𝟏 – 𝑹𝟐) = 0,959*8/(1-0,959)=188,67
Критическое значение по таблице Фишера при уровне значимости 0,05 и к1=1, к2=8 дает Fкрит=5,32
. Таким образом нулевая гипотеза отвергается и уравнение регрессии статистически значимое и надежное.
2. Нелинейной уравнение регрессии вида 𝒚 = 𝜶 + 𝜷x + ε.
Произведем замену переменной 𝒛 = х.
Уравнение примет вид: 𝒚 = 𝜶 + 𝜷𝒛 + 𝜺, т.е. станет линейным.
Для расчета параметров методом наименьших квадратов построим вспомогательную таблицу №1.
Таблица 1
Номер наблюдения z у у
(y-ŷх)2 (y-ycp)2
1 1,00 2 1 2,00 2,29 0,08 127,69
2 1,41 5 2 7,07 4,66 0,11 68,89
3 2,24 10 5 22,36 9,38 0,38 10,89
4 2,45 12 6 29,39 10,61 1,94 1,69
5 3,00 13 9 39,00 13,77 0,59 0,09
6 3,16 14 10 44,27 14,70 0,49 0,49
7 3,46 15 12 51,96 16,43 2,06 2,89
8 3,74 17 14 63,61 18,03 1,06 13,69
9 4,24 21 18 89,10 20,90 0,01 59,29
10 4,47 24 20 107,33 22,22 3,16 114,49
Сумма 29,18 133,00 97,00 456,09 133,00 9,88 400,10
Среднее значение 2,92 13,30 9,70 45,61 13,30 0,99 40,01
Параметры уравнения парной линейной регрессии у = а+ bх рассчитаем по формулам:
B=yz-yzz2-z2=45,61-2,92*13,309,70-2,922=5,74
a=y-bx=13,30-5,74*2,92=-3,46
Применим метод МНК для оценки тех же параметров, в итоге получили уравнение линейной регрессии:
𝒚̂ = -3,46+5,74𝒛, 𝑹 𝟐 = 𝒗𝒂𝒓(𝒚̂)/ 𝒗𝒂𝒓(𝒚) = 0,975, 𝑺 = 1,235
3