Требуется:
Для характеристики зависимости y от x рассчитать параметры линейной регрессии.
Оценить полученную модель регрессии через среднюю ошибку аппроксимации, коэффициент детерминации и F- критерий Фишера.
Таблица 1
x y
53,6 68,7
52,4 72,4
51,4 66,8
55,0 70,0
53,7 66,1
51,0 72,0
47,2 71,7
Решение
Линейная регрессия имеет вид:
y =a *bх
где a и b – параметры регрессии.
Определим параметры уравнения регрессии с помощью метода наименьших квадратов. Для линейных уравнений решается следующая система относительно a и b:
na+bx=yax+bx2=yx
Путем аналитического решения приведенной выше системы получаем готовые формулы для расчета коэффициентов регрессии:
a=y-b*x,
b=yx-y*xx2-(x)2
С помощью Excel составим расчетную таблицу 2.
Таблица 2 – Расчетная таблица
x y xy x2 y2 yx
y-yx
Ai
1 53,6 68,7 3682,32 2872,96 4719,69 90,47 -21,77 31,69
2 52,4 72,4 3793,76 2745,76 5241,76 90,06 -17,66 24,40
3 51,4 66,8 3433,52 2641,96 4462,24 89,66 -22,86 34,22
4 55 70 3850 3025 4900 89,25 -19,25 27,50
5 53,7 66,1 3549,57 2883,69 4369,21 88,84 -22,74 34,40
6 51 72 3672 2601 5184 88,43 -16,43 22,83
7 47,2 71,7 3384,24 2227,84 5140,89 88,03 -16,33 22,77
Сумма 364,30 487,70 25365,41 18998,21 34017,79 624,74 -137,04 197,80
Среднее 52,04 69,67 3623,63 2714,03 4859,68 89,25 -19,58 28,26
σ 2,549 2,551
σ2 6,50 6,51
Рассчитаем коэффициенты уравнения регрессии:
b=3623,63-69,67*52,042714,03-(52,04)2=-0,41
a=69,67--0,41*52,04=90,88
Уравнение регрессии принимает вид:
y=90,88-0,41x
Рассчитаем теоретические значения yx, подставляя значение х в полученное уравнение регрессии, с помощью Excel
. А также рассчитаем отклонение фактических значений от теоретических y-yx , и ошибку аппроксимации. Результаты занесем в таблицу 2.
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции rxy для линейной регрессии ( 1 rxy 1):
rxy=bσxσy=yx-y*xσxσy
где - среднеквадратическое отклонение.
rxy=-0,41*2,5492,551=-0,407
Связь между x и y слабая и обратная.
Коэффициент детерминации определим по формуле:
rxy2=(0,407)2=0,166
Проведем оценку уравнения регрессии с помощью F-теста.
F-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи