По заданному варианту экспериментальных данных (хh уi) , i = 1,…,n построить корреляционное поле и по визуальной оценке расположения точек на нем сделать предположение о виде зависимости Y от X . Отдельно рассмотреть резко выделяющиеся наблюдения.
Вычислить оценки числовых характеристик величин X и Y: эмпирические средние x и y , эмпирические дисперсии σх, σу, выборочную ковариацию cov(X, Y) и выборочный коэффициент корреляции r.
Методом наименьших квадратов найти оценки параметров a и b модели ли линейной регрессии y=a+bx .
Предсказать значение y* для заданного x*: y* =a+bx*. Вычислить , погрешность .
Построить прямую эмпирической регрессии y =a+bx. по точкам (x1, y1) и (x*,y*) на корреляционном поле.
. Оценить качество модели, вычислить коэффициент детерминации R2, определить значимость уравнения регрессии по критерию Фишера при уровне значимостиα=0,05
Номера наблюдений Х
1 2 3 4 5 6 7 8 9 10 11 12
Месяц (2011г.), х 1 2 3 4 5 6 7 8 9 10 11 12 15
Экспорт, у млн. долл. 31,0 38,9 43,1 45,6 44,1 43,6 41,8 44,2 43,3 45,7 47,2 50,2
Решение
По заданному варианту экспериментальных данных (хh уi) , i = 1,…,12 построим корреляционное поле и по визуальной оценке расположения точек на нем выдвинем гипотезу о линейной зависимости Y от X
Y=α+βX+ε
Для расчета числовых характеристик построим вспомогательную таблицу
Номер наблюдения месяц экспорт, млн. руб
x2 y2 xy
yi
еi=yi-yi
еi2
х у
1 1 31 1 961 31 37,627 -6,627 43,917129
2 2 38,9 4 1513,21 77,8 38,645 0,255 0,065025
3 3 43,1 9 1857,61 129,3 39,663 3,437 11,812969
4 4 45,6 16 2079,36 182,4 40,681 4,919 24,196561
5 5 44,1 25 1944,81 220,5 41,699 2,401 5,764801
6 6 43,6 36 1900,96 261,6 42,717 0,883 0,779689
7 7 41,8 49 1747,24 292,6 43,735 -1,935 3,744225
8 8 44,2 64 1953,64 353,6 44,753 -0,553 0,305809
9 9 43,3 81 1874,89 389,7 45,771 -2,471 6,105841
10 10 45,7 100 2088,49 457 46,789 -1,089 1,185921
11 11 47,2 121 2227,84 519,2 47,807 -0,607 0,368449
12 12 50,2 144 2520,04 602,4 48,825 1,375 1,890625
сумма 78 518,7 650 22669,09 3517,1 100,137
среднее 6,500 43,225 54,167 1889,091 293,092
x=1nxi=112*78=6,5
y=1nyi=112*518,7=43,225
σх2=1nxi2-x2=112*650-6,52=11,92
σy2=1nyi2-y2=112*22669,09-43,2252=20,68
σx=σх2=11,92=3,45
σy=σy2=20,682=4,55
covX, Y=1nxy- x y=112*3517, 1- 6,5 * 43,225=12,1295
r=covX, Yσxσy=12,12953,45*4,55=0,7727
Оценки коэффициентов уравнения регрессии найдем по формуле
b=covX, Yσх2=12,129511,92=1,02
a=y-bx=43,225-1,02*6,5=36,595
Уравнение парной линейной регрессии имеет вид:
y=36,595+1,02x
Рассчитаем по уравнению регрессии значение у1 и прогнозируемое значение у*
у1=36,595+1,02*1=37,627
у*=36,595+1,02*15=51,895
Погрешность вычисления δ1=у1-у1=31-37,627=-6,627
Относительная погрешность вычисления у1 равна 21%: δ1у1=0,2137
Построим линию регрессии y=36,595+1,02x
По двум точкам (х1,у1)=1;31и (15;51,895).
Коэффициент детерминации R2= (r)2=0,597 говорит о заметной связи между Х и У