Исследуется зависимость биржевой стоимости акции нефтедобывающей компании (, руб.) от уровня мировых цен на нефть (, $/баррель) по данным за последние 14 месяцев (- порядковый номер месяца). Статистические данные приведены в таблице.
Требуется:
Найти оценки параметров линейной регрессии на . Построить диаграмму рассеяния и нанести прямую регрессии.
На уровне значимости проверить гипотезу о согласии линейной регрессии с результатами наблюдений.
С надежностью найти доверительные интервалы для коэффициентов линейной регрессии.
1 2 3 4 5 6 7 8 9 10 11 12 13 14
33 35 36 39 40 42 43 45 47 50 22 26 30 32
43 49 58 56 62 57 63 69 71 78 34 32 38 42
Решение
По данным задачи построим диаграмму рассеяния
Анализ данных позволяет сделать предположение о том, что между X и Y существует линейная зависимость. Уравнение регрессии будем искать в виде y=a+bx
Для расчета параметров регрессии выполним дополнительные расчеты
x y x2 y2 ху
1 22 34 484 1156 748
2 26 32 676 1024 832
3 30 38 900 1444 1140
4 32 42 1024 1764 1344
5 33 43 1089 1849 1419
6 35 49 1225 2401 1715
7 36 58 1296 3364 2088
8 39 56 1521 3136 2184
9 40 62 1600 3844 2480
10 42 57 1764 3249 2394
11 43 63 1849 3969 2709
12 45 69 2025 4761 3105
13 47 71 2209 5041 3337
14 50 78 2500 6084 3900
сумма 520 752 20162 43086 29395
среднее 37,143 53,714 1440,143 3077,571 2099,643
средние найдем по формулам:
x=1ni=1nxi=37,143 y=1ni=1nyi=53,714 xy=1ni=1nxiyi =2099,643 x2=1ni=1nxi2=1440,143
Дисперсии и среднеквадратические отклонения:
Dx=x2-x2=1440,143-37,143*37,143=60,541
Sx=D(x)=60,541 = 7,781
Dy=y2-y2=3077,571-53,714*53,714=192,377
Sy=D(y)=192,377 = 13,87
Коэффициент регрессии b найдем по формуле
b=xy-x*yDx=2099,643-37,143*53,71460,541=1,727
a=y-b*x=53,714 – 1,727*37,143= - 10,432
Уравнение линейной регрессии имеет вид: y= - 10,432+1,727x
Коэффициент корреляции найдем по формуле
rxy=xy-x*ySx*Sy=2099,643-37,143*53,7147,81*13,87=0,965
Таким образом, между переменными Х и Y существует прямая достаточно сильная корреляционная зависимость (по шкале Чеддока 0,9<rxy<1)
Найдем оценки параметров линейной регрессии y= - 10,432+1,727x.
Параметр b называется коэффициентом регрессии
. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.
Проверим статистическую значимость каждого коэффициента регрессии. Для этого вычислим сначала стандартную ошибку регрессии
S=i=1n(yi-yi)2n-2
x y yi
yi-yi
(yi-yi)2
1 22 34 27,562
-6,438 41,4478
2 26 32 34,47 2,47 6,1009
3 30 38 41,378 3,378 11,4109
4 32 42 44,832 2,832 8,02022
5 33 43 46,559 3,559 12,6665
6 35 49 50,013 1,013 1,02617
7 36 58 51,74 -6,26 39,1876
8 39 56 56,921 0,921 0,84824
9 40 62 58,648 -3,352 11,2359
10 42 57 62,102 5,102 26,0304
11 43 63 63,829 0,829 0,68724
12 45 69 67,283 -1,717 2,94809
13 47 71 70,737 -0,263 0,06917
14 50 78 75,918 -2,082 4,33472
сумма 520 752
166,014
S=166,01414-2=3,719
где S=3,719 – стандартная ошибка коэффициента регрессии