Корреляционно – регрессионный анализ взаимосвязи между признаками
По исходным данным (табл.1.1):
постройте график «поле корреляции», показывающий зависимость результативного признака Y («Доходность ценных бумаг за пять лет») от факторного признака Х (2Вложения в ценные бумаги»);
определите парный (линейный) коэффициент корреляции между показателями;
постройте линейную однофакторную регрессионную модель зависимости признака Y от фактора Х;
рассчитайте теоретический коэффициент детерминации для полученной регрессионной модели.
Сформулируйте выводы по результатам выполнения задания
Решение
На основе исходных данных (табл.1.1) покажем взаимосвязь между изучаемыми признаками графически с помощью графика « поле корреляции» (рис. 1).
Рис.1. Поле корреляции взаимосвязи изучаемых признаков
На рисунке 1 наблюдается не беспорядочное рассеивание точек по полю, а достаточно четкая их концентрация (корреляционное облако). Точки распределяются от нижнего левого угла поля в сторону верхнего правого, что позволяет предположить наличие прямой связи между признаками.
Для определения парного (линейного) коэффициента корреляции и выполнения других пунктов данного задания составим вспомогатльную таблицу 2.1.
Таблица 2.1
Расчетная таблица для задания 2
№ x y X2 xy
(x-x)2
yx
(y-y)2
(yx-y)2
1 134,7 43,44 18133,3 5850,2 891,7 47,77 2,6 18,7
2 78,2 35,72 6118,4 2794,2 706,5 36,54 37,3 0,7
3 95,8 39,58 9183,4 3793,2 80,4 40,05 5,1 0,2
4 141,7 55,31 20067,6 7834,5 1358,7 49,17 181,5 37,7
5 92,8 37,72 8617,4 3501,7 143,3 39,45 16,9 3,0
6 96,8 43,44 9376,0 4206,7 63,5 40,25 2,6 10,2
7 102,4 41,58 10494,0 4259,8 5,6 41,36 0,1 0,0
8 92,8 40,58 8617,4 3767,3 143,3 39,45 1,6 1,3
9 134,7 44,31 18133,3 5966,1 891,7 47,77 6,1 12,0
10 139,7 46,44 19504,9 6486,4 1215,3 48,77 21,3 5,4
11 121,1 46,31 14653,1 5605,2 264,1 45,07 20,0 1,5
12 92,8 37,72 8617,4 3501,7 143,3 39,45 16,9 3,0
13 118,1 44,44 13935,8 5246,6 175,6 44,47 6,8 0,0
14 96,8 40,58 9376,0 3929,7 63,5 40,25 1,6 0,1
15 92,8 36,72 8617,4 3408,9 143,3 39,45 26,1 7,4
16 121,1 44,44 14653,1 5379,9 264,1 45,07 6,8 0,4
17 105,4 47,17 11117,6 4973,2 0,4 41,96 28,5 27,1
18 94,8 42,44 8992,7 4025,0 99,4 39,85 0,4 6,7
19 106,4 40,58 11329,5 4319,7 2,7 42,16 1,6 2,5
20 109,4 43,44 11977,1 4754,5 21,5 42,76 2,6 0,5
21 94,8 42,44 8992,7 4025,0 99,4 39,85 0,4 6,7
22 106,4 39,58 11329,5 4213,2 2,7 42,16 5,1 6,6
23 96,8 44,44 9376,0 4303,5 63,5 40,25 6,8 17,6
24 82,2 34,72 6760,1 2854,8 509,8 37,34 50,6 6,8
25 93,8 38,72 8804,1 3633,3 120,3 39,65 9,7 0,9
26 82,2 35,72 6760,1 2937,1 509,8 37,34 37,3 2,6
Сумма 2724,8 1087,6 293538,0 115571,3 7983,2 1087,6 496,0 179,9
Средняя 104,8 41,8 11289,9 4445,1 307,0 41,8 19,1 6,9
Проведем расчет парного (линейного) коэффиицента корреляции на основе данных итоговой строки таблицы 2.1 (графы 1,2,4,5,7):
rxy=yx-yxσx×σy=4445.1-41.8*104.817.5*4.4=61.176.5=0.8
Между рассматриваемыми показателями существует достаточно сильная прямая линейная связь, т.к