Имеются данные об исследовании годового дохода и сбережений населения. Исходные данные представлены в таблице 1.
Таблица 1
Исходные данные
№ доход, тыс. у.е. (х) сбережения, тыс. у.е. (у)
1 59,00 8,00
2 83,00 13,00
3 55,00 9,00
4 47,00 3,00
5 39,00 4,00
6 97,00 15,00
7 125,00 16,00
8 150,00 20,00
9 74,00 15,00
10 71,00 17,00
Требуется:
Постройте поле корреляции результативного и факторного признаков.
Определите параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициента регрессии .
Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии и уравнения регрессии в целом. Сделайте выводы.
Рассчитайте прогнозное значение Y*для заданного X*=100 и постройте 95% доверительный интервал для прогноза.
Решение
1. Для условия задачи поле корреляции выглядит следующим образом (рисунок 1):
Рисунок 1 – Поле корреляции результативного и факторного признаков
На основе построенного корреляционного поля фактора и признака, можно предположить о наличии между ними прямой корреляционной связи вида: ŷ = a + bx.
2) Определим параметры уравнения парной линейной регрессии. Вычисления представим в таблице 2.
Таблица 2
Результаты вычислений
№ х у x-x
(y-y)
x-x² (y-y)²
x-x
×
(y-y)
ŷ е
1 2 3 4 5 6 7 8 9 10
1 59,00 8,00 -21,00 -4,00 441,00 16,00 84,00 9,15 -1,15
2 83,00 13,00 3,00 1,00 9,00 1,00 3,00 12,41 0,59
3 55,00 9,00 -25,00 -3,00 625,00 9,00 75,00 8,61 0,39
4 47,00 3,00 -33,00 -9,00 1 089,00 81,00 297,00 7,53 -4,53
5 39,00 4,00 -41,00 -8,00 1 681,00 64,00 328,00 6,44 -2,44
6 97,00 15,00 17,00 3,00 289,00 9,00 51,00 14,30 0,70
7 125,00 16,00 45,00 4,00 2 025,00 16,00 180,00 18,10 -2,10
8 150,00 20,00 70,00 8,00 4 900,00 64,00 560,00 21,49 -1,49
9 74,00 15,00 -6,00 3,00 36,00 9,00 -18,00 11,19 3,81
10 71,00 17,00 -9,00 5,00 81,00 25,00 -45,00 10,78 6,22
Сумма 800,00 120,00 - - 11 176,00 294,00 1 515,00 120,00 0,00
Среднее 80,00 12,00 - - 1 117,60 29,40 151,50 12,00 0,00
Определим параметры модели:
b=x-x(y-y)x-x²=1 515,0011 176,00=0,136;
a=y-b×x=12,00-0,136×80,00=1,155.
Таким образом, уравнение парной линейной регрессии имеет вид:
ŷ = 1,155 + 0,136 ×x.
Полученное уравнение парной линейной регрессии показывает, что при увеличении дохода на 1 тыс
. у.е. сбережения увеличатся в среднем на 0,136 тыс. у.е.
3) Рассчитаем линейный коэффициент корреляции.
rxy=x-x(y-y)x-x²×(y-y)²=1 515,0011 176,00×294,00=0,836.
Т.е. связь между изучаемыми переменными прямая (коэффициент корреляции положителен) линейная высока (по шкале Чеддока 0,7 <rxy < 0,9).
Определим коэффициент детерминации:
R2=rxy2=0,8362=0,699.
Т.е. 69,9% вариации сбережений объясняется вариацией дохода. Остальные 30,1% приходятся на факторы, не учтенные в моделе