При исследовании годового дохода и сбережений населения получены
следующие данные:
Доход, тыс. у.с. 59 83 55 47 39 97 125 150 74 71
Сбережения, тыс. у.с. 8 13 9 3 4 15 16 20 15 17
К заданию 5)Х*=100.
Задание.
1).Постройте поле корреляции результативного и факторного признаков.
2).Определите параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициента регрессии β.
3).Рассчитайте линейный коэффициент корреляции и поясните егосмысл. Определите коэффициент детерминации и дайте его интерпретацию.
4).С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии β и уравнения регрессии в целом. Сделайте выводы.
5).Рассчитайте прогнозное значение Ŷ* для заданного X* = 5,5 и постройте 95% доверительный интервал для прогноза.
Решение
1). Для условия задачи поле корреляции выглядит следующим образом:
Между сбережения (Y) и доходом (X) визуально определяется прямая линейная зависимость.
2). Определим параметры уравнения парной линейной регрессии. Вычисления удобно организовать в таблицу. При этом сначала рассчитываются средние значения и по данным столбцов 2 и 3. Затем в столбцах 4 и 5 рассчитываются , , i = 1, .... n, и в столбце 8 их произведение.
1 59 8 -21 -4 441 16 84 9,15 -1,15 1,33
2 83 13 3 1 9 1 3 12,41 0,59 0,35
3 55 9 -25 -3 625 9 75 8,61 0,39 0,15
4 47 3 -33 -9 1089 81 297 7,53 -4,53 20,49
5 39 4 -41 -8 1681 64 328 6,44 -2,44 5,96
6 97 15 17 3 289 9 51 14,30 0,70 0,48
7 125 16 45 4 2025 16 180 18,10 -2,10 4,41
8 150 20 70 8 4900 64 560 21,49 -1,49 2,22
9 74 15 -6 3 36 9 -18 11,19 3,81 14,54
10 71 17 -9 5 81 25 -45 10,78 6,22 38,69
Итого 800 120 0 0,00 11176 294 1515 120,00 0,00 88,63
Среднее значение 80 12
По формуле (1) получим: β = 1515/11176 = 0,14
. По формуле (2) получим: α =12 – 14 ·80 = 1,16.
Оцененное уравнение регрессии запишется в виде Y = 1,16+0,14·X.
Интерпретация коэффициента регрессии. С увеличением дохода на 1 тыс. у.е сбережения возрастают на 0,14 тыс. у.е .
3).Расчет линейного коэффициента корреляции проведем по формуле (3).С учетом вычислений в столбцах 6, 7 и 8 таблицы, получим:
.
Т.е. связь между изучаемыми переменными прямая (коэффициент корреляции положительный) линейная.
Определим коэффициент детерминации . Т.е. 69,9% вариации сбережения объясняется вариацией дохода.
4).Оценим статистическую значимость коэффициента регрессии β.
Рассчитаем дисперсию ошибки регрессии по формуле (6) с учетом столбца 10 таблицы: σu2=88,63/( 10 – 2) = 11,08.
Рассчитаем стандартную ошибку коэффициента регрессии по формуле (5): .
Тогда по формуле (4) фактическое значение t – статистики составит
t = 0,14/0,03 = 4,31.
По таблице находим для уровня значимости по условию 1 – 0,95 = 0,05 и числа степеней свободы 10: t 0,05;8=2,31