Парная регрессия и корреляция
2. Имеются данные по 12 группам населения о среднегодовом доходе и уровне потребления мяса жителями штата Канзас (США):
Среднегодовой
доход
в среднем
по группе,
тыс. дол.
Х Годовое
Потребление
мяса на душу
населения
в среднем
по группе, кг.
У
41,5 41,2
29,6 35,3
31,8 40,7
69,8 55,1
100,5 80,1
93,3 65,9
82,1 64,2
77,4 70,5
55,7 61,1
38,9 51,7
45,2 59,4
60,2 65,8
Задание.
1). Постройте поле корреляции результативного и факторного признаков.
2). Определите параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициента регрессии b.
3). Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
4). С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии b и уравнения регрессии в целом. Сделайте выводы.
5). Рассчитайте прогнозное значение для заданного X*=51,4 и постройте 95% доверительный интервал для прогноза.
Решение
1). Для условия задачи поле корреляции выглядит следующим образом:
Между годовым потреблением мяса на душу населения (Y) и среднегодовым доходом населения (X) визуально определяется прямая линейная зависимость.
2). Определим параметры уравнения парной линейной регрессии. Вычисления удобно организовать в таблицу. При этом сначала рассчитываются средние значения и по данным столбцов 2 и 3. Затем в столбцах 4 и 5 рассчитываются , , i = 1, …, n, и в столбце 8 их произведение.
Средне-годовой
доход
в среднем
по группе,
тыс. дол.
Х Годовое
Потребление
мяса на душу
населения
в среднем
по группе, кг.
У х-х
у-у
(х-х)2
(у-у)2
(х-х)×
×(у-у) e
1 2 3 4 5 6 7 8 9 10
1 41,5 41,2 -19 -16,38 361,00 268,41 311,28 48,42 -7,22
2 29,6 35,3 -30,9 -22,28 954,81 496,55 688,56 42,68 -7,38
3 31,8 40,7 -28,7 -16,88 823,69 285,05 484,55 43,74 -3,04
4 69,8 55,1 9,3 -2,48 86,49 6,17 -23,10 62,07 -6,97
5 100,5 80,1 40 22,52 1600,00 507,00 900,67 76,87 3,23
6 93,3 65,9 32,8 8,32 1075,84 69,17 272,79 73,40 -7,50
7 82,1 64,2 21,6 6,62 466,56 43,78 142,92 68,00 -3,80
8 77,4 70,5 16,9 12,92 285,61 166,84 218,29 65,73 4,77
9 55,7 61,1 -4,8 3,52 23,04 12,37 -16,88 55,27 5,83
10 38,9 51,7 -21,6 -5,88 466,56 34,61 127,08 47,17 4,53
11 45,2 59,4 -15,3 1,82 234,09 3,30 -27,79 50,20 9,20
12 60,2 65,8 -0,3 8,22 0,09 67,51 -2,47 57,44 8,36
Сумма 726 691 0 0 6377,78 1960,76 3075,90 691 0,00
Сред
нее 60,5 57,58
По формуле получим:
=3075,90/6377,78=0,482
.
По формуле получим: =57,58−0,482×60,5= 28,405.
Оцененное уравнение регрессии запишется в виде = 28,405+0,482X.
Интерпретация коэффициента регрессии. С увеличением среднегодового дохода населения на 1 тыс. долл. годовое потребление мяса на душу населения увеличится на 0,482кг.
3). Расчет линейного коэффициента корреляции проведем по формуле
.
С учетом вычислений в столбцах 6, 7 и 8 таблицы, получим:
r= 3075,90/(6377,78 ×1960,71) = 0,87.
Т.е. связь между изучаемыми переменными прямая (коэффициент корреляции положителен) линейная