Компания «Вест», состоящая из 12 региональных представительств,продает кухонные принадлежности, рассылая каталоги по почте. Данные, иллюстрирующие количество рассылок (тыс. адресов) и объем выручки региональных представительств компании (млн. у. е.):
Количество адресоврассылки, тыс. адресов 65 55 67 41 59 78 105 110 125 91 47 93
Выручка. млн.у.е. 28 19 20 17,5 20 24,5 29,5 31 35 30 18,5 27
Задание.
1).Постройте поле корреляции результативного и факторного признаков.
2).Определите параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициента регрессии β.
3).Рассчитайте линейный коэффициент корреляции и поясните егосмысл. Определите коэффициент детерминации и дайте его интерпретацию.
4).С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии β и уравнения регрессии в целом. Сделайте выводы.
5).Рассчитайте прогнозное значение Ŷ* для заданного X* = 100 и постройте 95% доверительный интервал для прогноза.
Решение
1). Для условия задачи поле корреляции выглядит следующим образом:
Между объемом выручки региональных представительств компании (млн. у. е.) (Y) и количеством рассылок (тыс. адресов) (X) визуально определяется прямая линейная зависимость.
2). Определим параметры уравнения парной линейной регрессии. Вычисления удобно организовать в таблицу. При этом сначала рассчитываются средние значения и по данным столбцов 2 и 3. Затем в столбцах 4 и 5 рассчитываются , , i = 1, .... n, и в столбце 8 их произведение.
1 65 28 -13 3 169 9 -39 22,34 5,66 31,98
2 55 19 -23 -6 529 36 138 20,30 -1,30 1,70
3 67 20 -11 -5 121 25 55 22,75 -2,75 7,58
4 41 17,5 -37 -7,5 1369 56,25 277,5 17,44 0,06 0,00
5 59 20 -19 -5 361 25 95 21,12 -1,12 1,25
6 78 24,5 0 -0,5 0 0,25 0 25,00 -0,50 0,25
7 105 29,5 27 4,5 729 20,25 121,5 30,51 -1,01 1,03
8 110 31 32 6 1024 36 192 31,54 -0,54 0,29
9 125 35 47 10 2209 100 470 34,60 0,40 0,16
10 91 30 13 5 169 25 65 27,66 2,34 5,50
11 47 18,5 -31 -6,5 961 42,25 201,5 18,67 -0,17 0,03
12 93 27 15 2 225 4 30 28,06 -1,06 1,13
Итого 936 300 0 0,00 7866 379 1606,5 300,00 0,00 50,90
Среднее значение 78 25
По формуле (1) получим: β =1606,5,9/7866=0,204
. По формуле (2) получим: α =25 – 0,204 ·78 = 9,07.
Оцененное уравнение регрессии запишется в виде Y = 9,07+0,204·X.
Интерпретация коэффициента регрессии. С увеличением количества рассылок на 1 тыс. адресов объем выручки региональных представительств компании увеличится на 0,20 млн. у. е.
3).Расчет линейного коэффициента корреляции проведем по формуле (3).С учетом вычислений в столбцах 6, 7 и 8 таблицы, получим:
.
Т.е. связь между изучаемыми переменными весьма тесная, прямая (коэффициент корреляции положителен) линейная.
Определим коэффициент детерминации . Т.е. 86,6% вариации объема выручки региональных представительств компании объясняется вариацией количества рассылок.
4).Оценим статистическую значимость коэффициента регрессии β.
Рассчитаем дисперсию ошибки регрессии по формуле (6) с учетом столбца 10 таблицы: σu2=50,9/( 12-2)=5,09.
Рассчитаем стандартную ошибку коэффициента регрессии по формуле (5): .
Тогда по формуле (4) фактическое значение t – статистики составит
t = 0,204/0,0254 = 8,03.
По таблице находим для уровня значимости по условию 1 – 0,95 = 0,05 и числа степеней свободы 10: t 0,05;10=2,228