Имеются данные о количестве копий (тыс. шт.), сделанных копировальными машинами различных марок в издательских центрах города и стоимости технического обслуживания копировальных машин (тыс. у. е.).
Задание.
1).Постройте поле корреляции результативного и факторного признаков.
2).Определите параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициента регрессии β.
3).Рассчитайте линейный коэффициент корреляции и поясните егосмысл. Определите коэффициент детерминации и дайте его интерпретацию.
4).С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии β и уравнения регрессии в целом. Сделайте выводы.
5).Рассчитайте прогнозное значение Ŷ* для заданного X* = 21 и постройте 95% доверительный интервал для прогноза.
Количество копий 16 19 24 26 28 29 33 39 40 41 44 45
Стоимость техобслуживания 1,4 1,6 1,7 1,75 1,85 2,4 2,7 2,8 2,8 2,7 2,9 3,0
Решение
1). Для условия задачи поле корреляции выглядит следующим образом:
Между стоимостью техобслуживания (Y) и количеством копий (.X) визуально определяется прямая линейная зависимость.
2). Определим параметры уравнения парной линейной регрессии. Вычисления удобно организовать в таблицу. При этом сначала рассчитываются средние значения и по данным столбцов 2 и 3. Затем в столбцах 4 и 5 рассчитываются , , i = 1, .... n, и в столбце 8 их произведение.
1 16 1,4 -16 -0,9 256 0,81 14,4 1,38 0,02 0,00
2 19 1,6 -13 -0,7 169 0,49 9,1 1,55 0,05 0,00
3 24 1,7 -8 -0,6 64 0,36 4,8 1,84 -0,14 0,02
4 26 1,75 -6 -0,55 36 0,3025 3,3 1,95 -0,20 0,04
5 28 1,85 -4 -0,45 16 0,2025 1,8 2,07 -0,22 0,05
6 29 2,4 -3 0,1 9 0,01 -0,3 2,13 0,27 0,07
7 33 2,7 1 0,4 1 0,16 0,4 2,36 0,34 0,12
8 39 2,8 7 0,5 49 0,25 3,5 2,70 0,10 0,01
9 40 2,8 8 0,5 64 0,25 4 2,76 0,04 0,00
10 41 2,7 9 0,4 81 0,16 3,6 2,82 -0,12 0,01
11 44 2,9 12 0,6 144 0,36 7,2 2,99 -0,09 0,01
12 45 3 13 0,7 169 0,49 9,1 3,05 -0,05 0,00
Итого 384 27,6 0 0,00 1058 3,845 60,9 27,60 0,00 0,34
Среднее значение 32 2,3
По формуле (1) получим: β =60,9/1058=0,058
. По формуле (2) получим:α =2,3 – 0,058 ·32 = 0,458.
Оцененное уравнение регрессии запишется в виде Y = 0,458 + 0,058X.
Интерпретация коэффициента регрессии. С увеличением числа копий на 1 тыс. шт. стоимость техобслуживания увеличится на 0,058 тыс.у.е.
3).Расчет линейного коэффициента корреляции проведем по формуле (3).С учетом вычислений в столбцах 6, 7 и 8 таблицы, получим:
.
Т.е. связь между изучаемыми переменными прямая (коэффициент корреляции положителен) линейная.
Определим коэффициент детерминации . Т.е. 91,2% вариации выручки объясняется вариацией числа посетителей.
4).Оценим статистическую значимость коэффициента регрессии β.
Рассчитаем дисперсию ошибки регрессии по формуле (6) с учетом столбца 10 таблицы: σu2=0,34/( 12-2)=0,034.
Рассчитаем стандартную ошибку коэффициента регрессии по формуле (5): .
Тогда по формуле (4) фактическое значение t – статистики составит
t = 0,058/0,0057 = 10,16.
По таблице находим для уровня значимости по условию 1 – 0,95 = 0,05 и числа степеней свободы 10: t 0,05;10=2,228