По территориям региона приводятся данные за 201X г.
(p1 – число букв в полном имени, p2 – число букв в фамилии): р1 = 3, р2 = 7
Номер Среднедушевой прожиточный Среднедневная заработная
региона минимум в день одного плата, руб.,y
трудоспособного, руб.,x
1 81 140
2 87 148
3 87 138
4 79 154
5 106 160
6 109 195
7 67 139
8 98 165
9 80 152
10 87 162
11 86 153
12 113 173
Требуется:
Построить линейное уравнение парной регрессии по .
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Решение
1. Для расчета параметров уравнения линейной регрессии строим
расчетную таблицу.
Таблица 2
1 81 140 11340 6561 19600 148,22 -8,218 5,870 67,538
2 87 148 12876 7569 21904 153,79 -5,795 3,916 33,581
3 87 138 12006 7569 19044 153,79 -15,795 11,446 249,480
4 79 154 12166 6241 23716 146,36 7,641 4,962 58,381
5 106 160 16960 11236 25600 171,45 -11,455 7,159 131,211
6 109 195 21255 11881 38025 174,24 20,757 10,645 430,848
7 67 139 9313 4489 19321 135,21 3,794 2,730 14,397
8 98 165 16170 9604 27225 164,02 0,981 0,595 0,962
9 80 152 12160 6400 23104 147,29 4,711 3,100 22,196
10 87 162 14094 7569 26244 153,79 8,205 5,065 67,323
11 86 153 13158 7396 23409 152,87 0,135 0,088 0,018
12 113 173 19549 12769 29929 177,96 -4,961 2,868 24,611
Итого 1080 1879 171047 99284 297121 1879 0 58,441 1100,548
Среднее значение 90,0 156,6 14253,9 8273,7 24760,1 – – 4,9
13,18 15,55 – – – – – –
173,7 241,7 – – – – – –
Рассчитаем параметры линейного уравнения парной регрессии:
Для этого воспользуемся формулами:
;
156,6 – 0,93 · 90,0 = 72,93.
Получили уравнение регрессии: y = 72,93 + 0,93 x .
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,93 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
0,7878
0,6206.
Это означает, что 62,06% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера
. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 16,36 >, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
3,49 > 2,3 ;
4,04 > 2,3;
3,62 > 2,3.
2,3 – табличное значение.
Фактические значения -статистики превосходят табличное значение 2,3, поэтому параметры , и статистически значимы.
В целом уравнение регрессии признается значимым, значимы и коэффициенты регрессии.
Рассчитаем доверительные интервалы для параметров регрессии и . Для этого определим предельную ошибку для каждого показателя:
20,90 = 46,61
0,23 = 0,51
Доверительные интервалы:
72,9346,61
72,9346,61= 26,32
72,93+46,61 = 119,54
0,93 0,51
0,93 – 0,51 = 0,42
0,93 + 0,51 = 1,44.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не могут принимать нулевые значения, т.е