По территориям региона приводятся данные за 2013 г.
Таблица 1
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 77 123
2 85 152
3 79 140
4 93 142
5 89 157
6 81 181
7 79 133
8 97 163
9 73 134
10 95 155
11 84 132
12 108 165
Требуется:
Построить линейное уравнение парной регрессии от .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Решение
Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 2.
Таблица 2
1 77 123 9471 5929 15129 149 -16 12,0 264,9266
2 85 152 12920 7225 23104 152 -4 2,7 29,54004
3 79 140 11060 6241 19600 157 -23 17,2 1,207047
4 93 142 13206 8649 20164 150 4 2,6 140,5003
5 89 157 13973 7921 24649 159 3 1,9 46,11626
6 81 181 14661 6561 32761 174 21 10,8 1450,03
7 79 133 10507 6241 17689 139 0 0,0 65,58824
8 97 163 15811 9409 26569 158 0 0,0 30,27792
9 73 134 9782 5329 17956 144 8 5,3 2,664691
10 95 155 14725 9025 24025 157 5 3,1 0,456129
11 84 132 11088 7056 17424 147 12 7,5 186,4285
12 108 165 17820 11664 27225 183 -10 5,8 6,345135
Итого 1040 1777 155024 91250 266295 1869 0 68,9 2224,08
Среднее значение 86,7 148,1 12918,7 7604,2 22191,3 – – 5,7
9,65 16,20 – – – – – – 14,91
93,1 262,6 – – – – – –
Оценим параметры линейной модели
. Модель будем рассматривать в виде :
, где
;
148,1 – 0,91 · 86,7 = 69,13.
Уравнение регрессии: y = 69,13 + 0,91 x .
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,91 руб.
Тесноту линейной связи оценит коэффициент корреляции:
0,5424
0,2941.
Это означает, что 29,41% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 4,17 < , то уравнение регрессии признается статистически не значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
1,78 < 2,3 ;
2,04 < 2,3;
1,83 < 2,3.
2,3 – табличное значение.
Фактические значения -статистики не превосходят табличное значение 2,3, поэтому параметры , и статистически не значимы.
Рассчитаем доверительные интервалы для параметров регрессии и