По территориям региона приводятся данные за 199Х г.
Таблица 1
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 84 142
2 89 148
3 87 141
4 79 154
5 106 163
6 112 195
7 67 139
8 98 167
9 82 152
10 87 162
11 86 155
12 116 173
Требуется:
Построить линейное уравнение парной регрессии от .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Решение
Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 2.
Таблица 2
1 84 142 11928 7056 20164 151,1 -9,1 6,44
2 89 148 13172 7921 21904 155,7 -7,7 5,19
3 87 141 12267 7569 19881 153,9 -12,9 9,13
4 79 154 12166 6241 23716 146,6 7,4 4,81
5 106 163 17278 11236 26569 171,2 -8,2 5,00
6 112 195 21840 12544 38025 176,6 18,4 9,43
7 67 139 9313 4489 19321 135,7 3,3 2,39
8 98 167 16366 9604 27889 163,9 3,1 1,87
9 82 152 12464 6724 23104 149,3 2,7 1,76
10 87 162 14094 7569 26244 153,9 8,1 5,02
11 86 155 13330 7396 24025 153,0 2,0 1,32
12 116 173 20068 13456 29929 180,2 -7,2 4,19
Итого 1093 1891 174286 101805 300771 1891 0 56,55
Среднее значение 91,1 157,6 14523,8 8483,8 25064,3 157,6 - 4,71
13,7 15,2 – – – – – –
187,6 231,7 – – – – – –
Уравнение будет иметь вид: .
С увеличением среднедушевого прожиточного минимума на 1 руб
. среднедневная заработная плата возрастает в среднем на 0,9096 руб.
Тесноту линейной связи оценит коэффициент корреляции:
;.
Это означает, что 67,0% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
.
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как , то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Определим случайные ошибки , , :
;
;
.
Тогда
;
;
.
Фактические значения -статистики превосходят табличное значение:
;;,
поэтому параметры , и не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и