По территориям региона приводятся данные за 2013 г.
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 78 133
2 94 139
3 85 141
4 73 127
5 91 154
6 88 142
7 73 122
8 82 135
9 99 142
10 113 168
11 69 124
12 83 130
Требуется:
Построить линейное уравнение парной регрессии от .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Решение
Для расчета параметров уравнения линейной регрессии строим расчетную таблицу 2.
Таблица 2
1 78 133 10374 6084 17689 130,8 2,196 1,651 4,820
2 94 139 13066 8836 19321 146 -6,995 5,032 48,932
3 85 141 11985 7225 19881 137,45 3,550 2,517 12,600
4 73 127 9271 5329 16129 126,06 0,943 0,742 0,888
5 91 154 14014 8281 23716 143,15 10,853 7,047 117,790
6 88 142 12496 7744 20164 140,3 1,701 1,198 2,895
7 73 122 8906 5329 14884 126,06 -4,057 3,326 16,463
8 82 135 11070 6724 18225 134,6 0,398 0,295 0,158
9 99 142 14058 9801 20164 150,74 -8,742 6,156 76,426
10 113 168 18984 12769 28224 164,03 3,966 2,361 15,729
11 69 124 8556 4761 15376 122,26 1,740 1,403 3,028
12 83 130 10790 6889 16900 135,55 -5,552 4,270 30,820
Итого 1028 1657 143570 89772 230673 1657 0 36 330,549
Среднее значение 85,7 138,1 11964,2 7481,0 19222,8 – – 3,0
11,93 12,48 – – – – – – 5,75
142,2 155,7 – – – – – –
Оценим параметры линейной модели
. Модель будем рассматривать в виде :
, где
;
138,1 – 0,95 · 85,7 = 56,75.
Уравнение регрессии: y = 56,75 + 0,95 x .
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,95 руб.
Тесноту линейной связи оценит коэффициент корреляции:
0,9073
0,8231.
Это означает, что 82,31% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 46,54 , то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
4,71 2,3 ;
6,82 2,3;
6,10 2,3.
2,3 – табличное значение.
Фактические значения -статистики превосходят табличное значение 2,3, поэтому параметры , и статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и