По территориям региона приводятся данные за 1997 г.
Требуется:
Построить линейное уравнение парной регрессии по .
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Таблица 1
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 84 142
2 89 148
3 87 141
4 79 154
5 106 163
6 112 195
7 67 139
8 98 167
9 82 152
10 87 162
11 86 155
12 116 173
Решение
1. Построим поле корреляции (нанесем на плоскость точки (хi,уi)):
По графику можно предположить наличие возрастающей прямой линейной зависимости.
Для удобства дальнейших вычислений строим расчетную таблицу.
Таблица 2
1 84 142 11928 7056 20164 151,14 -9,140 6,437 83,547
2 89 148 13172 7921 21904 155,69 -7,688 5,195 59,111
3 87 141 12267 7569 19881 153,87 -12,869 9,127 165,615
4 79 154 12166 6241 23716 146,59 7,408 4,810 54,872
5 106 163 17278 11236 26569 171,15 -8,151 5,001 66,446
6 112 195 21840 12544 38025 176,61 18,391 9,431 338,230
7 67 139 9313 4489 19321 135,68 3,323 2,390 11,040
8 98 167 16366 9604 27889 163,87 3,125 1,871 9,768
9 82 152 12464 6724 23104 149,32 2,679 1,762 7,176
10 87 162 14094 7569 26244 153,87 8,131 5,019 66,110
11 86 155 13330 7396 24025 152,96 2,040 1,316 4,163
12 116 173 20068 13456 29929 180,25 -7,247 4,189 52,524
Итого 1093 1891 174286 101805 300771 1891 0 56,55 918,602
Среднее значение 91,1 157,6 14523,8 8483,8 25064,3 – – 4,7
13,70 15,22 – – – – – –
187,6 231,7 – – – – – –
Рассчитаем параметры линейного уравнения парной регрессии:
Для этого воспользуемся формулами:
;
157,6 – 0,91 · 91,1 = 74,73.
Получили уравнение регрессии: y = 74,73 + 0,91 x .
С увеличением среднедушевого прожиточного минимума на 1 руб
. среднедневная заработная плата возрастает в среднем на 0,91 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
0,8183
0,6697.
Это означает, что 66,97% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 20,27 >, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
4,02 > 2,3 ;
4,50 > 2,3;
4,03 > 2,3.
2,3 – табличное значение.
Фактические значения -статистики превосходят табличное значение 2,3, поэтому параметры , и статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и