По территориям региона приводятся данные за 199X г.
Требуется:
Построить линейное уравнение парной регрессии по .
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Таблица 1
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 85 141
2 88 148
3 87 142
4 79 154
5 106 164
6 113 195
7 67 139
8 98 166
9 81 152
10 87 162
11 86 154
12 117 173
Решение
1. Построим поле корреляции:
По графику можно предположить наличие прямой линейной зависимости.
Для удобства дальнейших вычислений строим расчетную таблицу.
Таблица 2
1 85 141 11985 7225 19881 151,96 -10,963 7,7754 120,19506
2 88 148 13024 7744 21904 154,66 -6,6569 4,4979 44,313729
3 87 142 12354 7569 20164 153,76 -11,759 8,281 138,27457
4 79 154 12166 6241 23716 146,58 7,4237 4,8206 55,110717
5 106 164 17384 11236 26896 170,82 -6,8179 4,1572 46,483569
6 113 195 22035 12769 38025 177,1 17,897 9,1781 320,31224
7 67 139 9313 4489 19321 135,8 3,1977 2,3005 10,225153
8 98 166 16268 9604 27556 163,64 2,3648 1,4246 5,5922512
9 81 152 12312 6561 23104 148,37 3,628 2,3868 13,162306
10 87 162 14094 7569 26244 153,76 8,241 5,087 67,913738
11 86 154 13244 7396 23716 152,86 1,1388 0,7395 1,2968978
12 117 173 20241 13689 29929 180,69 -7,6941 4,4474 59,198729
Итого 1094 1890 174420 102092 300456 1890 0 55,096 882,079
Среднее значение 91,2 157,5 14535,0 8507,7 25038,0 – – 4,6 73,5
14,01 15,22 – – – – – – 8,57
196,3 231,8 – – – – – –
Рассчитаем параметры линейного уравнения парной регрессии:
Для этого воспользуемся формулами:
;
157,5 – 0,90 · 91,2 = 75,65.
Получили уравнение регрессии: y = 75,65 + 0,90 x .
С увеличением среднедушевого прожиточного минимума на 1 руб
. среднедневная заработная плата возрастает в среднем на 0,90 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
0,8263
0,6828.
Это означает, что 68,28% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 21,53 >, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
4,24 > 2,3 ;
4,64 > 2,3;
4,15 > 2,3.
2,3 – табличное значение.
Фактические значения -статистики превосходят табличное значение 2,3, поэтому параметры , и статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и