По территориям региона приводятся данные за 199X г.
Требуется:
Построить линейное уравнение парной регрессии по .
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Таблица 1
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 83 139
2 86 148
3 87 140
4 79 154
5 106 162
6 111 195
7 67 139
8 98 164
9 79 152
10 87 162
11 86 152
12 115 173
Решение
1. Для расчета параметров уравнения линейной регрессии строим
расчетную таблицу.
Таблица 2
1 83 139 11537 6889 19321 149,98 -10,982 7,900 120,597
2 86 148 12728 7396 21904 152,72 -4,716 3,187 22,245
3 87 140 12180 7569 19600 153,63 -13,628 9,734 185,723
4 79 154 12166 6241 23716 146,34 7,665 4,977 58,748
5 106 162 17172 11236 26244 170,95 -8,948 5,524 80,071
6 111 195 21645 12321 38025 175,51 19,494 9,997 380,008
7 67 139 9313 4489 19321 135,4 3,604 2,593 12,987
8 98 164 16072 9604 26896 163,66 0,344 0,210 0,119
9 79 152 12008 6241 23104 146,34 5,665 3,727 32,089
10 87 162 14094 7569 26244 153,63 8,372 5,168 70,090
11 86 152 13072 7396 23104 152,72 -0,716 0,471 0,513
12 115 173 19895 13225 29929 179,15 -6,153 3,556 37,854
Итого 1084 1880 171882 100176 297408 1880 0 57,044 1001,044
Среднее значение 90,3 156,7 14323,5 8348,0 24784,0 – – 4,8
13,707257 15,477582 – – – – – –
187,888889 239,555556 – – – – – –
Рассчитаем параметры линейного уравнения парной регрессии:
Для этого воспользуемся формулами:
;
156,7 – 0,911591 · 90,3 = 74,319633.
Получили уравнение регрессии: y = 74,319633 + 0,911591 x .
С увеличением среднедушевого прожиточного минимума на 1 руб
. среднедневная заработная плата возрастает в среднем на 0,911591 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
0,807323
0,651770.
Это означает, что примерно 65,177% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 18,72 >, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
3,86 > 2,3 ;
4,33 > 2,3;
3,87 > 2,3.
2,3 – табличное значение.
Фактические значения -статистики превосходят табличное значение 2,3, поэтому параметры , и статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и