По территориям региона приводятся данные за 199X г.
Требуется:
Построить линейное уравнение парной регрессии по .
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
Таблица 1
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 83 145
2 92 148
3 87 140
4 79 154
5 106 162
6 111 195
7 67 139
8 98 170
9 85 152
10 87 162
11 86 158
12 115 173
Решение
1. Построим поле корреляции:
По графику можно предположить наличие прямой линейной зависимости.
Для удобства дальнейших вычислений строим расчетную таблицу.
Таблица 2
1 83 145 12035 6889 21025 150,59 -5,591 3,856 31,258
2 92 148 13616 8464 21904 158,77 -10,773 7,279 116,052
3 87 140 12180 7569 19600 154,23 -14,227 10,162 202,415
4 79 154 12166 6241 23716 146,95 7,045 4,575 49,638
5 106 162 17172 11236 26244 171,5 -9,500 5,864 90,250
6 111 195 21645 12321 38025 176,05 18,955 9,720 359,275
7 67 139 9313 4489 19321 136,05 2,955 2,126 8,729
8 98 170 16660 9604 28900 164,23 5,773 3,396 33,324
9 85 152 12920 7225 23104 152,41 -0,409 0,269 0,167
10 87 162 14094 7569 26244 154,23 7,773 4,798 60,415
11 86 158 13588 7396 24964 153,32 4,682 2,963 21,919
12 115 173 19895 13225 29929 179,68 -6,682 3,862 44,647
Итого 1096 1898 175284 102228 302976 1898 0 58,87 1018,091
Среднее значение 91,3 158,2 14607,0 8519,0 25248,0 – – 4,9
13,31 15,21 – – – – – –
177,2 231,3 – – – – – –
Рассчитаем параметры линейного уравнения парной регрессии:
Для этого воспользуемся формулами:
;
158,2 – 0,91 · 91,3 = 75,14.
Получили уравнение регрессии: y = 75,14 + 0,91 x .
С увеличением среднедушевого прожиточного минимума на 1 руб
. среднедневная заработная плата возрастает в среднем на 0,91 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
0,7957
0,6332.
Это означает, что 63,32% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 17,26 >, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Найдем .
Определим случайные ошибки , , :
;
;
.
Тогда
3,72 > 2,3 ;
4,15 > 2,3;
3,72 > 2,3.
2,3 – табличное значение.
Фактические значения -статистики превосходят табличное значение 2,3, поэтому параметры , и статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и