По территориям региона приводятся данные за 1991 г.
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб.,
Среднедневная заработная плата, руб.,
1 78 133
2 94 139
3 85 141
4 73 127
5 91 154
6 88 142
7 73 122
8 82 135
9 99 142
10 113 168
11 69 124
12 83 130
Требуется:
Построить линейное уравнение парной регрессии от .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Решение
Для расчета параметров уравнения линейной регрессии строим расчетную таблицу.
1 78 133 10374 6084 17689 131 2 1,5
2 94 139 13066 8836 19321 146 -7 5
3 85 141 11985 7225 19881 137 4 2,8
4 73 127 9271 5329 16129 126 1 0,8
5 91 154 14014 8281 23716 143 11 7,1
6 88 142 12496 7744 20164 140 2 1,4
7 73 122 8906 5329 14884 126 -4 3,3
8 82 135 11070 6724 18225 135 0 0
9 99 142 14058 9801 20164 151 -9 6,3
10 113 168 18984 12769 28224 164 4 2,4
11 69 124 8556 4761 15376 122 2 1,6
12 83 130 10790 6889 16900 136 -6 4,6
Итого 1028 1657 143570 89772 230673 1657 0 36,8
Среднее значение 85,7 138,1 11964,2 7481 19222,8 – – 3,1
11,68 12,3 – – – – – –
136,51 151,19 – – – – – –
Получено уравнение регрессии: y = 56,69 + 0,95x.
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,95 руб.
Тесноту линейной связи оценит коэффициент корреляции:
Это означает, что 79% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
.
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как Fфакт = 37,62 > Fтабл = 4,96, то, уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Определим случайные ошибки , , :
Тогда:
Фактические значения -статистики превосходят табличное значение:
ta = 4,6 > tтабл = 2,3; tb = 6,7 > tтабл = 2,3; trxy = 6,1 > tтабл = 2,3
поэтому параметры , и не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии a и b
. Для этого определим предельную ошибку для каждого показателя:
Доверительные интервалы:
γа = a ± Δa = 56,69 ± 27,41
γа min = 56,69 – 27,41 = 29,28
γа max = 56,69 + 27,41 = 84,1
γb = b ± Δb = 0,95 ± 0,32
γb min = 0,95 – 0,32 = 0,63
γb max = 0,95 + 0,32 = 1,27
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
руб., тогда прогнозное значение заработной платы составит: руб.
Ошибка прогноза составит:
Предельная ошибка прогноза, которая в случаев не будет превышена, составит:
Доверительный интервал прогноза:
γ = yp ± Δ = 143,81 ± 12,89 руб.
γmin = 143,81 – 12,89 = 130,92 руб.
γmax = 143,81 + 12,89 = 156,7 руб.
Выполненный прогноз среднемесячной заработной платы является надежным () и находится в пределах от 130,92 руб