По территориям региона приводятся данные за 199X г.
Требуется:
Построить линейное уравнение парной регрессии y от x .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
1 69 124
2 83 133
3 92 146
4 97 153
5 88 138
6 93 159
7 74 145
8 79 152
9 105 168
10 99 154
11 85 127
12 94 155
Решение
Рассчитаем параметры уравнений линейной парной регрессии.
Для расчета параметров a и b линейной регрессии составим систему нормальных уравнений относительно a и b:
Для определения следующих данных: , , , , , составим вспомогательную таблицу 1.
1 69 124 8556 4761 15376 128,48 -4,48 3,62
2 83 133 11039 6889 17689 141,40 -8,40 6,32
3 92 146 13432 8464 21316 149,70 -3,70 2,54
4 97 153 14841 9409 23409 154,32 -1,32 0,86
5 88 138 12144 7744 19044 146,01 -8,01 5,81
6 93 159 14787 8649 25281 150,63 8,37 5,27
7 74 145 10730 5476 21025 133,10 11,90 8,21
8 79 152 12008 6241 23104 137,71 14,29 9,40
9 105 168 17640 11025 28224 161,70 6,30 3,75
10 99 154 15246 9801 23716 156,16 -2,16 1,40
11 85 127 10795 7225 16129 143,25 -16,25 12,79
12 94 155 14570 8836 24025 151,55 3,45 2,23
Итого 1058 1754 155788,00 94520,00 258338,00 1754,00 0,00 62,19
Среднее значение 88,17 146,17 12982,33 7876,67 21528,17 – – 5,18
10,164 12,786 – – – – – –
103,306 163,472 – – – – – –
Рассчитываем параметр b:
Рассчитываем параметр a:
Уравнение линейной регрессии имеет вид:
Экономический смысл уравнения: С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
Тесноту линейной связи оценит коэффициент корреляции
Связи между признаками могут быть слабыми и сильными (тесными).
Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
Т.к
. значение коэффициента корреляции больше 0,7, то это говорит о наличии весьма тесной линейной связи между признаками.
Коэффициент детерминации:
т.е. в 53.79 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - средняя. Остальные 46.21 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Это означает, что 63,8% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
,
В среднем, расчетные значения отклоняются от фактических на 5,18%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как 11,64 > 4,96, то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Оценка значимости коэффициентов регрессии с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки
; ;
Табличное значение -критерия для числа степеней свободы и составит .
Определим случайные ошибки , , :
Остаточная дисперсия на одну степень свободы
ma - стандартное отклонение случайной величины a:
mb - стандартное отклонение случайной величины b.
Тогда
Поскольку 2,7 > 2.228, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 4.03 > 2.228, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 3,41 > 2,228, то отклоняем гипотезу о равенстве 0 коэффициента корреляции