По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта).
Требуется:
1. Построить линейное уравнение парной регрессии y от x .
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента.
4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6. На одном графике построить исходные данные и теоретическую прямую.
Номер региона Среднедушевой прожиточный минимум в день на одного трудоспособного, руб., х Среднедневная заработная плата, руб., y
1 77 123
2 85 152
3 79 140
4 93 142
5 89 157
6 81 181
7 79 133
8 97 163
9 73 134
10 95 155
11 84 132
12 108 165
Решение
Рассчитаем параметры уравнений линейной парной регрессии.
Для расчета параметров a и b линейной регрессии составим систему нормальных уравнений относительно a и b:
Для определения следующих данных: , , , , , составим вспомогательную таблицу.
№ x y х² x·y y² ŷ
1 77 123 5929 9471 15129 139,28
2 85 152 7225 12920 23104 146,56
3 79 140 6241 11060 19600 141,10
4 93 142 8649 13206 20164 153,85
5 89 157 7921 13973 24649 150,21
6 81 181 6561 14661 32761 142,92
7 79 133 6241 10507 17689 141,10
8 97 163 9409 15811 26569 157,50
9 73 134 5329 9782 17956 135,63
10 95 155 9025 14725 24025 155,68
11 84 132 7056 11088 17424 145,65
12 108 165 11664 17820 27225 167,52
сумма 1040 1777 91250,00 155024,00 266295,00 1777,00
среднее 86,67 148,08 7604,17 12918,67 22191,25 148,08
Рассчитываем параметр b:
Рассчитываем параметр a:
Уравнение линейной регрессии имеет вид:
Экономический смысл уравнения: с увеличением среднедушевого прожиточного минимума в день на одного трудоспособного x на 1 руб. – среднедневная заработная плата y увеличивается в среднем на 0,911 тыс. руб.
После нахождения уравнения регрессии заполняем столбцы таблицы:
№ x y ŷ (y-ŷ) (y-ŷ)² (ŷ-yср)² A |А|
1 77 123 139,28 -16,28 264,93 77,56 -13,23 13,23
2 85 152 146,56 5,44 29,54 2,31 3,58 3,58
3 79 140 141,10 -1,10 1,21 48,79 -0,78 0,78
4 93 142 153,85 -11,85 140,50 33,29 -8,35 8,35
5 89 157 150,21 6,79 46,12 4,52 4,33 4,33
6 81 181 142,92 38,08 1450,03 26,65 21,04 21,04
7 79 133 141,10 -8,10 65,59 48,79 -6,09 6,09
8 97 163 157,50 5,50 30,28 88,63 3,38 3,38
9 73 134 135,63 -1,63 2,66 155,03 -1,22 1,22
10 95 155 155,68 -0,68 0,46 57,64 -0,44 0,44
11 84 132 145,65 -13,65 186,43 5,90 -10,34 10,34
12 108 165 167,52 -2,52 6,35 377,74 -1,53 1,53
сумма 1040 1777 1777,00 0,00 2224,08 926,84
74,29
среднее 86,67 148,08 148,08
6,19
Тесноту линейной связи оценит коэффициент корреляции
Связи между признаками могут быть слабыми и сильными (тесными).
Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
Т.к
. значение коэффициента корреляции больше 0,5, то это говорит о наличии заметной прямой связи между признаками.
Коэффициент детерминации:
Это означает, что 29,4% вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума. Остальные 70.59% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Качество модели определяет средняя ошибка аппроксимации
,
В среднем, расчетные значения отклоняются от фактических на 6,19%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Оценку статистической значимости уравнения регрессии в целом проведем с помощью F-критерия Фишера