По территориям региона приводятся данные за 199Xг. (р1
- число букв в полном имени, р2 - число букв в фамилии).
Номеррегиона Среднедушевой прожиточныйминимум в день одноготрудоспособного, руб., x
Среднедневная заработнаяплата, руб., y
1 78+р1
133+ р2
2 80+р2
148
3 87 135+р1
4 79 154
5 106 157+р1
6 106+ р1
195
7 67 139
8 98 158+ р2
9 73+р2
152
10 87 162
11 86 146+ р2
12 110+р1
173
Требуется:
1.Построить линейное уравнение парной регрессии у по х.
2.Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость уравнения регрессии вцелом и отдельных параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
4.Выполнить прогноз заработной платы y при прогнозномзначении среднедушевого прожиточного минимума x, составляющем107% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и егодоверительный интервал.
6.На одном графике отложить исходные данные итеоретическую прямую.
7.Проверить вычисления в MS Excel.
p1=8 , p2 =9
Решение
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
86 142 12212 7396 20164 152,9653 -10,9653 120,2375 7,722032
89 148 13172 7921 21904 155,6257 -7,62573 58,15174 5,15252
87 143 12441 7569 20449 153,8521 -10,8521 117,7681 7,588881
79 154 12166 6241 23716 146,7576 7,242417 52,4526 4,702868
106 165 17490 11236 27225 170,7016 -5,70158 32,50798 3,455501
114 195 22230 12996 38025 177,7961 17,20391 295,9744 8,822516
67 139 9313 4489 19321 136,1158 2,884192 8,318563 2,074958
98 167 16366 9604 27889 163,6071 3,39294 11,51204 2,0317
82 152 12464 6724 23104 149,418 2,581973 6,666585 1,698667
87 162 14094 7569 26244 153,8521 8,1479 66,38828 5,029568
86 155 13330 7396 24025 152,9653 2,034715 4,140064 1,312719
118 173 20414 13924 29929 181,3434 -8,34335 69,61152 4,822747
Итого 1099 1895 175692 103065 301995 1895 5,68E-14 843,7293 54,41468
Средние значения 91,58333 157,9167 14641 8588,75 25166,25 157,9167
14,18602 15,11874
201,2431 228,5764
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Получим: Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемсреднедушевого прожиточного минимума на 1 руб
. среднедневнаязаработная плата возрастает в среднем на 0,89 руб. (или 89 коп.).
После нахождения уравнения регрессии заполняем столбцы 7-10таблицы 1.
Выполним оценку тесноту связи между переменными с помощью коэффициента корреляции и средней ошибки аппроксимации:
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим :
Т.к. значение коэффициента корреляции больше 0,7, то это говорит оналичии весьма тесной линейной связи между признаками.Коэффициент детерминации:
.
Это означает, что 69,2% вариации заработной платы (у) объясняетсявариацией фактора - среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 10%.
3. Оценку статистической значимости уравнения регрессии в целомпроведем с помощью -критерия Фишера. Фактическое значение критерия по формуле составит
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет Fтабл =4,96