По территориям региона приводятся данные за 199Х г. (р1
- число букв в полном имени, р2 - число букв в фамилии):
Номеррегиона Среднедушевой прожиточныйминимум в день одноготрудоспособного, руб., x
Среднедневная заработнаяплата, руб., y
1 78+р1
133+ р2
2 80+р2
148
3 87 135+р1
4 79 154
5 106 157+р1
6 106+ р1
195
7 67 139
8 98 158+ р2
9 73+р2
152
10 87 162
11 86 146+ р2
12 110+р1
173
Требуется:
1.Построить линейное уравнение парной регрессии у по х.
2.Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость уравнения регрессии вцелом и отдельных параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
4.Выполнить прогноз заработной платы y при прогнозномзначении среднедушевого прожиточного минимума x, составляющем107% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и егодоверительный интервал.
6.На одном графике отложить исходные данные итеоретическую прямую.
7.Проверить вычисления в MS Excel.
p1=7 , p2 =9
Решение
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
85 142 12070 7225 20164 152,0571 -10,0571 101,1446 7,08244
89 148 13172 7921 21904 155,6526 -7,6526 58,56233 5,170678
87 142 12354 7569 20164 153,8548 -11,8548 140,5371 8,348475
79 154 12166 6241 23716 146,6638 7,336241 53,82044 4,763793
106 164 17384 11236 26896 170,9336 -6,93364 48,07534 4,227828
113 195 22035 12769 38025 177,2258 17,77417 315,9211 9,114959
67 139 9313 4489 19321 135,8771 3,122855 9,752221 2,246658
98 167 16366 9604 27889 163,7426 3,257437 10,6109 1,950561
82 152 12464 6724 23104 149,3604 2,639588 6,967425 1,736571
87 162 14094 7569 26244 153,8548 8,145166 66,34373 5,02788
86 155 13330 7396 24025 152,9559 2,04405 4,178142 1,318742
117 173 20241 13689 29929 180,8214 -7,82137 61,17379 4,521022
Итого 1096 1893 174989 102432 301381 1893 0 877,0871 55,50961
Средние значения 91,333 157,75 14582,42 8536 25115,08 157,75
13,936 15,16644
194,222 230,021
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Получим: Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемсреднедушевого прожиточного минимума на 1 руб
. среднедневнаязаработная плата возрастает в среднем на 0,90 руб. (или 90 коп.).
После нахождения уравнения регрессии заполняем столбцы 7-10таблицы 1.
Выполним оценку тесноту связи между переменными с помощью коэффициента корреляции и средней ошибки аппроксимации:
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим:
Т.к. значение коэффициента корреляции больше 0,7, то это говорит оналичии весьма тесной линейной связи между признаками.Коэффициент детерминации:
.
Это означает, что 68,2% вариации заработной платы (у) объясняетсявариацией фактора - среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 10%.
3