По территориям региона приводятся данные за 199Х г. (р1
- число букв в полном имени, р2 - число букв в фамилии):
Номеррегиона Среднедушевой прожиточныйминимум в день одноготрудоспособного, руб., x
Среднедневная заработнаяплата, руб., y
1 78+р1
133+ р2
2 80+р2
148
3 87 135+р1
4 79 154
5 106 157+р1
6 106+ р1
195
7 67 139
8 98 158+ р2
9 73+р2
152
10 87 162
11 86 146+ р2
12 110+р1
173
Требуется:
1.Построить линейное уравнение парной регрессии у по х.
2.Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость уравнения регрессии вцелом и отдельных параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
4.Выполнить прогноз заработной платы y при прогнозномзначении среднедушевого прожиточного минимума x, составляющем107% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и егодоверительный интервал.
6.На одном графике отложить исходные данные итеоретическую прямую.
7.Проверить вычисления в MS Excel.
p1=4 , p2 =6
Решение
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
82 139 11398 6724 19321 149,0668 -10,0668 101,3411 7,242324
86 148 12728 7396 21904 152,7451 -4,7451 22,51597 3,206148
87 139 12093 7569 19321 153,6647 -14,6647 215,0525 10,55012
79 154 12166 6241 23716 146,3081 7,691873 59,16491 4,994723
106 161 17066 11236 25921 171,1364 -10,1364 102,7476 6,295931
110 195 21450 12100 38025 174,8147 20,18528 407,4456 10,35143
67 139 9313 4489 19321 135,2733 3,726682 13,88816 2,681066
98 164 16072 9604 26896 163,7799 0,220091 0,04844 0,134202
79 152 12008 6241 23104 146,3081 5,691873 32,39741 3,744653
87 162 14094 7569 26244 153,6647 8,335333 69,47778 5,145267
86 152 13072 7396 23104 152,7451 -0,7451 0,555173 0,490197
114 173 19722 12996 29929 178,493 -5,49299 30,17292 3,175138
Итого 1081 1878 171182 99561 296806 1878 2,84E-14 1054,807 58,0112
Средние значения 90,08 156,5 14265,17 8296,75 24733,83 156,5
13,481 15,543
181,743 241,583
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Получим: Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемсреднедушевого прожиточного минимума на 1 руб
. среднедневнаязаработная плата возрастает в среднем на 0,92 руб. (или 92 коп.).
После нахождения уравнения регрессии заполняем столбцы 7-10таблицы 1.
Выполним оценку тесноту связи между переменными с помощью коэффициента корреляции и средней ошибки аппроксимации:
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим:
Т.к. значение коэффициента корреляции больше 0,7, то это говорит оналичии весьма тесной линейной связи между признаками.Коэффициент детерминации:
.
Это означает, что 63,6% вариации заработной платы (у) объясняетсявариацией фактора - среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 10%.
3. Оценку статистической значимости уравнения регрессии в целомпроведем с помощью -критерия Фишера. Фактическое значение критерия по формуле составит
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет Fтабл =4,96