По территориям региона приводятся данные за 199X г. (p1 – число букв в полном имени, p2 – число букв в фамилии):
Номер Среднедушевой прожиточный Среднедневная заработная
региона минимум в день одного плата, руб., y
трудоспособного, руб., x
1 78+ p1 133+ p2
2 80+ p2 148
3 87 135+ p1
4 79 154
5 106 157+ p1
6 106+ p1 195
7 67 139
8 98 158+ p2
9 73+ p2 152
10 87 162
11 86 146+ p2
12 110+ p1 173
Требуется:
Построить линейное уравнение парной регрессии y по x .
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента.
Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. На одном графике отложить исходные данные и теоретическую прямую.
Проверить вычисления в MS Excel.
p1=8 , p2 =7
Решение
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
86 140 12040 7396 19600 152,7819 -12,7819 163,3779 9,129956
87 148 12876 7569 21904 153,6647 -5,66474 32,08932 3,82753
87 143 12441 7569 20449 153,6647 -10,6647 113,7368 7,457863
79 154 12166 6241 23716 146,6023 7,397699 54,72595 4,803701
106 165 17490 11236 27225 170,438 -5,43805 29,57235 3,295786
114 195 22230 12996 38025 177,5005 17,49951 306,2329 8,974108
67 139 9313 4489 19321 136,0086 2,991364 8,948258 2,15206
98 165 16170 9604 27225 163,3756 1,624397 2,638666 0,984483
80 152 12160 6400 23104 147,4851 4,514894 20,38427 2,970325
87 162 14094 7569 26244 153,6647 8,335256 69,4765 5,14522
86 153 13158 7396 23409 152,7819 0,218062 0,047551 0,142524
118 173 20414 13924 29929 181,0317 -8,03171 64,50838 4,642607
Итого 1095 1889 174552 102389 300151 1889 8,53E-14 865,7388 53,52616
Средние значения 91,25 157,4167 14546 8532,417 25012,58 157,417
14,348 15,250
205,854 232,576
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Получим: Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемсреднедушевого прожиточного минимума на 1 руб
. среднедневнаязаработная плата возрастает в среднем на 0,88 руб. (или 88 коп.).
После нахождения уравнения регрессии заполняем столбцы 7-10таблицы 1.
Выполним оценку тесноту связи между переменными с помощью коэффициента корреляции и средней ошибки аппроксимации:
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим :
Т.к. значение коэффициента корреляции больше 0,7, то это говорит оналичии весьма тесной линейной связи между признаками.Коэффициент детерминации:
.
Это означает, что 69% вариации заработной платы (у) объясняетсявариацией фактора - среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 10%.
3. Оценку статистической значимости уравнения регрессии в целомпроведем с помощью -критерия Фишера. Фактическое значение критерия по формуле составит
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет Fтабл =4,96