По территориям региона приводятся данные за 2014 г. (р1
- число букв в полном имени, р2 - число букв в фамилии).
Номеррегиона Среднедушевой прожиточныйминимум в день одноготрудоспособного, руб., x
Среднедневная заработнаяплата, руб., y
1 78+р1
133+ р2
2 80+р2
148
3 87 135+р1
4 79 154
5 106 157+р1
6 106+ р1
195
7 67 139
8 98 158+ р2
9 73+р2
152
10 87 162
11 86 146+ р2
12 110+р1
173
Требуется:
1.Построить линейное уравнение парной регрессии у по х.
2.Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость уравнения регрессии вцелом и отдельных параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
4.Выполнить прогноз заработной платы y при прогнозномзначении среднедушевого прожиточного минимума x, составляющем107% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и егодоверительный интервал.
6.На одном графике отложить исходные данные итеоретическую прямую.
7.Проверить вычисления в MS Excel.
p1=5 , p2 =8
Решение
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
83 141 11703 6889 19881 150,1277 -9,12765 83,31405 6,473513
88 148 13024 7744 21904 154,7183 -6,71831 45,13574 4,539401
87 140 12180 7569 19600 153,8002 -13,8002 190,445 9,857273
79 154 12166 6241 23716 146,4551 7,544876 56,92515 4,89927
106 162 17172 11236 26244 171,2447 -9,24469 85,46436 5,706601
111 195 21645 12321 38025 175,8354 19,16465 367,2836 9,828023
67 139 9313 4489 19321 135,4375 3,562462 12,69114 2,562922
98 166 16268 9604 27556 163,8996 2,100364 4,411528 1,265279
81 152 12312 6561 23104 148,2914 3,708611 13,7538 2,439876
87 162 14094 7569 26244 153,8002 8,199818 67,23702 5,061616
86 154 13244 7396 23716 152,882 1,11795 1,249813 0,725942
115 173 19895 13225 29929 179,5079 -6,50788 42,35255 3,761782
Итого 1088 1886 173016 100844 299240 1886 8,53E-14 970,2638 57,1215
Средние значения 90,66667 157,1667 14418 8403,667 24936,67 157,1667
13,53596 15,33967
183,2222 235,3056
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Получим: Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемсреднедушевого прожиточного минимума на 1 руб
. среднедневнаязаработная плата возрастает в среднем на 0,918 руб. (или 92 коп.).
После нахождения уравнения регрессии заполняем столбцы 7-10таблицы 1.
Выполним оценку тесноту связи между переменными с помощью коэффициента корреляции и средней ошибки аппроксимации:
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим :
Т.к. значение коэффициента корреляции больше 0,7, то это говорит оналичии весьма тесной линейной связи между признаками.Коэффициент детерминации:
.
Это означает, что 65,6% вариации заработной платы (у) объясняетсявариацией фактора - среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели оценивается как хорошее, так как не превышает 10%.
3