Исходные данные по варианту №6 для выполнения контрольной работы представлены в таблице 1.
Таблица 1 – Исходные данные
Номер района Потребительские расходы на душу населения, тыс. руб., у Среднемесячные доходы на душу населения, тыс. руб., х
1 13,60 17,47
2 8,30 12,37
3 8,43 15,10
4 19,33 33,53
5 21,70 33,23
6 4,63 7,23
7 10,73 16,20
8 29,97 66,30
9 11,00 19,83
10 14,87 51,67
11 21,40 31,23
12 18,07 25,37
13 16,80 25,53
14 28,70 57,33
15 23,57 57,83
16 18,57 35,07
Требуется:
Рассчитайте параметры уравнений линейной, степенной, показательной и гиперболической парных регрессий.
Оцените тесноту связи с помощью показателей корреляции и детерминации.
Оцените качество уравнений с помощью средней ошибки аппроксимации.
Оцените статистическую надёжность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 2-4, выберите лучшее уравнение регрессии и дайте обоснование выбору.
Рассчитайте ожидаемое значение результата, если прогнозное значение фактора увеличится на 10 % от его среднего уровня.
Решение
Линейная парная регрессия вида: y=a+b×x.
Определим параметры уравнения, осуществив предварительные расчеты в таблице 2.
Таблица 2
Вспомогательные таблица для парной линейной регрессии
№ у х ху х²
1 13,60 17,47 237,59 305,20
2 8,30 12,37 102,67 153,02
3 8,43 15,10 127,29 228,01
4 19,33 33,53 648,13 1 124,26
5 21,70 33,23 721,09 1 104,23
6 4,63 7,23 33,47 52,27
7 10,73 16,20 173,83 262,44
8 29,97 66,30 1 987,01 4 395,69
9 11,00 19,83 218,13 393,23
10 14,87 51,67 768,33 2 669,79
11 21,40 31,23 668,32 975,31
12 18,07 25,37 458,44 643,64
13 16,80 25,53 428,90 651,78
14 28,70 57,33 1 645,37 3 286,73
15 23,57 57,83 1 363,05 3 344,31
16 18,57 35,07 651,25 1 229,90
сумма 269,67 505,29 10 232,89 20 819,82
среднее 16,85 31,58 639,56 1 301,24
Система нормальных уравнений для линейной регрессии:
16a+505,29b=269,67;505,29+20 819,82b=10 232,89.
Определим параметры уравнения:
b=xy-x×yx2-x2=639,56-31,58×16,851 301,24-31,582=0,353;
a=y-x×b=16,85-31,58×0,353=5,706.
Получаем следующее парное линейное уравнение:
y=5,706+0,353×x.
На основе коэффициента регрессии b можно сделать вывод, что при увеличении среднемесячных доходов на душу населения на 1 тыс. руб. потребительские расходы на душу населения увеличиваются в среднем на 0,353 тыс. руб.
Для расчета коэффициентов корреляции, детерминации и средней ошибки аппроксимации произведем вспомогательные расчеты и представим их в таблице 3.
Таблица 3
Вспомогательные расчеты для линейной парной регрессии
№ ŷ (у-ŷ)² (у-уср)² А
1 11,87 2,98 10,59 0,13
2 10,07 3,14 73,18 0,21
3 11,04 6,79 70,97 0,31
4 17,54 3,19 6,13 0,09
5 17,44 18,18 23,48 0,20
6 8,26 13,16 149,44 0,78
7 11,42 0,48 37,51 0,06
8 29,11 0,74 172,02 0,03
9 12,71 2,91 34,27 0,16
10 23,95 82,38 3,94 0,61
11 16,73 21,80 20,66 0,22
12 14,66 11,62 1,48 0,19
13 14,72 4,33 0,00 0,12
14 25,94 7,59 140,32 0,10
15 26,12 6,51 45,10 0,11
16 18,09 0,23 2,94 0,03
сумма 269,67 186,05 792,03 3,34
среднее 16,85 11,63 49,50 0,21
Коэффициент корреляции составит:
rxy=1-(y-y)²(y-y)²=1-186,05792,03=0,875.
На основании полученного коэффициента корреляции можно сделать вывод о наличии между рассматриваемыми переменными прямой высокой корреляционной связи.
Коэффициент детерминации составит:
R2=rxy2=0,8752=0,765.
Коэффициент детерминации отражает высокую детерминированность потребительских расходов на душу населения (у) среднемесячными доходами на душу населения (х). Качество уравнения хорошее, так как 76,5% вариации исходных данных признака у описывается вариацией фактора х.
Определим среднюю ошибку аппроксимации, пользуясь предварительно рассчитанными данными таблицы 3.
A=3,3411×100%=20,89%.
Величина средней ошибки аппроксимации показывает, что в среднем расчетные значения отклоняются от фактических на 20,89%. Ошибка существенная и недопустимая, поскольку больше 10%, следовательно, данное уравнение неадекватно по данному критерию.
Для оценки статистической значимости построенного уравнения регрессии в целом выдвигаем гипотезы при уровне значимости а = 0,05:
H0:R2= 0 – уравнение статистически не значимо; H1:R2 ≠ 0 – уравнение статистически значимо.
Фактическое значение F-критерий Фишера составит:
Fфакт=0,7651-0,765×16-1-11= 45,599.
Критическое значение F-критерия определим с помощью встроенной функции Excel «FРАСПОБР». При уровне значимости а = 0,05 и степенями свободы: k1=1;k2=n-m-1=16-1-1=14, критическое значение критерия Фишера составит: F0,05=4,600.
Таким образом, можно признать статистическую значимость уравнения парной линейной регрессии, так как фактическое значение критерия Фишера существенно превышает соответствующее критическое значение.
Парная степенная регрессия: y=a×xb.
Введем следующее линеаризационное преобразование:
X = Ln(x); Y = Ln(Y).
Определим параметры уравнения, осуществив предварительные расчеты в таблице 4.
Таблица 4
Результаты вычислений для степенной парной регрессии
№ у х У Х ХУ Х²
1 13,60 17,47 2,61 2,86 7,47 8,18
2 8,30 12,37 2,12 2,52 5,32 6,33
3 8,43 15,10 2,13 2,71 5,79 7,37
4 19,33 33,53 2,96 3,51 10,40 12,34
5 21,70 33,23 3,08 3,50 10,78 12,27
6 4,63 7,23 1,53 1,98 3,03 3,91
7 10,73 16,20 2,37 2,79 6,61 7,76
8 29,97 66,30 3,40 4,19 14,26 17,59
9 11,00 19,83 2,40 2,99 7,16 8,92
10 14,87 51,67 2,70 3,94 10,65 15,56
11 21,40 31,23 3,06 3,44 10,54 11,84
12 18,07 25,37 2,89 3,23 9,36 10,46
13 16,80 25,53 2,82 3,24 9,14 10,50
14 28,70 57,33 3,36 4,05 13,59 16,39
15 23,57 57,83 3,16 4,06 12,82 16,46
16 18,57 35,07 2,92 3,56 10,39 12,65
сумма 269,67 505,29 43,52 52,57 147,32 178,54
среднее 16,85 31,58 2,72 3,29 9,21 11,16
Система нормальных уравнений для степенной парной регрессии, преобразованной в линейную форму имеет вид:
16A+52,57b=43,52;52,57A+178,54b=147,32.
Коэффициенты парной степенной регрессии, приведенной к линейному виду:
b=XY-X×YX2-X2=9,21-3,29×2,7211,16-3,292=0,747;
A=Y-X×b=2,72-3,29×0,747=0,264.
Осуществим потенцирование для определения параметра a степенной модели:
a=eA=e0,264=1,302.
Получаем уравнения степенной парной регрессии:
y=1,302×x0,747.
Таким образом, параметр регрессии b позволяет сделать вывод о том, что при увеличении среднемесячных доходов на душу населения на 1% потребительские расходы на душу населения увеличиваются в среднем на 0,747%
. Коэффициент b степенной модели регрессии представляет собой средний коэффициент эластичности.
Для расчета коэффициентов корреляции, детерминации и средней ошибки аппроксимации произведем вспомогательные расчеты и представим их в таблице 5.
Таблица 5
Вспомогательные расчеты для степенной регрессии
№ ŷ (у-ŷ)² (у-уср)² А
1 11,04 6,53 10,59 0,19
2 8,53 0,05 73,18 0,03
3 9,90 2,17 70,97 0,17
4 17,98 1,83 6,13 0,07
5 17,86 14,76 23,48 0,18
6 5,71 1,17 149,44 0,23
7 10,44 0,09 37,51 0,03
8 29,93 0,00 172,02 0,00
9 12,14 1,30 34,27 0,10
10 24,84 99,38 3,94 0,67
11 17,05 18,94 20,66 0,20
12 14,60 12,07 1,48 0,19
13 14,66 4,56 0,00 0,13
14 26,85 3,44 140,32 0,06
15 27,02 11,90 45,10 0,15
16 18,59 0,00 2,94 0,00
сумма 267,14 178,19 792,03 2,41
среднее 16,70 11,14 49,50 0,15
Коэффициент корреляции составит:
rxy=1-(y-y)²(y-y)²=1-178,19792,03=0,880.
На основании полученного коэффициента корреляции можно сделать вывод о наличии между рассматриваемыми переменными прямой высокой корреляционной связи.
Коэффициент детерминации составит:
R2=rxy2=0,8802=0,775.
Коэффициент детерминации отражает высокую детерминированность потребительских расходов на душу населения (у) среднемесячными доходами на душу населения (х). Качество степенного уравнения хорошее, так как 77,5% вариации исходных данных признака у описывается вариацией фактора х.
Определим среднюю ошибку аппроксимации, пользуясь предварительно рассчитанными данными таблицы 5.
A=2,4111×100%=15,056%.
Величина средней ошибки аппроксимации показывает, что в среднем расчетные значения отклоняются от фактических на 15,056%. Ошибка существенная и недопустимая, поскольку больше 10%, следовательно, данное уравнение неадекватно по данному критерию.
Для оценки статистической значимости построенного уравнения регрессии в целом выдвигаем гипотезы при уровне значимости а = 0,05:
H0:R2= 0 – уравнение статистически не значимо; H1:R2 ≠ 0 – уравнение статистически значимо.
Фактическое значение F-критерий Фишера составит:
Fфакт=0,7751-0,775×16-1-11= 48,228.
Критическое значение F-критерия определим с помощью встроенной функции Excel «FРАСПОБР». При уровне значимости а = 0,05 и степенями свободы: k1=1;k2=n-m-1=16-1-1=14, критическое значение критерия Фишера составит: F0,05=4,600.
Таким образом, можно признать статистическую значимость степенного уравнения парной регрессии, так как фактическое значение критерия Фишера существенно превышает соответствующее критическое значение.
Показательная парная регрессии: y=a×bx.
Введем следующее линеаризационное преобразование: Y = Ln(Y).
Определим параметры уравнения, осуществив предварительные расчеты в таблице 6.
Таблица 6
Результаты вычислений для показательной регрессии
№ у х У хУ х²
1 13,60 17,47 2,61 45,60 305,20
2 8,30 12,37 2,12 26,18 153,02
3 8,43 15,10 2,13 32,19 228,01
4 19,33 33,53 2,96 99,30 1 124,26
5 21,70 33,23 3,08 102,26 1 104,23
6 4,63 7,23 1,53 11,08 52,27
7 10,73 16,20 2,37 38,44 262,44
8 29,97 66,30 3,40 225,43 4 395,69
9 11,00 19,83 2,40 47,55 393,23
10 14,87 51,67 2,70 139,48 2 669,79
11 21,40 31,23 3,06 95,67 975,31
12 18,07 25,37 2,89 73,43 643,64
13 16,80 25,53 2,82 72,03 651,78
14 28,70 57,33 3,36 192,45 3 286,73
15 23,57 57,83 3,16 182,74 3 344,31
16 18,57 35,07 2,92 102,46 1 229,90
сумма 269,67 505,29 43,52 1 486,29 20 819,82
среднее 16,85 31,58 2,72 92,89 1 301,24
Система нормальных уравнений для показательной регрессии, приведенной к линейному виду:
16A+505,29B=43,52;505,29A+20 819,82B=1 486,29.
Определим коэффициенты показательной регрессии, приведенной к линейному виду:
B=xY-x×Yx2-x2=92,89-31,58×2,721 301,24-31,582=0,023;
A=Y-x×b=2,72-31,58×0,023=1,993.
Для приведения уравнения к исходному виду определим параметры a и b, осуществив потенцирование:
a=eA=e1,993=7,334;b=eB=e0,023=1,023 .
Получено уравнение показательной парной регрессии:
y=7,334×1,023x.
Для расчета коэффициентов корреляции, детерминации и средней ошибки аппроксимации произведем вспомогательные расчеты и представим их в таблице 7.
Таблица 7
Вспомогательные расчеты для показательной регрессии
№ ŷ (у-ŷ)² (у-уср)² А
1 10,97 6,93 10,59 0,19
2 9,75 2,11 73,18 0,17
3 10,38 3,82 70,97 0,23
4 15,87 11,94 6,13 0,18
5 15,77 35,22 23,48 0,27
6 8,66 16,27 149,44 0,87
7 10,65 0,01 37,51 0,01
8 33,76 14,40 172,02 0,13
9 11,58 0,34 34,27 0,05
10 24,11 85,32 3,94 0,62
11 15,06 40,25 20,66 0,30
12 13,16 24,15 1,48 0,27
13 13,20 12,93 0,00 0,21
14 27,46 1,53 140,32 0,04
15 27,78 17,73 45,10 0,18
16 16,45 4,50 2,94 0,11
сумма 264,62 277,43 792,03 3,85
среднее 16,54 17,34 49,50 0,24
Коэффициент корреляции составит:
rxy=1-(y-y)²(y-y)²=1-277,43792,03=0,806.
На основании полученного коэффициента корреляции можно сделать вывод о наличии между рассматриваемыми переменными прямой высокой корреляционной связи