Постройте поле корреляции и сформулируйте гипотезу о форме связи.
Рассчитайте параметры уравнений линейной, степенной, гиперболической парной регрессии.
Оцените тесноту связи с помощью показателей корреляции и детерминации.
Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
Оцените с помощью средней ошибки аппроксимации качество уравнений.
С помощью F-критерия Фишера оцените статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в п п. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
Оцените полученные результаты, выводы оформите в аналитической записке.
Район Доля денежных доходов, направленных на прирост сбережений во вкладах, займах и т.д. в общей сумме среднедневного денежного дохода%., у Среднемесячная начисленная заработная плата, тыс. руб., х
Брянская обл. 8,1 297
Владимирская обл. 9,7 344
Ивановская обл. 7,4 350
Калужская обл. 9,4 443
Костромская обл. 7,1 396
Орловская обл. 10,4 311
Рязанская обл. 7,4 361
Смоленская обл. 10,3 357
Тверская обл. 9,2 375
Тульская обл. 9,6 395
Решение
Постройте поле корреляции и сформулируйте гипотезу о форме связи.
Построив поле корреляции, можно выдвинуть гипотезу о том, что связь между фактором и результатом описывается линейной функцией.
2а. Для расчета параметров а и b линейной регрессии у = а + b х решаем систему нормальных уравнений относительно а и b:
По исходным данным рассчитываем у, х, ух, x2, у2.
Таблица 1.2
y x ух
х2
у2
y – Ai
1 8,1 297 2405,7 88209 65,61 8,94 -0,84 10,38
2 9,7 344 3336,8 118336 94,09 8,88 0,82 8,42
3 7,4 350 2590 122500 54,76 8,88 -1,48 19,95
4 9,4 443 4164,2 196249 88,36 8,76 0,64 6,77
5 7,1 396 2811,6 156816 50,41 8,82 -1,72 24,23
6 10,4 311 3234,4 96721 108,16 8,92 1,48 14,20
7 7,4 361 2671,4 130321 54,76 8,86 -1,46 19,77
8 10,3 357 3677,1 127449 106,09 8,87 1,43 13,90
9 9,2 375 3450 140625 84,64 8,85 0,35 3,85
10 9,6 395 3792 156025 92,16 8,82 0,78 8,11
Итого 88,6 3629 32133,2 1333251 799,04 88,61 -0,01 129,57
Среднее значение 8,86 362,9 3213,32 133325,1 79,904 8,86 -0,001 12,96
1,19 40,36 x x x x x x
2 1,40 1628,69 x x x x x x
Для наших данных система уравнений имеет вид:
10a+3629b=88,63629a+1333251b=32133,2
Из первого уравнения выражаем a и подставим во второе уравнение и получаем a = 9,2998, b = -0,00121.
Уравнение регрессии: = 9,2998 – 0,00121х.
Коэффициент детерминации, как и коэффициент корреляции, можно рассматривать как меру качества уравнения регрессии. Чем ближе R2 к 1, тем лучше регрессия описывает зависимость между объясняющими и зависимой переменными.
Определим линейный коэффициент парной корреляции:
rxy=bσxσy=-0.00121*40.361.19=-0.0413
Коэффициент детерминации: R2 = -0.04132 = 0,0017, т.е
. в 0.17% случаев изменения х приводят к изменению y.
Э=b*xy=-0.00121*362.98.86=-0.00496
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.
Средняя относительная ошибка:
A=12.96%
В среднем расчетные значения ŷ для линейной модели отличаются от фактических значений на 12.96%.
Fкр0,05;1;8=5,32
Формула F-критерия Фишера:
F=R2(n-2)1-R2=0.0017*81-0.0017=0.014
Т.к. F < Fкр, то уравнение и R2 не значимы.
1б. Построению степенной модели у = ахb предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
Для расчетов используем данные табл. 1.3.
Таблица 1.3
Y X YX Y2 X2 y – (y – )2 Ai
1 2,09 5,69 11,91 4,38 32,42 2,18 5,92 35,02 4,33
2 2,27 5,84 13,27 5,16 34,11 2,17 7,53 56,63 4,29
3 2,00 5,86 11,72 4,01 34,32 2,17 5,23 27,31 8,60
4 2,24 6,09 13,65 5,02 37,13 2,16 7,24 52,40 3,56
5 1,96 5,98 11,72 3,84 35,78 2,17 4,93 24,33 10,56
6 2,34 5,74 13,44 5,48 32,95 2,18 8,22 67,57 6,91
7 2,00 5,89 11,79 4,01 34,68 2,17 5,23 27,33 8,52
8 2,33 5,88 13,71 5,44 34,55 2,17 8,13 66,05 6,84
9 2,22 5,93 13,15 4,92 35,13 2,17 7,03 49,42 2,22
10 2,26 5,98 13,52 5,12 35,75 2,17 7,43 55,25 4,18
Итого 21,72 58,88 127,90 47,38 346,80 21,72 66,88 461,32 60,02
Среднее значение 2,17 5,89 12,79 4,74 34,68 2,17 6,69 46,13 6,00
0,14 0,11 X X X X X X X
2 0,02 0,01 X X X X X X X
Для наших данных система уравнений имеет вид:
10a+58.88b=21.7258.88a+346.803b=127.895
Из первого уравнения выражаем a и подставим во второе уравнение и получаем a = 2.49, b = -0,054
Получим линейное уравнение: = 2.49 – 0.054X