Район Средний размер назначенных ежемесячных пенсий, тыс.руб.
у Прожиточный минимум в среднем на одного пенсионера в месяц, тыс.руб.
х
Брянская обл. 240 178
Владимирская обл. 226 202
Ивановская обл. 221 197
Калужская обл. 226 201
Костромксая обл. 220 189
Г.Москва
250 302
Московская обл. 237 215
Орловская обл. 232 166
Рязанская обл. 215 199
Смоленская обл. 220 180
Тверская обл
222 181
Тульская обл. 231 186
Ярославская об. 229 250
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи
2. Рассчитайте параметры уравнений линейной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помошью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатами.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. Оцените с помощью F -критерия Фишера статистическую надежность результатов регрессионного моделирования.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости.
Решение
Построим корреляционное поле между средним размером назначенных ежемесячных пенсий и прожиточным минимумом в среднем на одного пенсионера в месяц.
На основе анализа поля рассеяния выдвигаем гипотезу о том, что зависимость среднего размера назначенных ежемесячных пенсий и от прожиточного минимума в среднем на одного пенсионера в месяц описывается линейной регрессионной моделью.
2. Рассчитаем параметры уравнений линейной регрессии.
Для расчета заполним таблицу:
Таблица 1
Номер наблюдения х у
1 40,5 26,5 31684 57600 42720
2 75 48,4 40804 51076 45652
3 26,7 15,5 38809 48841 43537
4 71,1 30,6 40401 51076 45426
5 74,1 32 35721 48400 41580
6 35,5 25,3 91204 62500 75500
7 61,6 20,9 46225 56169 50955
8 36,4 38,3 27556 53824 38512
9 30,6 24,6 39601 46225 42785
10 67,6 44,1 32400 48400 39600
11 73,9 39,9 32761 49284 40182
12 32,2 26,6 34596 53361 42966
13 86,3 42,9 62500 52441 57250
Сумма 1035,6 635,1 554262 679197 606665
Рассчитаем коэффициенты линейного уравнения регрессии методом наименьших квадратов. Для этого составляем систему нормальных уравнений и находим ее решение:
Решением этой системы являются числа: а=197,7965, b=0,1503
Получили уравнение регрессии: . у = 197,7965+0,1503x
3. Оценим тесноту связи с помощью показателей корреляции и детерминации.
Выборочные средние.
EQ \x\to(x) = \f(∑xi;n) = \f(2646;13) = 203.538EQ \x\to(y) = \f(∑yi;n) = \f(2969;13) = 228.385
EQ \x\to(xy) = \f(∑xiyi;n) = \f(606665;13) = 46666.538
Выборочные дисперсии:
EQ S2(x) = \f(∑x2i;n) - \x\to(x)2 = \f(554262;13) - 203.5382 = EQ 1207.63
EQ S2(y) = \f(∑y2i;n) - \x\to(y)2 = \f(679197;13) - 228.3852 = EQ 86.39
Среднеквадратическое отклонение
EQ S(x) = \r(S2(x)) = \r(1207.63) = 34.751EQ S(y) = \r(S2(y)) = \r(86.39) = 9.295
Рассчитываем показатель тесноты связи
. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
EQ rxy = \f(\x\to(x·y) -\x\to(x)·\x\to(y);S(x)·S(y)) = \f(46666.538 - 203.538·228.385;34.751·9.295) = EQ 0.562
В нашем примере связь между признаком Y и фактором X заметна и прямая.
Коэффициент детерминации: R2= 0.5622 = 0.3157
т.е. в 31.57% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - средняя. Остальные 68.43% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
4. Дадим с помошью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатами.
Коэффициент эластичности находится по формуле:
EQ E = \f(∂y;∂x) \f(x;y) = b\f(\x\to(x);\x\to(y))EQ E = 0.15\f(203.538;228.385) = 0.134
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно
5. Оценим с помощью средней ошибки аппроксимации качество уравнений.
EQ \x\to(A) = \f(∑|y\s\do4(i) - y\s\do4(x)| : y\s\do4(i);n)100%
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным