По территориям региона приведены статистические данные доли денежных доходов, направленных на прирост сбережений в общей сумме среднедушевого денежного дохода Y (%) и среднемесячной заработной платы Х (тыс. руб.) (табл. 5.7).
Таблица 5.7
Номер района
5.4.2
(Волго-вятский регион)
Y X
1 4,0 5,3
2 5,0 6,2
3 5,4 7,4
4 5,1 5,8
5 6,3 9,1
6 5,6 8,3
7 6,5 10,4
8 6,6 11,0
9 – –
10 – –
11 – –
α = 0,05 xр = 12
Задание
Постройте корреляционное поле и по его виду определите форму зависимости между Х и Y.
Оцените по МНК параметры уравнения линейной регрессии.
Оцените выборочный коэффициент корреляции и сделайте предварительный вывод о силе линейной взаимосвязи параметров Х и Y.
Проверьте качество уравнения регрессии:
- значимость коэффициентов регрессии;
- интервальные оценки коэффициентов регрессии;
- значимость уравнения регрессии в целом.
Проинтерпретируйте результаты.
Сделайте прогноз доли денежных доходов, направленных на прирост сбережений и доверительный интервал для нее при значении Х = xр.
Решение
Построим корреляционное поле и по его виду определим форму зависимости между Х и Y.
Построим корреляционное поле с помощью Мастера диаграмм, используя данные по средней заработной плате и доле денежных доходов в Волго-вятском регионе.
По расположению точек поля корреляции можно сделать предположение о наличии прямой линейной зависимости между среднемесячной заработной платой и долей денежных доходов, направленных на прирост сбережений в общей сумме среднедушевого денежного дохода.
2. Оценим по МНК параметры уравнения линейной регрессии.
Формально критерий МНК можно записать так:
Система нормальных уравнений.
Для расчета параметров регрессии построим расчетную таблицу
x y x2 y2 x • y
5,3 4 28,09 16 21,2
6,2 5 38,44 25 31
7,4 5,4 54,76 29,16 39,96
5,8 5,1 33,64 26,01 29,58
9,1 6,3 82,81 39,69 57,33
8,3 5,6 68,89 31,36 46,48
10,4 6,5 108,16 42,25 67,6
11 6,6 121 43,56 72,6
Сумма 63,5 44,5 535,79 253,03 365,75
Для наших данных система уравнений имеет вид
Домножим уравнение (1) системы на (-7.938), получим систему, которую решим методом алгебраического сложения.
Получаем:
Откуда b = 0,3946
Уравнение регрессии:
y = 0,3946 x + 2,4306
При увеличении среднемесячной зарплаты на 1 тыс. руб., доля денежных доходов, направленных на прирост сбережений в общей сумме среднедушевого денежного дохода, увеличится на 0,395%.
3. Оценим выборочный коэффициент корреляции и сделаем предварительный вывод о силе линейной взаимосвязи параметров Х и Y.
Найдем средние квадратические отклонения признаков:
Тогда коэффициент корреляции:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными)
. Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y (доля денежных доходов) фактором X (заработная плата) высокая и прямая.
Коэффициент детерминации:
т.е. в 89,92% случаев изменения среднемесячной заработной платы х приводят к изменению доли денежных доходов, направленных на прирост сбережений y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 10,08% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
4. Проверим качество уравнения регрессии:
a. значимость коэффициентов регрессии;
Для оценки качества параметров регрессии построим расчетную таблицу:
x y y(x) (yi-ycp)2 (y-y(x))2 (xi-xcp)2
5,3 4 4,522 2,441 0,272 6,956
6,2 5 4,877 0,316 0,0151 3,019
7,4 5,4 5,35 0,0264 0,00246 0,289
5,8 5,1 4,719 0,214 0,145 4,569
9,1 6,3 6,021 0,544 0,0777 1,351
8,3 5,6 5,706 0,00141 0,0111 0,131
10,4 6,5 6,534 0,879 0,00117 6,064
11 6,6 6,771 1,076 0,0292 9,379
Сумма 63,5 44,5 44,5 5,499 0,554 31,759
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента.
Оценка значимости коэффициентов регрессии с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки
Табличное значение -критерия
tкрит (n-m-1;α/2) = 2,969
Определим случайные ошибки , , :
Остаточная дисперсия на одну степень свободы
ma - стандартное отклонение случайной величины a:
mb - стандартное отклонение случайной величины b.
Тогда
Поскольку 5.51 > 2.969, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 7.32 > 2.969, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента)