Используя данные «Российского статистического ежегодника. 2020» (сайт www.gks.ru), выберите 2-а взаимосвязанных признака факторный и результативный) по 10-и субъектам РФ за 2019 г.
2. Упорядочите выбранную информацию по факторному признаку. Проанализируйте результаты группировки. Исключите аномальные наблюдения, если они имеются.
4. Постройте эмпирическую линию регрессии (график фактических данных).
5. Выберите математическую функцию для построения уравнения регрессии.
6. Определите с помощью метода наименьших квадратов параметры уравнения регрессии.
7. Определите теоретические значения результативного признака.
8. Изобразите на графике фактических данных теоретическую кривую. Оцените визуально выбор функции связи.
9. Определите среднюю относительную ошибку аппроксимации (ε). Оцените ее значение. Сделайте вывод об адекватности выбранного уравнения регрессии.
10. Определите линейный коэффициент парной корреляции (если связь линейная). Сделайте вывод.
11. Определите коэффициенты Фехнера и Спирмена. Проанализируйте рассчитанные показатели.
Решение
Таблица 2.1. – Исходные данные
Регион Среднедушевые денежные доходы населения, руб. в месяц Потребление мяса и мясопродуктов, кг в год
Белгородская область 32352 96
Брянская область 28371 67
Владимирская область 25358 60
Воронежская область 32022 95
Ивановская область 25794 63
Калужская область 31394 82
Костромская область 25285 59
Курская область 29149 88
Липецкая область 32479 79
Орловская область 26064 80
Факторный признак – среднедушевые денежные доходы (руб. в месяц), результативным – потребление мяса и мясопродуктов (кг в год). Упорядочим субъекты РФ по среднедушевым денежным доходам в 2019 году.
Таблица 2.2. – Ранжированный ряд среднедушевым денежным доходам в 2019 году
Субъект РФ Среднедушевые денежные доходы населения, руб. в месяц Потребление мяса и мясопродуктов, кг в год
7 Костромская область 25285 59
3 Владимирская область 25358 60
5 Ивановская область 25794 63
10 Орловская область 26064 80
2 Брянская область 28371 67
8 Курская область 29149 88
6 Калужская область 31394 82
4 Воронежская область 32022 95
1 Белгородская область 32352 96
9 Липецкая область 32479 79
Итого 288268 769
Минимальные среднедушевые денежные доходы населения среди регионов наблюдается в Костромской области, максимальная – в Липецкой области.
Проверим единицы совокупности на однородность по факторному и результативному признаку по правилу 3 сигм.
СКО определим по формуле:
х=(xi-x)2n
Среднее значение найдем по формуле средней арифметической простой:
x=∑xin
Таблица 2.3. – Расчетная таблица
Субъект РФ Среднедушевые денежные доходы населения, руб. в месяц Потребление мяса и мясопродуктов, кг в год (xi-x)2
(уi-у)2
7 Костромская область 25285 59 12544347,24 320,4
3 Владимирская область 25358 60 12032573,44 285,6
5 Ивановская область 25794 63 9197875,84 193,2
10 Орловская область 26064 80 7633063,84 9,6
2 Брянская область 28371 67 207753,64 98,0
8 Курская область 29149 88 103812,84 123,2
6 Калужская область 31394 82 6590515,84 26,0
4 Воронежская область 32022 95 10209303,04 327,6
1 Белгородская область 32352 96 12427035,04 364,8
9 Липецкая область 32479 79 13338564,84 4,4
Сумма 288268 769 84284845,6 1752,9
Среднее 28826,8 76,9 х y
Дисперсия 8428484,6 175,3
СКО 2903,2 13,2
x+3х=28826,8+3*2903,2=37536,4 руб.в месяц
x-3х=28826,8-3*2903,2=20117,2 руб.в месяц
Таким образом, все единицы совокупности удовлетворяют правилу 3 сигм по факторному признаку.
у+3у=76,9+3*13,2=116,5 кг в год
у-3у=76,9-3*13,2=37,3 кг в год
Все единицы совокупности удовлетворяют правилу 3 сигм также по результативному признаку.
Построим эмпирическую линию регрессии.
Рисунок 2.1
. – Эмпирическая линия регрессии
Для построения теоретической линии регрессии выберем линейный тренд. В общем виде он имеет вид:
Уравнение тренда имеет вид:
yх =a0+ a1х2
Параметры уравнения определим с помощью системы уравнений МНК:
a0n+a1∑х=∑ya0∑х+a1∑х2=∑хy
Для удобства расчетов построим вспомогательную таблицу
Таблица 2.4. – Расчетная таблица
Субъект РФ Среднедушевые денежные доходы, руб. в месяц Потребление мяса и мясопродуктов, кг в год x2 y2 xy
7 Костромская область 25285 59 639331225 3481,0 1491815
3 Владимирская область 25358 60 643028164 3600,0 1521480
5 Ивановская область 25794 63 665330436 3969,0 1625022
10 Орловская область 26064 80 679332096 6400,0 2085120
2 Брянская область 28371 67 804913641 4489,0 1900857
8 Курская область 29149 88 849664201 7744,0 2565112
6 Калужская область 31394 82 985583236 6724,0 2574308
4 Воронежская область 32022 95 1025408484 9025,0 3042090
1 Белгородская область 32352 96 1046651904 9216,0 3105792
9 Липецкая область 32479 79 1054885441 6241,0 2565841
Итого 288268 769 8394128828 60889,0 22477437
10a0+288268a1=769288268а0+8394128828а1=22477437
Для расчета а0 воспользуемся формулой
а0=у-а1хn
Для расчета а1 подставим а0 во 2 уравнение
288268769-288268а110+8394128828а1=22477437
а1=0,00367
а0=769-288268*0,0036710=-28,894356
Уравнение примет вид:
yх = 0,00367*х-28,894356
На основе полученного уравнения рассчитаем теоретические значения результативного признака потребление мяса и мясопродуктов.
Таблица 2.5. – Расчетная таблица
Субъект РФ Среднедушевые денежные доходы, руб. в месяц Потребление мяса и мясопродуктов, кг в год x2
7 Костромская область 25285 59 639331225 63,902
3 Владимирская область 25358 60 643028164 64,170
5 Ивановская область 25794 63 665330436 65,770
10 Орловская область 26064 80 679332096 66,761
2 Брянская область 28371 67 804913641 75,227
8 Курская область 29149 88 849664201 78,082
6 Калужская область 31394 82 985583236 86,322
4 Воронежская область 32022 95 1025408484 88,626
1 Белгородская область 32352 96 1046651904 89,837
9 Липецкая область 32479 79 1054885441 90,304
Итого 288268 769 8394128828 769,0
Представим на одном графике с фактическими значениями теоретические значения, рассчитанные на основе построенного уравнения.
Рисунок 2.2