Используя данные «Российского статистического ежегодника. 2017 г.» ( сайт www.gks.ru), выберете 2-а взаимосвязанных признака (факторный и результативный) по 10-и субъектам РФ 2016 г.
2.Упорядочите выбранную информацию по факторному признаку. Проанализируйте результаты группировки. Исключите аномальные наблюдения, если они имеются.
4.Постройте эмпирическую линию регрессии.
5.Выберете математическую функцию для построения уравнения регрессии.
6.Определите с помощью метода наименьших квадратов параметры уравнения регрессии.
7.Определите теоретические значения результативного признака.
8.Изобразите на графике фактических данных теоретическую кривую. Оцените визуально выбор функции связи.
9.Определите среднюю относительную ошибку аппроксимации. Оцените ее значение.
10.Определите индекс корреляции (теоретическую и корреляционное отношение). Произведите оценку показателя.
11.Определите линейный коэффициент парной корреляции (если связь линейная).
12.Определите коэффициенты Фехнера и Спирмена. Проанализируйте рассчитанные показатели.
Решение
Таблица - Исходные данные
Регион Среднедушевые денежные доходы населения, руб. в месяц Потребление мяса и мясопродуктов, кг в год
Белгородская область 29579 95
Брянская область 25336 65
Владимирская область 22853 57
Воронежская область 29569 92
Ивановская область 23679 56
Калужская область 28592 78
Костромская область 23970 49
Курская область 25815 83
Липецкая область 28455 77
Орловская область 23237 74
По формуле Стерджесса определяем число групп в образующихся интервальный ряд
N=1+3.322lgN
Где N=10 в соответствии с условием задачи
N=1+3.322lg10=4,3≈4 группы
Принимаем группировку с равными интервалами и определяем величину интервала h по формуле
h=Rn=xmax-xminn
тогда имеем
h=29579-228534=1681,5 руб.
В соответствии с найденными параметрами строим интервальный ряд распределения. Группировка представлена в таблице
Группа Распределение регионов по среднедушевому денежному доходу, руб. в месяц Число регионов
1 22853-24534,5 4
2 24534,5-26216 2
3 26216-27897,5 0
4 27897,5-29579 4
Итого
10
Как видим, наиболее многочисленной являются 1 и 4 группы, куда входят по 4 региона. Наиболее малочисленной является 3 группа, в данную группу не вошел ни одно регион.
Уравнение регрессии
Уравнение прямой имеет следующий вид:
ух=а0+а1∙x
Для того, чтобы найти а0 и а1 воспользуемся методом наименьших квадратов и построим систему уравнений
na0+a1x=ухa0+a1(x2)=xу
Для удобства вычислений построим вспомогательную таблицу
Регион Х Y X2 Y2 xy ух
yi-ух÷yi
(yi-ух)2
(yi-у)2
Белгородская область 29579 95 874917241 9025 2810005 88,91 0,064 37,1 501,8
Брянская область 25336 65 641912896 4225 1646840 68,97 0,061 15,8 57,8
Владимирская область 22853 57 522259609 3249 1302621 57,30 0,005 0,1 243,4
Воронежская область 29569 92 874325761 8464 2720348 88,86 0,034 9,8 376,4
Ивановская область 23679 56 560695041 3136 1326024 61,18 0,093 26,8 275,6
Калужская область 28592 78 817502464 6084 2230176 84,27 0,080 39,3 29,2
Костромская область 23970 49 574560900 2401 1174530 62,55 0,277 183,6 557,0
Курская область 25815 83 666414225 6889 2142645 71,22 0,142 138,8 108,2
Липецкая область 28455 77 809687025 5929 2191035 83,63 0,086 43,9 19,4
Орловская область 23237 74 539958169 5476 1719538 59,10 0,201 221,9 2,0
итого 261085 726 6882233331 54878 19263762 726,00 1,043 717,1 2170,4
10a0+261085a1=726261085а0+6882233331а1=19263762
Для расчета а0 воспользуемся формулой
а0=у-а1хn
Для расчета а1 подставим а0 во 2 уравнение
261085726-261085а110+6882233331а1=19263762
а1=0.0047
а0=726-261085*0.004710=-50.11
ух=-50.11+0.0047∙х
С увеличением среднедушевых денежных доходов населения на 1 руб
. потребление мяса и мясопродуктов увеличивается на 0,0047 кг.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значенияух.
Так как y=ух=726, следовательно, параметры уравнения определены правильно.
Средняя ошибка аппроксимации рассчитывается по формуле:
А=yi-ух÷yin∙100%=1,04310*100=10,43%
Так как значение средней ошибки аппроксимации меньше 15%,то модель является хорошо подобранной.
Индекс корреляции рассчитывается по формуле:
R=1-(yi-yx)2(yi-y)2=1-717.12170.4=0.818
Полученная величина свидетельствует о том, что фактор x (среднедушевые денежные доходы ) существенно влияет на y (потребление мяса и мясопродуктов).
Для определения наличия и характера корреляционной связи между признаками среднедушевым доходом и потреблением мяса и мясопродуктов рассчитаем линейный коэффициент корреляции.
rxy=nxy-xynx2-(x)2×ny2-(y)2
rxy=10*19263762-261085*72610*6882233331-2610852×10*54878-7262=192637620-189547710656956085*21704=30899103776053=0,818
Между среднедушевым доходом и потреблением мяса и мясопродуктов существует прямая сильная связь.
Ранговый коэффициент корреляции Спирмена вычисляется по формуле:
P=1-6(D2)n(n2-1)
где n - количество ранжируемых признаков;
D - разность между рангами по двум переменным;
(D2)- сумма квадратов разностей рангов.
Построим вспомогательную таблицу.
Таблица – Таблица для расчета коэффициента Спирмена
Регион Х R1 Y R2 D2
Белгородская область 29579 10 95 10 0
Брянская область 25336 5 65 4 1
Владимирская область 22853 1 57 3 4
Воронежская область 29569 9 92 9 0
Ивановская область 23679 3 56 2 1
Калужская область 28592 8 78 7 1
Костромская область 23970 4 49 1 9
Курская область 25815 6 83 8 4
Липецкая область 28455 7 77 6 1
Орловская область 23237 2 74 5 9
итого 30
Тогда P=1-6*3010(102-1)=1-180990=0,818
Коэффициент Спирмена показал, что между среднедушевым доходом и потреблением мяса и мясопродуктов существует прямая сильная связь.
Коэффициент Фехнера рассчитывается по формуле:
КФ=na-nbna+nb
где na- число совпадений знаков отклонений индивидуальных величин от средней; nb- число несовпадений
Для удобства вычислений построим вспомогательную таблицу
Таблица – Вспомогательная таблица для расчета коэффициента Фехнера
Регион Y X Знаки отклонений значений признака от средней Совпадение (а) или несовпаднение (b) знаков
Y X
Белгородская область 95 29579 + + a
Брянская область 65 25336 - - a
Владимирская область 57 22853 - - a
Воронежская область 92 29569 + + a
Ивановская область 56 23679 - - a
Калужская область 78 28592 + + a
Костромская область 49 23970 - - a
Курская область 83 25815 + - b
Липецкая область 77 28455 + + a
Орловская область 74 23237 + - b
Среднее 72,6 26108,5
КФ=8-28+2=0.6
Значение коэффициента Фехнера показывает, что между среднедушевым доходом и потреблением мяса и мясопродуктов существует прямая заметная связь.
По результатам расчетов по различным методам оценки направления и силы связи можем сделать вывод, что среднедушевые доходы населения имеют сильное влияние на изменение потребления мяса и мясопродуктов.
4