В таблице приведены статистические данные, описывающие зависимость спроса на товар (y) от его цены (x):
Таблица 5
№ 1 2 3 4 5 6 7
Цена товара, руб. 99 82 77 69 52 44 31
Спрос на товар, шт. 100 115 210 270 323 478 544
По имеющимся данным –
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры линейной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Оцените с помощью средней ошибки аппроксимации качество уравнения.
5. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.
7. Оцените статистическую значимость коэффициента регрессии и коэффициента корреляции.
8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня.
9. Оцените полученные результаты, оформите выполненное задание в виде отчета.
Решение
1. Поле корреляции
Построим поле корреляции (диаграмму рассеяния). По расположению точек на поле корреляции можно судить о направлении и форме связи между переменными.
Рисунок 2 – Поле корреляции
Вывод. Расположение облака точек на поле корреляции произошло из левого верхнего угла в правый нижний угол. Значит существует обратная связь (отрицательная зависимость) между переменными, т.е. с увеличение цены товара х значения спроса у сокращаются. По форме связи можно предположить линейную зависимость.
2. Параметры линейной регрессии
Общий вид линейного уравнения парной регрессии:
yi=a+bxi, где
yi - расчетные теоретические значения результативного признака для i-го наблюдения;
a и b – параметры линейного уравнения парной регрессии.
b – коэффициент регрессии, который показывает на сколько в среднем изменяется значение результативного признака у при увеличении фактора х на единицу измерения.
xi – значение факторного признака для i-го наблюдения.
Параметры линейного уравнения найдем с помощью метода наименьших квадратов (МНК). Для определения параметров необходимо решить систему линейных уравнений:
&na+i=1nxib=i=1nyi&i=1nxia+i=1nxi2b=i=1nxiyi
Для расчета параметров использую готовые формулы, которые вытекают из этой системы:
b=xy-x×yx2-x2=15546-64,857×291,4294688-64,8572=-6,968
a=y-bx=291,429--6,968∙64,857=743,323
Таблица 6
Вспомогательная таблица для расчета коэффициента корреляции и
построения модели
№ xi
yi
xi2
xiyi
yi2
yi
εi
εi2
εiyi
xi-x2
1 99 100 9801 9900 10000 53,537 46,463 2158,81 0,46463 1165,73
2 82 115 6724 9430 13225 171,985 -56,985 3247,30 0,49552 293,878
3 77 210 5929 16170 44100 206,823 3,17723 10,09 0,01513 147,449
4 69 270 4761 18630 72900 262,563 7,43694 55,31 0,02754 17,1633
5 52 323 2704 16796 104329 381,011 -58,011 3365,30 0,1796 165,306
6 44 478 1936 21032 228484 436,751 41,2485 1701,44 0,08629 435,02
7 31 544 961 16864 295936 527,329 16,6705 277,91 0,03064 1146,31
Итого 454 2040 32816 108822 768974 2040 -4E-13 10816,16 1,29937 3370,86
Среднее 64,857 291,429 4688 15546 109853 291,429 -6E-14 1545,17 0,18562 481,551
Получаю линейное уравнение парной регрессии:
yi=743,323-6,968xi
Вывод
. Коэффициент регрессии b показывает, что при увеличении цены на товар на 1 руб. спрос в среднем сокращается на 6,968 ед.
3. Оценка тесноты связи с помощью показателей корреляции и детерминации
Коэффициент корреляции показывает тесноту и направление линейной связи между переменными. Чем ближе значение коэффициента к единице (по модулю), тем более тесная связь между признаками.
ryx=b∙x2-x2y2-y2=-6,968∙4688-64,8572109853-291,4292=-0,9685
Вывод. Коэффициент корреляции показывает, что связь между признаками очень тесная и обратная. С увеличением цены товара спрос сокращается.
Коэффициент детерминации характеризует долю вариации результативного признака под влиянием фактора, включенного в модель.
rxy2=0,96852=0,9380
Вывод. 93,80% вариации спроса у происходит под влиянием цены на товар х. Остальные 6,2% вариации результативного признака у объясняется влиянием прочих случайных факторов.
4. Оценка с помощью средней ошибки аппроксимации качество уравнения
Теоретические (расчетные) значения результативного показателя получаем путем последовательной подстановки xi в уравнение регрессии
Рассчитываем остатки, как разность фактических и расчетных значений:
εi=yi-yi
Расчет представлен в таблице 6.
Для оценки точности модели рассчитываем среднюю относительную ошибку аппроксимации:
А=1n×i=1nεiyi×100%=1n×1,29937×100%=18,56%
Вывод. Ошибка показывает, что в среднем фактические значения спроса на товар у отличаются от полученных по модели на 18,56%. Т.к. значение ошибки больше 7%, то модель не считается точной.
5. Коэффициент эластичности
Расчет коэффициента эластичности:
Э=b×xy=-6,968×64,857291,429=-1,551
Вывод. При увеличении цены х на 1% значение спроса на товар у в среднем сокращается на 1,551%.
6. Оценим статистическую надежность результатов регрессионного моделирования
Выдвигаем нулевую гипотезу о том, что найденные показатели тесноты связи случайны, т.е