Торговцу нужно выяснить, как изменяется количество пучков салата, продаваемых ежедневно в розницу. Имеются следующие сведения о количестве и цене:
Количество, тыс./день 28 29 34 35 37 37 41 46
Цена, у.е. за единицу 30 31 25 26 22 24 16 12
К пункту 6. Значение =20.
Задание
1) Постройте поле корреляции результативного и факторного признаков.
2) Определите параметры уравнения парной линейной регрессии. Дайте интерпретацию найденных параметров и всего уравнения в целом.
3) Постройте теоретическую линию регрессии, совместив её с полем корреляции. Сделайте выводы.
4) Рассчитайте коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
5) С вероятностью 0,95 оцените статистическую значимость уравнения регрессии.
6) С вероятностью 0,95 постройте доверительный интервал для прогноза оценки yi (x* задаётся отдельно в условии каждой задачи).
7) Определите значение коэффициента эластичности и объясните его.
Решение
1) Факторным признаком X является Цена за 1 единицу (у.е.), результативным признаком Y – Количество продаваемых пучков салата (тыс. в день).
Исследуется зависимость количества продаваемых пучков от цены за 1 единицу.
Корреляционное поле
По корреляционному полю можно сделать вывод, что взаимосвязь между количеством продаваемого салата и ценой есть, она обратная (то есть с увеличением цены снижается количество). Также видно, что взаимосвязь линейная.
2) Уравнение парной линейной регрессии имеет вид
y=a+bx
Неизвестные параметры a и b этого уравнения рассчитываются методом наименьших квадратов как решение системы уравнений
a*n+b*xi=yia*xi+b*xi2=xi*yi
Можно также использовать готовые формулы, которые получаются из системы
b=yx-y*xx2-(x)2
a=y-b*x
y и x – средние значения результативного и факторного признаков.
Проводим расчеты с использованием Excel
Получаем
b=801,125-35,875*23,25577,75-(23,25)2=-0,887
a=35,875--0,887*23,25=56,49
Записываем уравнение регрессии
y=56,49-0,887*x
Интерпретация параметров
Параметр b=-0,887 показывает, что при увеличении цены X за единицу на 1 у.е. количество Y проданных пучков салата будет снижаться в среднем на 0,887 тысяч в день.
Параметр a в уравнении парной линейной регрессии показывает значение Y при X = 0
. В полученном уравнении a=56,49 невозможно интерпретировать, так цена X не может стать равной нулю.
Интерпретация уравнения
Уравнение y=56,49-0,887*x описывает, как изменяется Количество продаваемых пучков салата (тыс. в день) в зависимости от Цены за единицу.
3) Рассчитаем теоретические значения Yi по уравнению и изобразим теоретическую линию регрессии на поле корреляции
По графику видно, что расчетные значения результативного признака почти совпадают с фактическими значениями. Линия регрессии проходит близко фактическим точкам.
Уравнение регрессии с высокой степенью точности описывает исходные данные.
4)
Коэффициент корреляции между признаками X и Y рассчитывается по формуле
rxy=bσxσy
где σ – среднеквадратичное отклонение: σy=y2-y2; σx=x2-x2
σy=1317,625-35,8752=5,533
σx=577,75-23,252=6,098
rxy=-0,887*6,0985,533=-0,977
Коэффициент корреляции меняется в пределах от -1 до +1 , чем ближе модуль коэффициента корреляции к 1, тем сильнее связь между признаками.
У нас получился rxy=-0,977
“минус” означает обратную связь (с увеличением X снижается Y)
и так как rxy=0,977 близок к 1 то делаем вывод что взаимосвязь цены на салат и количества продаваемых пучков салата очень сильная.
Коэффициент детерминации рассчитывается по формуле
R2=yi-y2yi-y2
Коэффициент детерминации показывает, какая доля вариации результативного признака объясняется найденным уравнением регрессии с включенным в него факторным признаком
R2=233,829244,875=0,9549
Следовательно 95,49% вариации количества продаваемого салата (Y) объясняется построенным уравнением регрессии