Можно ли на основе демографической информации предсказать объем продаж в магазинах спортивных товаров? В файле СПОРТТОВАРЫ.XLS содержится информация о покупателях в случайно выбранных магазинах, принадлежащих одной франчайзинговой сети. Следовательно, все магазины имеют одинаковый размер и торгуют одинаковыми товарами.
Проанализируйте распределение переменных, процентные доли, определите основные характеристики существующей числовой информации: среднее значение, вариацию и форму распределения… Выявите характер зависимости между переменными. Какие выводы и рекомендации отделу продаж можно сделать?
Дополните свой отчет диаграммами и другой статистической информацией.
Нужно полное решение этой работы?
Решение
Первоначально построим модель по всем имеющимся данным относительно покупок (рис. 1).
Анализируя значения t и p критериев для коэффициентов регрессии, определяем кандидатов на удаление (те переменные, у которых p-value больше 0,05): Возраст, Пол, Жилье, Брак и Ср_покупки. Исключение этих переменных лучше производить последовательно, поскольку не исключен случай, что при исключении одной из них другая станет значимой. В нашем примере тем не менее все пять переменные исключаются
. Результаты расчета после последовательного удаления несущественных переменных приведены на рис. 2.
Приведем интерпретацию полученных коэффициентов:
· коэффициент при переменной Пол показывает, что мужчины покупают в среднем на 100 долл. меньше, чем женщины;
· коэффициент при переменной Жилье показывает, что клиенты, снимающие жилье, тратят в среднем на 43 долл. меньше по сравнению с клиентами имеющих собственное жилье;
· коэффициент при переменной Брак показывает, что клиенты в браке тратя в среднем на 50 долларов больше чем не замужние и холостые;
· коэффициент при переменной Кол-во детей показывает, что с каждым дополнительным ребенком в семье в среднем объем покупок падает на 284 долл;
Для прогноза суммы покупок следующих покупателей построим график рассеянности и на ней определим полиномиальный тренд (рис