По тринадцати супермаркетам исследуется зависимость квартального торгового оборота от размера торговых площадей, района расположения (центральный или периферийные) и формы собственности (муниципальный или частный). Имеются следующие данные:
№ магазина Торговый оборот (млн. руб.) Торговые площади (м2) Район расположения Форма собственности
1 59 2500 периферийный муниципальный
2 85 2172 периферийный частный
3 127 2928 центральный муниципальный
4 178 3943 центральный муниципальный
5 156 2819 центральный частный
6 122 4902 периферийный муниципальный
7 89 4236 центральный муниципальный
8 159 5486 периферийный муниципальный
9 256 7186 центральный частный
10 156 4501 центральный частный
11 149 3495 центральный муниципальный
12 122 4562 периферийный частный
13 178 2706 центральный частный
1. Проанализируйте тесноту и направление связи между переменными, отберите факторы для регрессионного анализа.
2. Постройте линейную регрессионную модель торгового оборота магазина, не содержащую коллинеарных факторов. Оцените параметры модели.
3. Определите, существенна ли разница в торговом обороте магазинов:
а) расположенных в центральном и периферийных районах города;
б) частных и муниципальных.
4. Соответствуют ли остатки регрессии нормальному закону распределения?
5. Выполняется ли условие гомоскедастичности?
6. Спрогнозируйте значение торгового оборота муниципального магазина с торговой площадью 4000 м2 , расположенного в центральном районе города.
Решение
Проанализируйте тесноту и направление связи между переменными, отберите факторы для регрессионного анализа.
Чтобы оценить тесноту связи между значениями этих переменных, вычислим значение коэффициента корреляции средствами Excel. Для этого можно воспользоваться функцией =КОРРЕЛ( ), указав адреса пяти столбцов чисел. Ответ помещен в В56 G62.
Вычислим матрицу коэффициентов парной корреляции, проверим значимость коэффициентов корреляции:
Для построения корреляционного анализа воспользуемся пакетом прикладных программ Microsoft Excel, функцией «Анализ данных».
Выполняем следующие действия:
Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
Выбрать команду «Сервис» → «Анализ данных».
В диалоговом окне «Анализ данных» выбрать инструмент «Корреляция», а затем щелкнуть кнопку «ОК».
В диалоговом окне «Корреляция» в поле «Входной интервал» необходимо ввести диапазон ячеек, содержащих исходные данные. Если введены и заголовки столбцов, то установить флажок «Метки в первой строке».
Выбрать параметры вывода. В данном случае «Новый рабочий лист».
«ОК»
Результаты корреляционного анализа
Рис.5
Анализ матрицы коэффициентов парной корреляции начнем с анализа первого столбца матрицы, в котором расположены коэффициенты корреляции, отражающие тесноту связи, зависимой переменной торговый оборот с включенными в анализ факторами. Анализ показывает, что зависимая переменная, то есть торговый оборот, имеет тесную и прямую связь с торговыми площадями (ryx1 = 0,623) и с районом расположения (ryx2= 0,521), слабую и обратную связь с формами собственности (ryx3 = – 0,338). Факторы Х3 имеет слабую связь с зависимой переменной и его не рекомендуется включать в модель регрессии.
Затем перейдем к анализу остальных столбцов матрицы с целью выявления коллинеарности. Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т. е., решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда.
Под мультиколлинеарностью понимается высокая взаимная коррелированность объясняющих переменных, которая приводит к линейной зависимости нормальных уравнений. Один из подходов определения наличия или отсутствия мультиколлинеарности заключается в анализе матрицы коэффициентов парной корреляции. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,8.
Так как парные коэффициенты корреляции меньше 0,8, следовательно, факторы входящие в модель не обладают коллинеарностью
.
Таким образом, на основе анализа корреляционной матрицы для включения в модель регрессии остаются три фактора – размер торговых площадей, района расположения (центральный или периферийные) и форма собственности (муниципальный или частный) (n = 13, k =3).
2. Постройте линейную регрессионную модель торгового оборота магазина, не содержащую коллинеарных факторов. Оцените параметры модели.
Строим модель на все факторы. В качестве программного средства реализации анализа воспользуемся пакетом прикладных программ Microsoft Excel, функцией «Анализ данных», инструмент «Регрессия». Применение инструмента «Регрессия»
(Анализ данных EXCEL)
Для проведения регрессионного анализа необходимо выполнить следующие действия:
Выбрать команду «Сервис»→ «Анализ данных».
В диалоговом окне «Анализ данных» выбрать инструмент «Регрессия», а затем щёлкнуть по кнопке ОК.
В диалоговом окне «Регрессия» в поле «Входной интервал » ввести адрес одного диапазона ячеек, который представляет зависимую переменную. В поле «Входной интервал Х» ввести адреса одного или нескольких диапазонов, которые содержат значения независимых переменных.
Если введены и заголовки столбцов, то следует установить флажок «Метки в первой строке».
Выбрать параметры вывода. В данном случае «Новая рабочая книга».
ОК.
Результаты представлены в таблице 1.
Таблица 1
Множественный коэффициент корреляции R, равный 0,851, свидетельствует о весьма тесной связи между признаками.
Множественный коэффициент детерминации , показывает, что около 72,4% вариации зависимой переменной (торговый оборот) учтено в модели и обусловлено влиянием включенных факторов (торговых площадей, района расположения и формы собственности) и на 27,6% — другими факторами, не включенными в модель.
3. Определим, существенна ли разница в торговом обороте магазинов:
а) расположенных в центральном и периферийных районах города;
Разница в торговом обороте магазинов будет существенна, если значим коэффициент регрессии при переменной х2: район расположения (центральный или периферийные). Значимость оценим с помощью критерия Стьюдента.
Расчетные значения критерия Стьюдента равны: . Табличное значение критерия при уровне значимости и числе степеней свободы равно 2,26. Расчетное значение критерия Стьюдента превышает табличное значение. Таким образом, коэффициент при х2 – район расположения (центральный или периферийные) значим, следовательно разница в торговом обороте магазинов будет существенна.
б) частных и муниципальных