Постройте графики рассеивания результативного признака и фактора.
Рассчитайте коэффициент парной корреляции для каждого независимого фактора, используя встроенную функцию КОРРЕЛ.
Постройте матрицу коэффициентов парных корреляций, проанализировать тесноту и направление связи между переменными, используя пакет анализа.
Определите значимость коэффициента корреляции, используя встроенную функцию СТЬЮДЕНТ.ТЕСТ.
Найдите линейное уравнение парной регрессии для фактора, наиболее тесно связанного с результативным признаком, воспользовавшись встроенными функциями ОТРЕЗОК и НАКЛОН для определения коэффициентов корреляции.
Представьте графически фактические данные, модель и точки прогноза для выбранных самостоятельно значений.
Проверить, насколько изменится модель при использовании нелинейной функции (любой на выбор).
Сделайте выводы
Решение
1. Для зависимой переменной (цены квартиры) и каждого фактора построим диаграмму рассеяния:
Цены на квартиры в Мурманске в среднем выше, чем в Апатитах. Связь обратная.
С ростом числа комнат цена квартиры увеличивается, связь прямая, заметная.
С ростом общей площади цена квартиры увеличивается, связь прямая, тесная.
С ростом жилой площади цена квартиры увеличивается, связь прямая, тесная.
Зависимость цены квартиры от этажа, вероятно, отсутствует.
С ростом площади кухни цена квартиры чаще увеличивается, связь прямая, слабая.
2. Рассчитаем коэффициент парной корреляции для каждого независимого фактора, используя встроенную функцию КОРРЕЛ:
Цена квартиры, тыс. руб. Город области (0-Мурманск, 1- Апатиты) Число комнат в квартире Общая площадь квартиры, кв. м Жилая площадь квартиры, кв. м Этаж квартиры Площадь кухни, кв. м
Y X1 X2 X3 X4 X5 X6
Коэффициент корреляции R(Y,Xi) -0,61 0,72 0,86 0,87 0,02 0,23
Направление связи Обратная Прямая Прямая Прямая Прямая Прямая
Теснота связи Заметная Тесная Тесная Тесная Слабая (практически отсутствует) Слабая
3
. Построим матрицу коэффициентов парных корреляций, используя надстройку «Анализ данных», инструмент «Корреляция»:
Y X1 X2 X3 X4 X5 X6
Y 1,00
X1 -0,61 1,00
X2 0,72 -0,42 1,00
X3 0,86 -0,30 0,76 1,00
X4 0,87 -0,39 0,92 0,90 1,00
X5 0,02 -0,11 0,00 0,18 -0,02 1,00
X6 0,23 0,06 -0,12 0,46 0,14 0,48 1,00
Связь зависимой переменной Y (цена квартиры) с фактором Х1 (город области) обратная, заметная; с Х2 (число комнат), Х3 (общая площадь), Х4 (жилая площадь) – прямая, тесная; с факторам Х5 (этаж), Х6 (площадь кухни) –прямая, слабая.
Судя по матрице парных коэффициентов корреляции, также присутствует тесная прямая связь между факторами Х2 и Х3; Х2 и Х4; Х3 и Х4.
4. Определим значимость коэффициентов корреляции между зависимой переменной и факторам на основе критерия Стьюдента. Для каждого коэффициента корреляции вычислим расчетное значение критерия:
t=rn-21-r2 (n=20, число единиц наблюдения).
Y X1 X2 X3 X4 X5 X6
Коэффициент корреляции R(Y,Xi) -0,61 0,72 0,86 0,87 0,02 0,23
tрасчет
-3,23 4,37 7,28 7,33 0,08 1,01
Сравним расчетное значение для каждого коэффициента корреляции с критическим