Логотип Автор24реферат
Задать вопрос
%
уникальность
не проверялась
Контрольная работа на тему:

Линейная корреляция и регрессия

уникальность
не проверялась
Аа
7373 символов
Категория
Высшая математика
Контрольная работа
Линейная корреляция и регрессия .pdf

Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥

Условие

Для приведенных исходных данных постройте диаграмму рассеяния и определите по ней характер зависимости. Рассчитайте выборочный коэффициент корреляции Пирсона, проверьте его значимость при α = 0.05. Запишите уравнение регрессии и дайте интерпретацию полученных результатов. Врач-исследователь выясняет зависимость площади пораженной части легких (X, %) у людей, заболевших эмфиземой легких, от числа лет курения (Y, лет). Исследуйте зависимость по выборочным данным. X 5 6 5 3 7 7 7 5 3 3 Y 25 36 22 15 48 39 42 31 28 33

Нужно полное решение этой работы?

Решение

Потяни, чтобы посмотреть
I
xi
yi
1 5 25
2 6 36
3 5 22
4 3 15
5 7 48
6 7 39
7 7 42
8 5 31
9 3 28
10 3 33
Σ
51 319
Построим диаграмму рассеяния в excel (поле корреляции):
На основании визуального исследования выдвинем гипотезу о линейной зависимости Y от X:
Y=α+βX+ε.
Измерить тесноту корреляционной зависимости – значит, определить, в какой мере вариация результативного показателя вызвана вариацией факторного признака. Эта задача может быть решена путем исчисления теоретического корреляционного отношения η:
η=δσy=δ2σy2,
где δ2=yx-y2n – дисперсия в ряду выравненных значений результативного показателя yx; σy2=y-y2n – дисперсия в ряду фактических значений y.
Так как дисперсия δ2 отражает вариацию в ряду yx только за счет вариации фактора x, а дисперсия σy2 отражает вариацию y за счет всех факторов, то их отношение, именуемое теоретическим коэффициентом детерминации, показывает, какой удельный вес в общей дисперсии ряда y занимает дисперсия, вызываемая вариацией фактора x. Квадратный корень из отношения этих дисперсий дает нам теоретическое корреляционное отношение η=δ2σy2.
Дисперсию теоретических значений результативного показателя (т.е. δ2) часто называют факторной, поскольку она отражает влияние вариации фактора x на вариацию y, и обозначают как δф2 и так называемой остаточной дисперсии σост2, отражающей вариацию результативного показателя за счет всех остальных факторов (кроме x), не учтенных в уравнении регрессии, т.е.
σy2=δф2+σост2.
Получим еще одну формулу для вычисления корреляционного отношения:
η=σy2-σост2σy2=1-σост2σy2.
В данном виде корреляционное отношение при криволинейной зависимости обычно называют индексом корреляции.
Остаточная дисперсия рассчитывается по формуле:
σост2=yi-yx2n.
Отсюда следует формула для линейного коэффициента корреляции:
r=a1σxσy,
или:
r=(x-x)(y-y)x-x2y-y2,
а также:
r=xy-xynx2-x2ny2-y2n.
Для измерения тесноты зависимости между y и x воспользуемся прежде всего линейным коэффициентом корреляции (поскольку рассматриваемая зависимость – линейная):
r=(x-x)(y-y)n∙σxσy.
Находим
x=5110=5,1; y=31910=31,9.
Составим расчетную таблицу.
i
x-x
y-y
(x-x)(y-y)
(x-x)2
(y-y)2
1 -0,10 -6,90 0,69 0,01 47,61
2 0,90 4,10 3,69 0,81 16,81
3 -0,10 -9,90 0,99 0,01 98,01
4 -2,10 -16,90 35,49 4,41 285,61
5 1,90 16,10 30,59 3,61 259,21
6 1,90 7,10 13,49 3,61 50,41
7 1,90 10,10 19,19 3,61 102,01
8 -0,10 -0,90 0,09 0,01 0,81
9 -2,10 -3,90 8,19 4,41 15,21
10 -2,10 1,10 -2,31 4,41 1,21
Σ
0,00 0,00 110,10 24,90 876,90
Находим σx и σy:
σx=(x-x)2n, σx=24,9010≈1,578;
σy=(y-y)2n, σy=876,9010≈9,364.
Ковариация (x,y) равна:
Kxy=1nxy-xy,Kxy=110∙1737-5,1∙31,9,Kxy≈11,01.
Отсюда следует, что
r=110,1010∙1,578∙9,364≈0,745.
Значение линейного коэффициента корреляции r=0,745 характеризует не только меру тесноты зависимости вариации y от вариации x (достаточно средняя зависимость), но и степень близости этой зависимости к линейной.
В нашем примере связь между Y и X средняя и прямая (по шкале Чеддока).
Параметры для уравнения связи определяют из системы нормальных уравнений, отвечающих требованию метода наименьших квадратов (МНК) . Это требование можно записать как y-yx2→min или y-α-βx2→min. Необходимо определить, при каких значениях параметров α и β сумма квадратов отклонений y от yx будет минимальной. Найдя частные производные указанной суммы по α и β и приравняв их нулю, легко записать систему уравнений, решение которой и дает параметры искомой функции, т.е. уравнения регрессии.
Так, система нормальных уравнений при линейной зависимости имеет вид
nα+βx=y,αx+βx2=xy.
Необходимые для решения данной системы показатели n, x, y, x2, xy
Определяются по наблюдаемым эмпирическим данным
50% задачи недоступно для прочтения
Переходи в Кампус, регистрируйся и получай полное решение
Получить задачу

Магазин работ

Посмотреть все
Посмотреть все
Больше контрольных работ по высшей математике:
Все Контрольные работы по высшей математике
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач