Статистические критерии. Доверительный интервал. Коэффициент корреляции.
Методические указания по выполнению Задания №6 приведены в документе «Методические указания для задания по статистике». Ниже по вариантам приведены значения xi,yi признаков X и Y , которые используются при выполнении работы. Решение заданий оформляется в приложении Libre Office Calc или аналогах: Open Office Calc и Microsoft Office Excel. Решение можно распечатать и приложить к остальным выполненным заданиям.
Решение
Построим диаграмму рассеивания
На основании поля корреляции выдвинем гипотезу о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y=bx+a
Коэффициенты регрессии a, b находим методом наименьших квадратов, решая систему линейных уравнений:
an+bxi=yiaxi+bxi2=xiyi
Строим расчетную таблицу
i
xi
yi
xi2
yi2
xiyi
1 62,1 -89,2 3856,41 7956,64 -5539,32
2 17,3 -40,6 299,29 1648,36 -702,38
3 36,8 -81,4 1354,24 6625,96 -2995,52
4 31,3 -50 979,69 2500 -1565
5 33,7 -56,3 1135,69 3169,69 -1897,31
6 36 -49,6 1296 2460,16 -1785,6
7 48,5 -65,2 2352,25 4251,04 -3162,2
8 16,3 -22,2 265,69 492,84 -361,86
9 22,3 -47,2 497,29 2227,84 -1052,56
10 32,2 -70,4 1036,84 4956,16 -2266,88
11 48 -87,9 2304 7726,41 -4219,2
12 27 -45,5 729 2070,25 -1228,5
13 36,1 -49,7 1303,21 2470,09 -1794,17
14 35,6 -65,8 1267,36 4329,64 -2342,48
15 39,7 -84,2 1576,09 7089,64 -3342,74
16 23,9 -53,5 571,21 2862,25 -1278,65
17 49,2 -83,7 2420,64 7005,69 -4118,04
18 22,4 -27,8 501,76 772,84 -622,72
19 23,4 -51,7 547,56 2672,89 -1209,78
20 35,7 -83,6 1274,49 6988,96 -2984,52
21 46 -101,2 2116 10241,44 -4655,2
22 52,4 -109,1 2745,76 11902,81 -5716,84
∑ 775,9 -1415,8 30430,47 102421,6 -54841,5
Решение данной системы имеет вид:
b=nxiyi-xi∙yinxi2-xi2=22∙-54841,5-775,9∙-1415,822∙30430,47-775,92=
=-1,60
a=yi-bxin=-1415,8-(-1,60)∙775,922=-7,89
Уравнение регрессии имеет вид:
y=-1,60x-7,89
Построим уравнение регрессии
Найдем выборочное среднее:
x=xin=775,922=35,268
y=yin=-1415,822=-64,355
x∙y=xiyin=-54841,4722=-2492,794
Выборочные дисперсии:
S2(x)=xi2n-x2=139,36
S2(y)=yi2n-y2=514,02
Среднеквадратическое отклонение равно
Sx=S2(x)=11,81
Sy=S2(y)=22,67
Найдем коэффициент корреляции
rxy=x∙y-x∙ySx∙Sy=-0,83
Так как 0,7<rxy<0,9, тогда связь между признаком Y и фактором X высокая и обратная (так как rxy<0).
Значимость коэффициент корреляции
Выдвигаем гипотезы
Н0: rxy=0 нет линейной взаимосвязи между переменными;
Н1: rxy≠0, есть линейной взаимосвязи между переменными;
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1, надо вычислить наблюдаемое значение критерия (величина случайной ошибки).
Поскольку выборка малая (n < 25), то критическая статистика для проверки значимости коэффициента линейной корреляции Пирсона имеет вид
tнабл=rxyn-21-rxy2=6,721
Находим из таблицы критическую границу
tстα;n-m-1=tст0.05;10-1-1=2,09
Поскольку tнабл>tст, то гипотеза H0 отклоняется и коэффициент корреляции можно считать существенно отличным от нуля.
Интервальную оценку для коэффициента корреляции (доверительный интервал) вычислим по формуле:
rxy-tст∙1-rxy2n-2;rxy+tст∙1-rxy2n-2
-0,834-2,09∙1-(-0,834)222-2;-0,8342+,09∙1-(-0,834)222-2
-1,09;-0,58