Элементы корреляционного анализа
Сырье, поступающее на переработку из карьера, содержат два полезных компонента – минералы А и Б. При этом в партиях сырья с повышенным содержанием X минерала А обычно обнаруживается и более высокое содержание Y минерала Б, так что имеются основания ожидать, что эти величины находятся в связи друг с другом. Анализы 10 образцов сырья, поступившего в разное время, приведены в табл. Действительно ли с.в. X и Y находятся в статистически значимой корреляционной связи?
№ образца 1 2 3 4 5 6 7 8 9 10
X, % 67 54 72 64 39 22 58 43 46 34
Y, % 24 15 23 19 16 11 20 16 17 13
Ответ
На уровне значимости = 0,05 можно считать, что показатели содержания полезных компонентов минералов А и Б находятся в значимой корреляционной связи друг с другом.
Решение
Х Y Ранг X Ранг Y
67 24 9 10
54 15 6 3
72 23 10 9
64 19 8 7
39 16 3 4,5
22 11 1 1
58 20 7 8
43 16 4 4,5
46 17 5 6
34 13 2 2
Найдем выборочные коэффициенты ранговой корреляции Спирмена и Кендалла и проверим статистическую гипотезу о значимости каждого из них. Сравним полученные результаты. Уровень значимости = 0,05.
Выборочный коэффициент ранговой корреляции Спирмена RS определим по формуле
RS = 1 – ,
где di = xi – yi; n = 10 – объем выборки. Ранговые разности di запишем в таблицу
i
x(i)
y(i)
dx(i)
dy(i)
d(i)=dx(i)-dy(i)
d2(i)
1 67 24 9 10 -1 1
2 54 15 6 3 3 9
3 72 23 10 9 1 1
4 64 19 8 7 1 1
5 39 16 3 4,5 -1,5 2,25
6 22 11 1 1 0 0
7 58 20 7 8 -1 1
8 43 16 4 4,5 -0,5 0,25
9 46 17 5 6 -1 1
10 34 13 2 2 0 0
55 55 0 16,5
На основании данных вычислим Rs=1-6*16.5103-10 =0,899
Как и должно быть, –1 RS 1.
Для проверки значимости найденного значения Rs, выдвинем следующие статистические гипотезы:
Гипотеза H0: коэффициент корреляции Спирмена Rs = 0.
Гипотеза H1: коэффициент корреляции Спирмена Rs 0
.
Для того, чтобы при уровне значимости проверить нулевую гипотезу H0 о равенстве нулю генерального коэффициента ранговой корреляции Rs Спирмена при конкурирующей гипотезе H1 (Rs 0), надо вычислить критическую точку
Ткр=tα,k*1-p2n-2
где tкр(; k) – критическая точка двусторонней критической области, которую найдем по таблице критических точек распределения Стьюдента по уровню значимости и числу степеней свободы k = n – 2. В нашем случае tкр(0,05; 8) = 2,752 и Tкр 0,43. Так как эмпирическое значение коэффициента корреляции Спирмена превышает критическое: Rs > Tкр, то нулевую гипотезу отвергаем и принимаем конкурирующую: между признаками X и Y существует значимая ранговая корреляционная связь.
Выборочный коэффициент ранговой корреляции Кендалла RK определим по формуле
RK=4Rn2-n-1
где R = R1 + R2 + ... + Rn–1 – сумма рангов. Для подсчета суммы рангов R упорядочим эмпирическую таблицу так, чтобы один из признаков, например, Х, был упорядочен, например, в порядке возрастания
Ранговые разности для подсчета коэффициента ранговой корреляции RK Кендалла.
№ xi yi Ri Значения yi+1 > xi, i = 1, 2, …, n–1
6 1 1 9 2;4,5; 4,5; 6,3,8,7,10,9
10 2 2 8 4,5; 4,5; 6,3,8,7,10,9
5 3 4,5 6 4,5; 6,8,7,10,9
8 4 4,5 5 6,8,7,10,9
9 5 6 4 8,7,10,9
2 6 3 4 8,7,10,9
7 7 8 2 10,9
4 8 7 2 10,9
1 9 10 0 -
3 10 9 - -
40
Ранг R1 определяется количеством рангов yi, превышающих ранг x1 = 1