Установить направление и характер связи, применив метод приведения параллельных рядов;
2) определить тесноту связи с помощью коэффициентов знаков Фехнера;
3) вычислить ранговые коэффициенты корреляции Спирмена и Кендалла.
Определить:
а) уравнение парной линейной регрессии;
б) линейный коэффициент корреляции;
в) коэффициент эластичности.
Пояснить смысл коэффициентов регрессии и корреляции. Построить график зависимости. Сделать выводы.
Качество почвы, баллы Доза удобрений на 1 га посева зерновых, ц
70 2,0
79 4,1
91 3,8
94 3,9
72 2,1
81 4,0
96 4,1
45 1,8
60 1,7
99 3,0
50 2,3
57 2,1
76 2,9
90 3,0
55 1,8
59 1,5
68 2,1
83 3,2
65 2,2
71 3,0
Решение
1) Метод приведения параллельных рядов.
Выбираем факторный и результативный признаки.
Факторный признак Х – доза удобрений на 1 га посева зерновых (ц), результативный признак Y – качество почвы (баллы).
Метод основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Значения факторного признака располагают в возрастающем порядке и затем прослеживают направление изменения величины результативного признака (табл.1).
Таблица 1 – Исходные данные, ранжированные по возрастанию дозы удобрений
Доза удобрений на 1 га посева зерновых, ц, X Качество почвы, баллы, Y
1,5 59
1,7 60
1,8 45
1,8 55
2 70
2,1 72
2,1 57
2,1 68
2,2 65
2,3 50
2,9 76
3 99
3 90
3 71
3,2 83
3,8 91
3,9 94
4 81
4,1 79
4,1 96
Можно видеть, что в целом для всей совокупности почв увеличение дозы удобрений на 1 га посева зерновых приводит к увеличению качества почвы, хотя в отдельных случаях наличие такой зависимости может и не усматриваться. В данном случае возрастание величины факторного признака влечет за собой возрастание величины результативного признака, поэтому можно говорить о возможном наличии прямой корреляционной связи.
2) Определение коэффициента знаков Фехнера.
К простейшим показателям тесноты связи относят коэффициент корреляции знаков – коэффициент Фехнера. Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних.
Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязи пар признаков.
,
где Кф – коэффициент Фехнера; na – число совпадений знаков отклонений индивидуальных величин от средней; nb – число несовпадений знаков отклонений.
Коэффициент Фехнера может принимать различные значения в пределах от –1 до +1. Если коэффициент близок к +1, то можно предположить наличие прямой связи, если –1, то наличие обратной связи.
Средние значения факторного и результативного признака найдем с помощью функции СРЗНАЧ в Excel. Составим расчетную таблицу 2.
Таблица 2 – Расчетная таблица для определения коэффициента Фехнера
i xi
yi
xi-хср
yi-yср
na
nb
1 2 70 -0,730 -3,050 1
2 4,1 79 1,370 5,950 1
3 3,8 91 1,070 17,950 1
4 3,9 94 1,170 20,950 1
5 2,1 72 -0,630 -1,050 1
6 4 81 1,270 7,950 1
7 4,1 96 1,370 22,950 1
8 1,8 45 -0,930 -28,050 1
9 1,7 60 -1,030 -13,050 1
10 3 99 0,270 25,950 1
11 2,3 50 -0,430 -23,050 1
12 2,1 57 -0,630 -16,050 1
13 2,9 76 0,170 2,950 1
14 3 90 0,270 16,950 1
15 1,8 55 -0,930 -18,050 1
16 1,5 59 -1,230 -14,050 1
17 2,1 68 -0,630 -5,050 1
18 3,2 83 0,470 9,950 1
19 2,2 65 -0,530 -8,050 1
20 3 71 0,270 -2,050 1
Сумма 55 1 461 0 0 19 1
Средние 2,73 73,05
Вычисляем коэффициент Фехнера:
.
По величине коэффициента Фехнера можно сделать предположение о наличии прямой связи между признаками Х и Y.
3) Вычисление ранговых коэффициентов корреляции Спирмена и Кендалла.
Применим для оценки силы связи метод ранговой корреляции Спирмена.
Коэффициент корреляции рангов Спирмена рассчитывается по формуле
где d=Nx–Ny, т.е
. разность рангов каждой пары значений х и y, n – число наблюдений.
Для расчета коэффициента рангов Спирмена вначале ранжируем значения признаков в каждом ряду, т.е. каждому значению х и y в порядке их возрастания присваиваем порядковый номер (ранг) Nx и Ny , затем находим разность рангов (d), возводим их в квадрат и суммируем. Если какие-то значения признаков повторяются, то им присваивается ранг, рассчитанный как средняя арифметическая из суммы мест, которые они занимают по возрастанию. Результаты расчетов покажет в таблице 3.
Таблица 3 – Расчетная таблица для нахождения коэффициента корреляции Спирмена
i xi
Nx
yi
Ny
d=Nx-Ny
d2
1 2 5 59 5 0 0
2 4,1 19,5 60 6 13,5 182,25
3 3,8 16 45 1 15 225
4 3,9 17 55 3 14 196
5 2,1 7 70 9 -2 4
6 4 18 72 11 7 49
7 4,1 19,5 57 4 15,5 240,25
8 1,8 3,5 68 8 -4,5 20,25
9 1,7 2 65 7 -5 25
10 3 13 50 2 11 121
11 2,3 10 76 12 -2 4
12 2,1 7 99 20 -13 169
13 2,9 11 90 16 -5 25
14 3 13 71 10 3 9
15 1,8 3,5 83 15 -11,5 132,25
16 1,5 1 91 17 -16 256
17 2,1 7 94 18 -11 121
18 3,2 15 81 14 1 1
19 2,2 9 79 13 -4 16
20 3 13 96 19 -6 36
Сумма 54,6 210 1461 210 0 1832
Проверим правильность нахождения рангов на основе исчисления контрольной суммы:
.
Полученную сумму и n=20 подставляем в указанную формулу, получим
.
Связь между признаками Х и Y умеренная и обратная.
Определим значимость коэффициента ранговой корреляции Спирмена.
Сформулируем две гипотезы:
Н0: Корреляция между признаками Х и У не отличается от нуля.
Н1: Корреляция между признаками Х и У значимо отличается от нуля.
По таблице определяем критическое значение при n=20 и уровне значимости α=0,05:
.
Так как , то нулевая гипотеза принимается, следовательно, корреляция между признаками Х и У не отличается от нуля.
Значит, нельзя говорить о зависимости между дозой удобрений и качеством почвы.
Применим для оценки силы связи метод ранговой корреляции Кендалла.
Расчет рангового коэффициента Кендалла осуществляем по формуле:
,
где n – число наблюдений, S – сумма разностей между числом последовательностей и числом инверсий по второму признаку (S=P–Q).
Расчет данного коэффициента выполняем в следующей последовательности:
1) ранжируем значения Х в порядке возрастания;
2) значения Y располагаем в порядке, соответствующем значениям Х;
3) для каждого ранга Y определяем число следующих за ним значений рангов, превышающих его величину. Суммируя таким образом числа, определяем величину Р;
4) для каждого ранга Y определяем число следующих за ним значений рангов, меньших его величины. Суммируя таким образом числа, определяем величину Q;
5) определяем сумму S=P–Q баллов по всем членам ряда.
Результаты представим в таблице 4.
Таблица 4 – Расчетная таблица для нахождения коэффициента корреляции Кендалла
i xi
Nx
yi
Ny
Р
Q P–Q
1 1,5 1 59 5 15 4 11
2 1,7 2 60 6 14 4 10
3 1,8 3,5 45 1 17 0 17
4 1,8 3,5 55 3 15 1 14
5 2 5 70 9 11 4 7
6 2,1 7 72 11 9 5 4
7 2,1 7 57 4 12 1 11
8 2,1 7 68 8 10 2 8
9 2,2 9 65 7 10 1 9
10 2,3 10 50 2 10 0 10
11 2,9 11 76 12 8 1 7
12 3 13 99 20 0 8 -8
13 3 13 90 16 3 4 -1
14 3 13 71 10 6 0 6
15 3,2 15 83 15 3 2 1
16 3,8 16 91 17 2 2 0
17 3,9 17 94 18 1 2 -1
18 4 18 81 14 1 1 0
19 4,1 19,5 79 13 1 0 1
20 4,1 19,5 96 19 0 0 0
Σ 54,6 210 1461 210 148 42 106
Находим коэффициент ранговой корреляции Кендалла:
.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Кендалла при конкурирующей гипотезе Н1: τ ≠ 0,надо вычислить критическую точку:
EQ Tkp = zkp \r(\f(2(2n+5);9n(n-1)))
где n - объем выборки; zkp - критическая точка двусторонней критической области, которую находят по таблице функции Лапласа по равенству Ф(zkp)=(1 — α)/2