Проанализируйте представленные в таблице 3 данные при помощи коэффициентов Пирсона и Чупрова.
Таблица 3 – Информация об анализируемых предприятиях
Среднесписочная численность персонала, чел. Выручка, млн. руб.
до 50 50 – 100 100 – 250 250 – 500 500 и более
100 – 220 15 3 - - -
220 – 340 4 20 - 2 -
340 – 460 - 5 35 7 -
460 – 580 - 1 5 15 8
580 – 700 - - 2 - 10
Перегруппируйте данные для расчета коэффициентов ассоциации и контингенции и рассчитайте их. О чем свидетельствуют полученные значения всех четырех коэффициентов?
Решение
Коэффициент сопряженности Пирсона рассчитывается по формуле:
P=φ21+φ2.
Коэффициент взаимной сопряженности Чупрова позволяет учесть число групп по каждому признаку и определяется следующим образом:
C=φ2(K1-1)(K2-1).
Здесь φ2 – показатель взаимной сопряженности, φ определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки. Вычитая из этой суммы 1, получим величину φ2:
φ2=nxy2nxny-1,
откуда
1+φ2=nxy2nxny=nxy2nynx,
Показатели K1 – число значений первого признака, K2 – число значений второго признака.
Таблица 4 – Информация об анализируемых предприятиях
Среднесписочная численность персонала, чел. Выручка, млн. руб. Итого
до 50 50 – 100 100 – 250 250 – 500 500 и более
100 – 220 15 3 - - - 18
220 – 340 4 20 - 2 - 26
340 – 460 - 5 35 7 - 47
460 – 580 - 1 5 15 8 29
580 – 700 - - 2 - 10 12
Итого 19 29 42 24 18 132
Проведем расчеты показателей:
1+φ2=15219+322918+4219+20229+222426+5229+35242+722447+1229+5242+15224+821829+2242+1021812≈2,8653
Откуда φ2=1,8653.
Получаем:
P=1,86532,8653≈0,8068, C=1,86535-15-1≈0,3414.
Коэффициент Чупрова всегда меньше коэффициента Пирсона
. Он дает обычно более осторожную оценку связи.
Оба рассчитанных коэффициента заметно отличаются от нуля, следовательно, между выручкой и среднесписочной численностью персонала существует сильная связь.
По таблице «четырех полей» (табл. 5) определяются коэффициенты ассоциации и контингенции.
Таблица 5 – Таблица «четырех полей»
Признак 1 Признак 2
есть нет
есть 𝑎 𝑏
Нет 𝑐 𝑑
Коэффициент ассоциации определяется по формуле:
KA=ad-bcad+bc
В тех случаях, когда хотя бы один из четырех показателей в таблице «четырех полей» отсутствует, величина коэффициента ассоциации будет равна единице, что дает преувеличенную оценку степени тесноты связи между признаками, и предпочтение следует отдать коэффициенту контингенции:
KK=ad+bca+bb+da+cc+d
Исключая строки и столбцы, рассмотрим таблицы «четырех полей».
Таблица 6 – Первая таблица «четырех полей»
Среднесписочная численность персонала, чел