С целью изучения зависимости количества времени использования клиентом мобильной связи в течение месяца ξ (мин) и стоимости минуты разговора η (руб.) произведено обследование 100 абонентов, пользующихся различными тарифными планами, и получены следующие данные:
η
ξ менее 1 1–1,5 1,5–2 2–2,5 2,5–3 более 3 Итого
менее 200
3 9 3 15
200–400
5 8 7 20
400–600
4 13 9 3 29
600–800
2 6 8 2
18
более 800 6 5 6 1
18
Итого 6 7 16 30 28 13 100
Необходимо:
вычислить групповые средние и , построить эмпирические линии регрессии;
предполагая, что между переменными ξ и η существует линейная корреляционная зависимость:
найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать экономическую интерпретацию полученных уравнений;
вычислить коэффициент корреляции Пирсона, на уровне значимости оценить его значимость и сделать вывод о тесноте и направлении связи между переменными ξ и η;
используя соответствующее уравнение регрессии, оценить время использования мобильной связи при стоимости минуты разговора 2,25 руб.
Решение
Преобразуем исходные данные и представим в виде корреляционной таблицы. Для этого вычислим середины каждого интервала. Обозначим варианты переменной ξ через , а варианты переменной η через . Получим:
Таблица 6.1
уj
хi 0,75 1,25 1,75 2,25 2,75 3,25 mx
100 3 9 3 15
300 5 8 7 20
500 4 13 9 3 29
700 2 6 8 2 18
900 6 5 6 1 18
my 6 7 16 30 28 13 n = 100
Эмпирическая линия регрессии η по строится по точкам , эмпирическая линия регрессии по η строится по точкам , где – групповые средние, которые вычисляются по формулам:
, .
Найдем групповые средние :
2,75; и т.д.
Зависимость между значениями признака и групповыми средними называется корреляционной зависимостью η на . Ее можно записать с помощью таблицы:
хi 100 300 500 700 900
2,75 2,80 2,44 2,03 1,31
mx 15 20 29 18 18
С помощью аналогичных вычислений находим .
Корреляционная зависимость на η приведена в таблице:
уj 0,75 1,25 1,75 2,25 2,75 3,25
900 842,9 725 493,3 328,6 300
mу 6 7 16 30 28 13
В прямоугольной системе координат строим все точки, которые отвечают парам чисел . Соседние точки соединяем отрезками прямых. Полученная линия называется эмпирической линией регрессии η на .
Аналогично строим эмпирическую линию регрессии на η.
Вид этих линий позволяет предположить наличие корреляционной зависимости
.
Значения хi и уj в таблице заданы с равноотстоящими вариантами с шагом h1 = 200 для и с шагом h2 = 0,5 для η, поэтому для упрощения расчетов можно перейти к условным вариантам u и v по формулам:
,
где С1 и С2 – это такие значения х и у, которые стоят приблизительно в середине вариационного ряда и имеют самую большую частоту. В данном случае выбираем С1 = 500, С2 = 2,25, тогда
Получаем новую корреляционную таблицу:
v
u -3 -2 -1 0 1 2 nu
-2 3 9 3 15
-1 5 8 7 20
0 4 13 9 3 29
1 2 6 8 2 18
2 6 5 6 1 18
nv 6 7 16 30 28 13 n = 100
Проведем все необходимые расчеты:
.
Коэффициент корреляции rв рассчитываем по формуле :
-0,7383.
Получаем: 0 < |rв| <1, то есть Х и Υ – зависимые случайные величины, причем чем ближе |rв| к единице, тем ближе зависимость между и η к линейной зависимости. Для оценки тесноты линейной связи используется шкала Чеддока:
Таблица 6.2
Шкала Чеддока
Оценка Характеристика линейной связи
очень слабая
слабая
умеренная
заметная
сильная (высокая)
весьма сильная
В данном случае > 0,7, теснота линейной связи между факторами и η высокая, а так как величина отрицательная, то связь обратная.
По формулам моментов перейдем к вариантам и η :
0,04 200 + 500 = 508
0,06 0,5 + 2,25= 2,28
1,3032 200 = 260,6454
1,3328 0,5 = 0,6664
Уравнение регрессии η на имеет вид: , или
Уравнение регрессии на η имеет вид: , или
.
В обозначениях данной задачи переменная ξ – количество времени использования клиентом мобильной связи в течение месяца (мин) – это варианты уj , а переменная η – стоимость минуты разговора (руб.) – это варианты хi