Распределение 50 городов по численности населения ξ (тыс. чел.) и среднемесячному доходу на одного человека η (тыс. руб.) представлено в таблице::
η
ξ 3–4 4–5 5–6 6–7 7–8 более 8 Итого
30–50 1 1 3
5
50–70
2 5 1
8
70–90
1 1 6 2 2 12
90–110
4 9
13
110–130
2 2 5
9
более 130
2 1 3
Итого 1 4 15 18 9 3 n=50
Необходимо:
вычислить групповые средние и , построить эмпирические линии регрессии;
предполагая, что между переменными ξ и η существует линейная корреляционная зависимость:
найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать содержательную интерпретацию полученных уравнений;
вычислить коэффициент корреляции, на уровне значимости оценить его значимость и сделать вывод о тесноте и направлении связи между переменными ξ и η;
используя соответствующее уравнение регрессии, оценить средний доход на одного человека в городе с населением 100 тыс. человек.
Решение
1) Полученные в ходе обследования эмпирические данные представляют собой двумерную выборку, объем которой равен 50. По каждой переменной они представляют собой интервальный вариационный ряд. Для упрощения дальнейшей обработки заменим интервальные вариационные ряды их дискретными аналогами. Для этого каждый интервал разбиения, как по переменной , так и по переменной , будем характеризовать их срединным значением, для этого вычислим середины каждого интервала. Обозначим варианты переменной ξ через , а варианты переменной η через . Получим:
Таблица 2.1
уj
хi 3,5 4,5 5,5 6,5 7,5 8,5 mх
40 1 1 3 5
60 2 5 1 8
80 1 1 6 2 2 12
100 4 9 13
120 2 2 5 9
140 2 1 3
mу 1 4 15 18 9 3 50
Эмпирическая линия регрессии по η строится по точкам , эмпирическая линия регрессии η по строится по точкам , где – групповые средние, которые вычисляются по формулам:
, .
Найдем групповые средние :
; и т.д.
Зависимость между значениями признака η и групповыми средними называется корреляционной зависимостью на η. Ее можно записать с помощью таблицы:
хi 40 60 80 100 120 140
4,90 5,38 6,75 6,19 6,83 7,83
mx 5 8 12 13 9 3
С помощью аналогичных вычислений находим .
; и т.д.
Корреляционная зависимость η на приведена в таблице:
уj 3,5 4,5 5,5 6,5 7,5 8,5
40 60,0 76 93,3 115,6 100
mу 1 4 15 18 9 3
В прямоугольной системе координат строим все точки, которые отвечают парам чисел
. Соседние точки соединяем отрезками прямых. Полученная линия называется эмпирической линией регрессии η на .
Аналогично строим эмпирическую линию регрессии на η.
Вид этих линий позволяет предположить наличие корреляционной зависимости.
2) а) Проведем все необходимые расчеты:
.
575,2;
14,968
0,023.
Уравнения регрессии на η имеет вид: .
Уравнение регрессии η на имеет вид:
В обозначениях данной задачи переменная η – среднемесячный доход на одного человека (тыс.руб.) – это варианты уj , а переменная ξ – численность населения (тыс. чел.) – это варианты хi. Поэтому зависимость η от ξ дохода от численности населения в этом городе запишем в виде:
Коэффициент регрессии 0,023 показывает, что при увеличении численности населения на 1 тыс. чел., среднемесячный доход на одного человека растет в среднем на 0,023 тыс. руб.
Уравнение обратной зависимости имеет вид:
.
Оно показывает, на сколько единиц в среднем нужно изменить переменную для того, чтобы увеличить переменную η на 1 единицу