По корреляционной таблице требуется:
1. В прямоугольной системе координат построить эмпирические ломаные регрессии Y на X и X на Y, сделать предположение о виде корреляционной связи.
2. Оценить тесноту линейной корреляционной связи.
3. Составить линейные уравнения регрессии Y на X и X на Y, построить их графики.
В таблице дано распределение 100 предприятий, производящих однородную продукцию, по объему производства X (млн руб.) и себестоимости единицы продукции Y (тыс. руб.).
Y X
0,4-1,4 1,4-2,4 2,4-3,4 3,4-4,4 4,4-5,4
4-6
2 6 8
6-8
4 7 4 15
8-10 1 1 7 5
14
10-12 2 4 1
7
12-14 3 3
6
6 8 12 14 10 n=100
Для расчетов представим корреляционную таблицу в следующем виде:
Y X
0,9 1,9 2,9 3,9 4,9
5
2 6 8
7
4 7 4 15
9 1 1 7 5
14
11 2 4 1
7
13 3 3
6
6 8 12 14 10 n=100
Нужно полное решение этой работы?
Решение
Для построения эмпирических ломаных регрессии вычислим условные средние и Вычисляем . Так как при х=0,9 признак Y имеет распределение
Y 9 11 13
ni 1 2 3
то условное среднее .
При х=1,9 признак Y имеет распределение
Y 9 11 13
ni 1 4 3
тогда .
Аналогично вычисляются все и. Получим таблицы, выражающие корреляционную зависимость Y от X (табл.1) и X от Y (табл.2).
Таблица 1
x 0,9 1,9 2,9 3,9 4,9
11,7 11,5 8,5 7,4 5,8
Таблица 2
y 5 7 9 11 13
4,65 3,9 3 1,9 1,4
В прямоугольной системе координат построим точки (хi,), соединив их отрезками, получим эмпирическую линию регрессии Y на X. Аналогично строятся точки (,yj) и эмпирическая линия регрессии X на Y (см. рис.).
Построенные эмпирические ломаные регрессии Y на X и X на Y свидетельствуют о том, что между объемом производства (X) и себестоимости единицы продукции (Y) существует линейная зависимость
. Из графика видно, что с увеличением X величинаубывает, поэтому можно выдвинуть гипотезу об обратной линейной корреляционной зависимости между объемом производства и себестоимости единицы продукции.
2. Оценим тесноту связи. Вычислим выборочный коэффициент корреляции.
Определим коэффициент корреляции:
EQ rxy = \f(Cov(x,y);σxσy)
Найдем необходимые числовые характеристики.
Выборочные средние:
EQ \x\to(x) =(0.9(1 + 2 + 3) + 1.9(1 + 4 + 3) + 2.9(4 + 7 + 1) + 3.9(2 + 7 + 5) + 4.9(6 + 4))/50 = 3.18
EQ \x\to(y) =(5(2 + 6) + 7(4 + 7 + 4) + 9(1 + 1 + 7 + 5) + 11(2 + 4 + 1) + 13(3 + 3))/50 = 8.52
Дисперсии:
σ2x = (0.92(1 + 2 + 3) + 1.92(1 + 4 + 3) + 2.92(4 + 7 + 1) + 3.92(2 + 7 + 5) + 4.92(6 + 4))/50 - 3.182 = 1.64
σ2y = (52(2 + 6) + 72(4 + 7 + 4) + 92(1 + 1 + 7 + 5) + 112(2 + 4 + 1) + 132(3 + 3))/50 - 8.522 = 6.01
Откуда получаем среднеквадратические отклонения:
σx = 1.281 и σy = 2.451
и ковариация:
Cov(x,y) = (3.9*5*2 + 4.9*5*6 + 2.9*7*4 + 3.9*7*7 + 4.9*7*4 + 0.9*9*1 + 1.9*9*1 + 2.9*9*7 + 3.9*9*5 + 0.9*11*2 + 1.9*11*4 + 2.9*11*1 + 0.9*13*3 + 1.9*13*3)/50 - 3.18*8.52 = -2.63
EQ rxy = \f(-2.63;1.281·2.451) = -0.8359
Это значение говорит о том, что линейная связь между объемом производства и себестоимости единицы продукции высокая