Имеются данные по предприятиям одной из отраслей промышленности за год
.pdf
Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥
Имеются данные по предприятиям одной из отраслей промышленности за год:
Таблица 10
№ предприятия Выпуск продукции, млн. руб. Потери рабочего времени,
тыс. чел.-дн. Численность работающих, чел.
1 57 79,8 260
2 67 57 380
3 81 38 680
4 92 23,1 800
5 48 112 210
6 59 72 230
7 68 55,7 400
8 83 36 710
9 52 85,2 340
10 62 72,8 290
Необходимо построить уравнения парной линейной регрессии, описывающие зависимость:
выпуска продукции от величины потерь рабочего времени;
выпуска продукции от численности работающих.
Проанализировать характер зависимости.
Нужно полное решение этой работы?
Решение
А) Построим уравнение парной линейной регрессии, описывающее зависимость выпуска продукции от величины потерь рабочего времени. В данном случае, факторный признак X – потери рабочего времени (тыс. чел.-дн.), результативный признак Y – выпуск продукции (млн. руб.).
Линейное уравнение регрессии имеет вид y = bx + a
Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии.
Система нормальных уравнений.
a·n + b·∑x = ∑y
a·∑x + b·∑x2 = ∑y·x
Для расчета параметров регрессии построим расчетную таблицу
x y x2 y2 x • y
79.8 57 6368.04 3249 4548.6
57 67 3249 4489 3819
38 81 1444 6561 3078
23.1 92 533.61 8464 2125.2
112 48 12544 2304 5376
72 59 5184 3481 4248
55.7 68 3102.49 4624 3787.6
36 83 1296 6889 2988
85.2 52 7259.04 2704 4430.4
72.8 62 5299.84 3844 4513.6
631.6 669 46280.02 46609 38914.4
Для наших данных система уравнений имеет вид
10a + 631.6·b = 669
631.6·a + 46280.02·b = 38914.4
Домножим уравнение (1) системы на (-63.16), получим систему, которую решим методом алгебраического сложения.
-631.6a -39891.856 b = -42254.04
631.6*a + 46280.02*b = 38914.4
Получаем:
6388.164*b = -3339.64
Откуда b = -0.5228
Теперь найдем коэффициент «a» из уравнения (1):
10a + 631.6*b = 669
10a + 631.6*(-0.5228) = 669
10a = 999.191
a = 99.9191
Получаем эмпирические коэффициенты регрессии: b = -0.5228, a = 99.9191
Уравнение регрессии:
y = -0.5228 x + 99.9191
Выборочные средние:
EQ \x\to(x) = \f(∑xi;n) = \f(631.6;10) = 63.16
EQ \x\to(y) = \f(∑yi;n) = \f(669;10) = 66.9
EQ \x\to(xy) = \f(∑xiyi;n) = \f(38914.4;10) = 3891.44
Выборочные дисперсии:
EQ S2(x) = \f(∑x2i;n) - \x\to(x)2 = \f(46280.02;10) - 63.162 = EQ 638.82
EQ S2(y) = \f(∑y2i;n) - \x\to(y)2 = \f(46609;10) - 66.92 = EQ 185.29
Среднеквадратическое отклонение
EQ S(x) = \r(S2(x)) = \r(638.82) = 25.275
EQ S(y) = \r(S2(y)) = \r(185.29) = 13.612
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
Ковариация
.
EQ cov(x,y) = \x\to(x·y) - \x\to(x)·\x\to(y) = 3891.44 - 63.16·66.9 = -333.96
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
EQ rxy = \f(\x\to(x·y) -\x\to(x)·\x\to(y);S(x)·S(y)) = \f(3891.44 - 63.16·66.9;25.275·13.612) = -0.971
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y и фактором X весьма высокая и обратная.
Значимость коэффициента корреляции.
Выдвигаем гипотезы:
H0: rxy = 0, нет линейной взаимосвязи между переменными;
H1: rxy ≠ 0, есть линейная взаимосвязь между переменными;
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
EQ tнабл = rxy \f(\r(n-2);\r(1 - r2xy))
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области