Имеются данные по предприятиям, занимающимся обработкой древесины и производством изделий из дерева:
Номер предприятия Часовая производительность агрегатов, м3 Себестоимость 1 м3 фанеры клееной, тыс.руб.
1 1504 6,5
2 779 7
3 1300 5,2
4 1810 5,5
5 1329 6,1
6 1900 4,7
7 780 6,9
8 990 6,4
9 1500 6,7
10 1510 5,4
11 1720 4,8
12 1150 5,1
13 1410 5
14 1250 5,8
15 647 6,9
16 1240 5,3
17 1542 5,6
1 Сформировать задачу изучения взаимосвязи признаков, обосновать выбор признака – результата и признака – фактора.
2. Рассчитать средние значения и показатели вариации (среднеквадратическое отклонение и коэффициент вариации) по признаку – фактору и признаку – результату.
3. Построить поле корреляции.
10. Проанализировать зависимость фактора и результата методом парной регрессии и корреляции. Построить линейное уравнение регрессии. Пояснить интерпретацию параметров уравнения регрессии.
11. Оценить тесноту связи с помощью парного линейного коэффициента корреляции и коэффициента детерминации. Интерпретировать их значения.
Решение
Признаком – фактором является часовая производительность, а признаком – результатом себестоимость. С изменением часовой производительность меняется и себестоимость.
Средняя часовая производительность агрегатов рассчитывается по формуле средней арифметической простой:
x=xn=1504+779+…+1240+154217=2236117=1315.4 м3
Средняя часовая производительность агрегатов составила 1315,4 м3.
Средняя себестоимость 1 м3 фанеры клееной рассчитывается по формуле средней арифметической простой:
y=yn=6.5+7+…+5.3+5.617=98,917=5,8 тыс.руб.
Средняя себестоимость 1 м3 фанеры клееной составила 5,8 тыс.руб.
Среднеквадратическое отклонение:
σx=(x-x)2n=(1504-1315.4)2+(779-1315.4)2+(1300-1315.4)2+17
(1810-1315.4)2+(1329-1315.4)2+(1900-1315.4)2+(780-1315.4)217
(990-1315.4)2+(1500-1315.4)2+(1510-1315.4)2+(1720-1315.4)217
(1150-1315.4)2+(1410-1315.4)2+(1250-1315.4)2+(647-1315.4)217
(1240-1315.4)2+(1542-1315.4)217=208266417=350 м3
Значения часовой производительности агрегатов отклоняется от среднего на 350 м3.
σy=(y-y)2n=(6.5-5.8)2+(7-5.8)2+(5.2-5.8)2+(5.5-5.8)2+(6.1-5.8)217
+(4.7-5.8)2+(6.9-5.8)2(6.4-5.8)2+(6.7-5.8)2+(5.4-5.8)2+(4.8-5.8)2+17
(5.1-5.8)2+(5-5.8)2+(5.8-5.8)2+(6.9-5.8)2+(5.3-5.8)2+(5.6-5.8)217
9.8517=0.8 тыс.руб.
Значения себестоимости 1 м3 фанеры клееной отклоняется от среднего на 0,8 тыс.руб.
Коэффициент вариации:
Vx=σxx∙100=3501315.4∙100%=26.6%
Коэффициент вариации меньше 33%, совокупность однородная.
Vy=σyy∙100=0.85.8∙100%=13.8%
Коэффициент вариации меньше 33%, совокупность однородная.
По полю корреляции видим, что с ростом производительности агрегатов себестоимость 1 м3 фанеры снижается
. Что говорит о наличии обратной связи.
Уравнение регрессии
Уравнение прямой имеет следующий вид:
ух=а0+а1∙x
Для того, чтобы найти а0 и а1 воспользуемся методом наименьших квадратов и построим систему уравнений
na0+a1x=ухa0+a1(x2)=xу
Номер предпри-ятия
Часовая производительность агрегатов, м3
X Себестоимость 1 м3 фанеры клееной, тыс.руб.
Y X2 Y2 xy
ух
1 1504 6,5 2262016 42,25 9776 5,538
2 779 7 606841 49 5453 6,614
3 1300 5,2 1690000 27,04 6760 5,841
4 1810 5,5 3276100 30,25 9955 5,083
5 1329 6,1 1766241 37,21 8106,9 5,797
6 1900 4,7 3610000 22,09 8930 4,950
7 780 6,9 608400 47,61 5382 6,613
8 990 6,4 980100 40,96 6336 6,301
9 1500 6,7 2250000 44,89 10050 5,544
10 1510 5,4 2280100 29,16 8154 5,529
11 1720 4,8 2958400 23,04 8256 5,217
12 1150 5,1 1322500 26,01 5865 6,063
13 1410 5 1988100 25 7050 5,677
14 1250 5,8 1562500 33,64 7250 5,915
15 647 6,9 418609 47,61 4464,3 6,810
16 1240 5,3 1537600 28,09 6572 5,930
17 1542 5,6 2377764 31,36 8635,2 5,481
итого 22361 98,9 31495271 585,21 126995,4 98,90
17a0+22361a1=98.922361а0+31495271а1=126995.4
Для расчета а0 воспользуемся формулой
а0=у-а1хn
Для расчета а1 подставим а0 во 2 уравнение
2236198.9-22361а117+31495271а1=126995.4
а1=-0,001485
а0=98,9-22361*(-0,001485)17=7,771
ух=7,771-0,001485∙х
С увеличением часовой производительности агрегата на 1 м3 себестоимость 1 м3 фанеры клееной снижается на 0,001485 тыс.руб.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значенияyx.
Так как y=yx=98,9, следовательно, параметры уравнения определены правильно.
Для определения наличия и характера корреляционной связи между признаками часовой производительностью агрегата и себестоимостью 1 м3 фанеры клееной рассчитаем линейный коэффициент корреляции.
rxy=nxy-xynx2-(x)2×ny2-(y)2
rxy=17*126995,4-22361*98,917*31495271-223612×17*585,2-98,92=2158922-221150335405286*167,4=-5258176976,8=-0,68
Между часовой производительностью агрегата и себестоимостью 1 м3 фанеры клееной существует обратная заметная связь.
Коэффициент детерминации:
R2=(rxy)2=(-0.68)2=0.467
Т.е