Оценить степень зависимости между переменными;
2. Найти уравнение линейной регрессии;
3. Интерпретировать полученную модель, сделать выводы.
Имеются следующие данные по промышленным заводам региона:
Основные производственные фонды, млн. руб. Среднесписочное число работников, чел. Основные производственные фонды, млн. руб. Среднесписочное число работников, чел. Основные производственные фонды, млн. руб. Среднесписочное число работников, чел.
13,3 280 56,6 990 18,0 430
21,1 480 63,0 930 22,0 510
28,0 503 31,0 560 10,0 340
38,0 710 28,0 610 16,0 390
55,0 1020 78,0 910 10,0 250
18,0 490 42,0 740 21,0 960
19,0 500 14,0 420 17,0 490
43,0 620 15,0 390 15,0 400
Решение
Построим график, отражающий связь заданных величин.
Пусть Х основные производственные фонды, млн. руб., Y среднесписочное число работников, чел.
Видим, что между себестоимостью и количеством работников существует очень связь, близкая к линейной, т.к. наблюдаемые значения вытягиваются примерно вдоль прямой линии. Причем связь прямая – чем больше один показатель, тем больше и другой.
Для установления тесноты связи найдем коэффициент корреляции, для этого составим расчетную таблицу:
і хі уі хi · уi хі2 уi 2
1 13,3 280 3724 176,89 78400
2 21,1 480 10128 445,21 230400
3 28,0 503 14084 784,00 253009
4 38,0 710 26980 1444,00 504100
5 55,0 1020 56100 3025,00 1040400
6 18,0 490 8820 324,00 240100
7 19,0 500 9500 361,00 250000
8 43,0 620 26660 1849,00 384400
9 56,6 990 56034 3203,56 980100
10 63,0 930 58590 3969,00 864900
11 31,0 560 17360 961,00 313600
12 28,0 610 17080 784,00 372100
13 78,0 910 70980 6084,00 828100
14 42,0 740 31080 1764,00 547600
15 14,0 420 5880 196,00 176400
16 15,0 390 5850 225,00 152100
17 18,0 430 7740 324,00 184900
18 22,0 510 11220 484,00 260100
19 10,0 340 3400 100,00 115600
20 16,0 390 6240 256,00 152100
21 10,0 250 2500 100,00 62500
22 21,0 960 20160 441,00 921600
23 17,0 490 8330 289,00 240100
24 15,0 400 6000 225,00 160000
Сумма 692 13923 484440 27814,66 9312609
Среднее 28,833 580,125
1158,94 388025,4
, где n = 24 - объем выборки
; ;
; ;
Тогда значение коэффициента корреляции равно:
= 0,8421 > 0,7.
Отсюда можно сделать вывод, что зависимость прямая и тесная, так как значение коэффициента корреляции достаточно близко к единице (больше, чем 0,7).
Таким образом, основные производственные фонды и среднесписочное число работников достаточно сильно влияют друг на друга.
Так как подтверждена тесная, близкая к линейной, зависимость, мы можем записать уравнение регрессии в виде по формуле:
.
3