Известны статистические данные по 36 строительным бригадам.
Необходимо выяснить влияние различных факторов на величину накладных расходов в строительстве. Известно, что к накладным расходам относятся административно-хозяйственные, коммунальные расходы, дополнительная заработная плата и другие расходы. На качественном уровне выявлено, что фактический уровень накладных расходов оказался наиболее тесно связан со следующими факторами: объемом выполненных работ, численностью рабочих, занятых на строительно-монтажных работах, фондом заработной платы. Остальные факторы были признаны незначимыми.
На основании имеющихся данных необходимо при помощи использования функций Excel:
1. Рассчитать параметры множественной линейной регрессии, проводя процедуру стандартного регрессионного исследования до получения удовлетворительной модели. Провести полный анализ полученного уравнения регрессионной связи.
К числу рассчитываемых и анализируемых параметров относятся:
а) коэффициенты регрессии (и их значимость);
б) коэффициент корреляции (и его значимость);
в) коэффициент детерминации;
г) стандартные ошибки коэффициентов регрессии;
д) доверительные интервалы для коэффициентов регрессии;
е) величины общей, объясненной и остаточной дисперсии.
2. На основании реальных и расчетных значений накладных расходов построить графики и сравнить их.
Статистические данные по исследуемым показателям приведены в таблице
№ Накладные расходы Объем работ (куб. м.) Численность рабочих (чел.) Фонд заработной платы (руб.)
1 78577 209 6 29439
2 125276 360 12 37708
3 82316 254 6 31127
4 57019 143 3 20182
5 142175 429 11 51071
6 110711 293 9 40533
7 75206 210 5 33551
8 105191 271 9 39511
9 59945 154 6 19683
10 119512 333 8 47130
11 130445 384 10 44740
12 100705 280 7 36725
13 202788 535 14 83653
14 161855 462 11 72979
15 124467 340 9 49299
16 174655 489 14 51019
17 99959 267 7 44072
18 52327 140 3 18985
19 51249 148 4 21042
20 73767 207 5 33111
21 85209 235 6 31623
22 69009 188 5 22554
23 84874 236 8 35399
24 101894 299 7 40469
25 149551 386 10 45737
26 68195 207 7 29166
27 113206 357 9 48584
28 67999 197 6 23435
29 102432 310 7 45042
ЗО 88133 243 5 34987
31 88680 230 6 32566
32 71627 194 6 24580
33 95250 258 8 38907
34 67534 197 5 26341
35 69009 188 5 22554
36 84874 236 8 35399
Решение
1. Рассчитать параметры множественной линейной регрессии, проводя процедуру стандартного регрессионного исследования до получения удовлетворительной модели. Провести полный анализ полученного уравнения регрессионной связи.
На первом этапе включим в модель все факторы. В качестве программного средства реализации анализа воспользуемся пакетом прикладных программ Microsoft Excel, функцией «Анализ данных», инструмент «Регрессия». Применение инструмента «Регрессия»
(Анализ данных EXCEL)
Для проведения регрессионного анализа необходимо выполнить следующие действия:
Выбрать команду «Сервис»→ «Анализ данных».
В диалоговом окне «Анализ данных» выбрать инструмент «Регрессия», а затем щёлкнуть по кнопке ОК.
В диалоговом окне «Регрессия» в поле «Входной интервал » ввести адрес одного диапазона ячеек, который представляет зависимую переменную. В поле «Входной интервал Х» ввести адреса одного или нескольких диапазонов, которые содержат значения независимых переменных.
Если введены и заголовки столбцов, то следует установить флажок «Метки в первой строке».
Выбрать параметры вывода. В данном случае «Новая рабочая книга».
ОК.
Результаты представлены в таблице 1.
Таблица 1
Без проверки значимости коэффициентов а и bi уравнение регрессии было бы записано в следующем виде:
у = 544.278 + 262.413х1 + 1664.053х2 + 0.359х3.
Однако необходимо проверить, все ли из включенных в уравнение параметров действительно оказывают влияние на у.
Для коэффициента b1 вероятность его не влияния на у равна 0,00 (0%), что меньше порогового значения в 5%, поэтому коэффициент b1 признается значимым и оставляется в модели.
Для коэффициента а вероятность его не влияния на у равна 0,85 (85%), что больше порогового значения в 5%, поэтому коэффициент а признается незначимым и должен быть удален из модели. Для коэффициента b2 вероятность его не влияния на у равна 0,096 (9,6%), что больше порогового значения в 5%, поэтому коэффициент b2 признается незначимым и должен быть удален из модели
. Для коэффициента b3 вероятность его не влияния на у равна 0,06 (6%), что больше порогового значения в 5%, поэтому коэффициент b3 признается незначимым и должен быть удален из модели.
В первую очередь из модели будет исключена переменная х2, поскольку вероятность ее не влияния на у, определяемая соответствующим ей коэффициентом b2 и b3 выше, чем для константы а.
К числу рассчитываемых и анализируемых параметров относятся:
а) коэффициенты регрессии (и их значимость):
Значимость коэффициентов регрессии оценим с помощью критерия Стьюдента.
Расчетные значения критерия Стьюдента следующие: ; и . Табличное значение критерия при уровне значимости и числе степеней свободы равно 2,037.
Таким образом, признается статистическая значимость параметра ,т.к. .
Таким образом, признается статистическая не значимость параметров и ,т.к. и .
б) коэффициент корреляции (и его значимость);
Множественный коэффициент корреляции R, равный 0,989, свидетельствует о тесной связи между признаками.
в) коэффициент детерминации:
Множественный коэффициент детерминации , показывает, что около 97,7% вариации зависимой переменной (накладные расходы) учтено в модели и обусловлено влиянием включенных факторов (объем работ, численность рабочих и фонд заработной платы) и на 2,3% — другими факторами, не включенными в модель.
г) стандартные ошибки коэффициентов регрессии:
д) доверительные интервалы для коэффициентов регрессии:
Доверительные интервалы для параметров чистой регрессии:
,
,
,
Анализ верхней и нижней границ доверительного интервалаприводит к выводу о том, что с вероятностью параметр находясь в указанных границах, не принимает нулевого значения, т.е. является статистически значимым и существенно отличен от нуля.
Анализ верхней и нижней границ доверительных интерваловприводит к выводу о том, что с вероятностью параметр и находясь в указанных границах, принимают нулевые значения, т.е