По предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов x1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x2 (%) ( i – число букв в полном имени, f – число букв в фамилии).
№ y x1 x2
1 7,0 4.8 19-0.1f
2 8,0 5.3 19
3 8,0 5.4 20-0.1f
4 8,0 5.6-0.1i 20
5 10,0 6.8 21
1. Построить линейную модель множественной регрессии. Найти значения регрессии.
2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации. Определить коэффициент эластичности
4. С помощью частных и общих F -критериев Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации.
5. С помощью t -критерия Стьюдента оценить статистическую значимость параметров чистой регрессии.
i=5 , f =7
Таблица 1
Исходные данные
№ y x1 x2
1 7 4,8 18,3
2 8 5,3 19
3 8 5,4 19,3
4 8 5,1 20
5 10 6,8 21
Решение
1. Для удобства проведения расчетов поместим результатыпромежуточных расчетов в таблицу:
Таблица 2
№
7 4,8 18,3 33,6 128,1 87,84 23,04 334,89 49
8 5,3 19 42,4 152 100,7 28,09 361 64
8 5,4 19,3 43,2 154,4 104,22 29,16 372,49 64
8 5,1 20 40,8 160 102 26,01 400 64
10 6,8 21 68 210 142,8 46,24 441 100
сумма 41 27,4 97,6 228 804,5 537,56 152,54 1909,38 341
ср.знач. 8,2 5,48 19,52 45,6 160,9 107,512 30,508 381,876 68,2
Найдем средние квадратические отклонения признаков:
Для нахождения параметров линейного уравнения множественнойрегрессии
необходимо решить систему линейных уравнений относительнонеизвестных параметров воспользоваться готовымиформулами.
Рассчитаем сначала парные коэффициенты корреляции:
Находим но формулам коэффициенты чистой регрессии ипараметр :
Таким образом, получили следующее уравнение множественнойрегрессии:
Уравнение регрессии показывает, что при увеличении ввода вдействие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 0, 99 тыс. руб., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на 0,36 тыс. руб.
После нахождения уравнения регрессии составим новую расчетнуютаблицу для определения теоретических значений результативногопризнака, остаточной дисперсии и средней ошибки аппроксимации.
Таблица 2
№
7 4,8 18,3 7,095 -0,095 0,009 1,355
8 5,3 19 7,837 0,163 0,027 2,035
8 5,4 19,3 8,043 -0,043 0,002 0,534
8 5,1 20 7,997 0,003 0,000 0,039
10 6,8 21 10,028 -0,028 0,001 0,284
сумма 41 27,4 97,6 41,000 0,000 0,038 4,247
ср.знач
. 8,2 5,48 19,52
Средняя ошибка аппроксимации:
Качество модели, исходя из относительных отклонений по каждомунаблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
2. Коэффициенты парной корреляции мы уже нашли:
, , .
Они указывают на весьма сильную связь каждого фактора срезультатом, а также высокую межфакторную зависимость (факторы и явно коллинеарные, т.к. . При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связимежду результатом и соответствующим фактором при элиминировании(устранении влияния) других факторов, включенных в уравнениерегрессии.
При двух факторах частные коэффициенты корреляциирассчитываются следующим образом:
Если сравнить коэффициенты парной и частной корреляции, томожно увидеть, что из-за высокой межфакторной зависимостикоэффициенты парной корреляции дают завышенные оценки теснотысвязи. Именно по этой причине рекомендуется при наличии сильнойколлинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснотамежфакторной связи.
Коэффициент множественной корреляции определить через матрицыпарных коэффициентов корреляции:
,
где
определитель матрицы парных коэффициентов корреляции;
определитель матрицы межфакторной корреляции.Находим:
Коэффициент множественной корреляции:
Коэффициент множественной корреляции указывает на весьмасильную связь всего набора факторов с результатом.
Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата