Исследуется зависимость урожайности у зерновых культур ( ц/га ) от ряда факторов (переменных) сельскохозяйственного производства, а именно,
X1 - число тракторов на 100 га;
X2 - число зерноуборочных комбайнов на 100 га;
X3 - число орудий поверхностной обработки почвы на 100 га;
X4 - количество удобрений, расходуемых на гектар (т/га);
X5- количество химических средств защиты растений, расходуемых на гектар (ц/га).
Исходные данные для 20 районов области приведены в таблице.
y X1 X2 X3 X4 X5
1 10,4 1,59 0,26 2,05 0,32 0,14
2 9,1 0,34 0,28 0,46 0,59 0,66
3 9,7 2,53 0,31 2,46 0,3 0,31
4 10,6 4,63 0,4 6,44 0,43 0,59
5 10,3 2,16 0,26 2,16 0,39 0,16
6 9,3 2,16 0,3 2,69 0,32 0,17
7 13,2 0,68 0,29 0,73 0,42 0,23
8 8,3 0,35 0,26 0,42 0,21 0,08
9 7,6 0,52 0,24 0,49 0,2 0,08
10 14,2 3,42 0,31 3,02 1,37 0,73
11 10,4 1,78 0,3 3,19 0,73 0,17
12 11,4 2,4 0,32 3,3 0,25 0,14
13 12,8 9,36 0,4 11,51 0,39 0,38
14 10,4 1,72 0,28 2,26 0,82 0,17
15 7,7 0,59 0,29 0,6 0,13 0,35
16 7,9 0,28 0,26 0,3 0,09 0,15
17 8,9 1,64 0,29 1,44 0,2 0,08
18 9,1 0,09 0,22 0,05 0,43 0,2
19 13,8 0,08 0,25 0,03 0,73 0,2
20 9,4 1,36 0,26 0,17 0,99 0,42
Здесь мы располагаем выборкой объемом п = 20; число независимых переменных (факторов) m = 5.
Необходимо:
- построить 5 уравнений линейной регрессии, последовательно увеличивая число факторных переменных от одной до пяти;
- определить оценки параметров в уравнениях регрессии;
- определить качество полученных уравнений регрессии и их статистическую значимость;
- оценить статистическую значимость параметров регрессии;
- построить графики остатков для полученных регрессий;
- выбрать лучшую модель;
- для этой модели рассчитать нормированные коэффициенты j
По каждому пункту сделать выводы.
Нужно полное решение этой работы?
Решение
Построим уравнение регрессии с фактором Х1 (число тракторов на 100 га)
Рис.1. Регрессионный анализ
Из рисунка 1 следует, что уравнение регрессии имеет вид^
у=9,47+0,40X1
Анализ данного уравнения позволяет сделать выводы – с увеличением числа тракторов на 100 га на 1 ед. урожайность увеличивается в среднем на 0,40 ц/га.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает –критерий Фишера:
Fфакт=4,089
Табличное значение при степенях свободы k1= 1 и k2= n-m-1 = 20-1 - 1 = 18, Fkp(0,05;1;18) = 4.414
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно (совместная незначимость коэффициентов при факторах xi подтверждается).
Коэффициент детерминации составил R2 = 0,185 или 18,5%. Это означает, что вариация результативного признака на 18,5% объясняется вариацией вошедшего в модель фактора и на 81,50% объясняется вариацией неучтенных в модели факторов.
С помощью t-критерия Стьюдента оценим статистическую надёжность оценок коэффициентов регрессии.
tкрит(α/2; n-m-1;) = tкрит(0.05;20-1-1) =2,10
Оценка t - критерия
Показатель Расчетный Табличный Сравнение Вывод
ta
17,10 2,10 ta> tкр
Статистически значим
tb1 2.02 2,10 tb1< tкр
Статистически не значим
График остатков для полученной регрессии представлен на рис.2.
Рис.2. График остатков
Построим уравнение регрессии с факторами Х1 (число тракторов на 100 га) и Х2 ( число зерноуборочных комбайнов на 100 га)
Рис.3. Регрессионный анализ
Из рисунка 3 следует, что уравнение регрессии имеет вид
у=9,206+0,381X1+1,044X2
Анализ данного уравнения позволяет сделать выводы – с увеличением числа тракторов на 100 га на 1 ед. урожайность увеличивается в среднем на 0,381 ц/га, при неизменных остальных факторах; при увеличении числа зерноуборочных комбайнов на 100 га на 1 ед. урожайность увеличивается в среднем на 1,044 ц/га, при неизменных остальных факторах.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает –критерий Фишера: Fфакт=1,933
Табличное значение при степенях свободы k1= 2 и k2= n-m-1=20-2-1=17 Fkp(0,05;2;17) = 3,592
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно (совместная незначимость коэффициентов при факторах xi подтверждается).
Коэффициент детерминации составил R2 = 0,1853 или 18,53%. Это означает, что вариация результативного признака на 18,53% объясняется вариацией вошедшего в модель фактора и на 81,47% объясняется вариацией неучтенных в модели факторов.
С помощью t-критерия Стьюдента оценим статистическую надёжность оценок коэффициентов регрессии. tкрит(α/2; n-m-1;) = tкрит(0.05;20-2-1) =2,11
Оценка t - критерия
Показатель Расчетный Табличный Сравнение Вывод
ta
1,976 2,11 ta< tкр
Статистически не значим
tb1 0,973 2,11 tb1< tкр
Статистически не значим
tb2 0,057 2,11 tb2< tкр
Статистически не значим
График остатков для полученной регрессии представлен на рис.4.
Рис.4
. График остатков
Построим уравнение регрессии с факторами Х1 (число тракторов на 100 га), Х2 (число зерноуборочных комбайнов на 100 га) и X3 (число орудий поверхностной обработки почвы на 100 га).
Рис.5. Регрессионный анализ
Из рисунка 5 следует, что уравнение регрессии имеет вид
у=8,153+0,786X1+4,945X2-0,383X3
Анализ данного уравнения позволяет сделать выводы – с увеличением числа тракторов на 100 га на 1 ед. урожайность увеличивается в среднем на 0,786 ц/га, при неизменных остальных факторах; при увеличении числа зерноуборочных комбайнов на 100 га на 1 ед. урожайность увеличивается в среднем на 4,945 ц/га, при неизменных остальных факторах; при увеличении числа орудий поверхностной обработки почвы на 100 га на 1 ед. урожайность снижается в среднем на 0,383 ц/га, при неизменных остальных факторах.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает –критерий Фишера:
Fфакт=1, 297
Табличное значение при степенях свободы k1= 3 и k2= n-m-1=20-3-1=16 Fkp(0,05;3;16) = 3,239
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно (совместная незначимость коэффициентов при факторах xi подтверждается).
Коэффициент детерминации составил R2 = 0,195 или 19,5%. Это означает, что вариация результативного признака на 19,5% объясняется вариацией вошедшего в модель фактора и на 80,5% объясняется вариацией неучтенных в модели факторов.
С помощью t-критерия Стьюдента оценим статистическую надёжность оценок коэффициентов регрессии.
tкрит(α/2; n-m-1;) = tкрит(0.05;20-3-1) =2,12
Оценка t - критерия
Показатель Расчетный Табличный Сравнение Вывод
ta
1,528 2,12 ta< tкр
Статистически не значим
tb1 0,785 2,12 tb1< tкр
Статистически не значим
tb2 0,240 2,12 tb2< tк
Статистически не значим
tb3 0,442 2,12 tb3< tк
Статистически не значим
График остатков для полученной регрессии представлен на рис.6.
Рис.6. График остатков
Построим уравнение регрессии с факторами Х1 (число тракторов на 100 га), Х2 (число зерноуборочных комбайнов на 100 га), X3 (число орудий поверхностной обработки почвы на 100 га), X4 (количество удобрений, расходуемых на гектар (т/га).
Рис.7. Регрессионный анализ
Из рисунка 7 следует, что уравнение регрессии имеет вид
у=7,177-0,235X1+3,135X2+0,415X3+3,601X4
Анализ данного уравнения позволяет сделать выводы – с увеличением числа тракторов на 100 га на 1 ед. урожайность снижается в среднем на 0,253ц/га, при неизменных остальных факторах; при увеличении числа зерноуборочных комбайнов на 100 га на 1 ед. урожайность увеличивается в среднем на 3,135 ц/га, при неизменных остальных факторах; при увеличении числа орудий поверхностной обработки почвы на 100 га на 1 ед. урожайность увеличивается в среднем на 0,415 ц/га, при неизменных остальных факторах; при увеличении количества удобрений, расходуемых на гектар на 1т/га урожайность увеличивается в среднем на 3,601 ц/га.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает –критерий Фишера: Fфакт=3,5488
Табличное значение при степенях свободы k1= 4 и k2= n-m-1=20-4-1=15 Fkp(0,05;4;15) = 3,056
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно (совместная значимость коэффициентов при факторах xi подтверждается).
Коэффициент детерминации составил R2 = 0,486 или 48,6%