Для характеристики Y от Х построить следующие модели:
- линейную,
- степенную,
- показательную,
- гиперболическую.
2. Оценить каждую модель, определив:
- индекс корреляции,
- среднюю относительную ошибку,
- коэффициент детерминации,
- F-критерий Фишера.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 110% относительно среднего уровня.
5. Результаты расчетов отобразить на графике.
Таблица 1
Показатели качества зерна пшеницы
№ образца Y, % X, %
1 151 74
2 75 36
3 165 82
4 80 39
5 109 53
6 92 45
7 195 96
8 194 96
9 38 18
10 134 66
11 159 78
12 145 72
13 149 74
14 88 43
15 175 87
16 148 73
17 72 35
18 106 52
19 127 63
20 98 48
21 71 35
22 19 8
23 46 22
24 7 2
Решение
Построение линейной модели парной корреляции.
Определим линейный коэффициент парной корреляции по следующей формуле:
По данным вычислениям видно, что связь между х и упрямая и достаточно сильная.
Уравнение линейной регрессии имеет вид:
Уравнение линейной регрессии имеет вид:
С увеличением х на 1 % показатели качества зерна пшеницы увеличивается в среднем на 1,993%. Это свидетельствует об прямой связи данных показателей.
Расчеты производились исходя из данных, указанных в таблице 2,3
Таблица 2
№ образца Y, % X, % Y-Yср
(Y-Yср)кв
X-Xср
(X-Xср)кв
(Y-Yср)(X-Xср)
1 151 74 40,88 1670,77 19,96 398,34 815,80
2 75 36 -35,13 1233,77 -18,04 325,50 633,71
3 165 82 54,88 3011,27 27,96 781,67 1534,21
4 80 39 -30,13 907,52 -15,04 226,25 453,13
5 109 53 -1,13 1,27 -1,04 1,09 1,17
6 92 45 -18,13 328,52 -9,04 81,75 163,88
7 195 96 84,88 7203,77 41,96 1760,50 3561,21
8 194 96 83,88 7035,02 41,96 1760,50 3519,26
9 38 18 -72,13 5202,02 -36,04 1299,00 2599,51
10 134 66 23,88 570,02 11,96 143,00 285,51
11 159 78 48,88 2388,77 23,96 574,00 1170,96
12 145 72 34,88 1216,27 17,96 322,50 626,30
13 149 74 38,88 1511,27 19,96 398,34 775,88
14 88 43 -22,13 489,52 -11,04 121,92 244,30
15 175 87 64,88 4208,77 32,96 1086,25 2138,17
16 148 73 37,88 1434,52 18,96 359,42 718,05
17 72 35 -38,13 1453,52 -19,04 362,59 725,96
18 106 52 -4,13 17,02 -2,04 4,17 8,42
19 127 63 16,88 284,77 8,96 80,25 151,17
20 98 48 -12,13 147,02 -6,04 36,50 73,26
21 71 35 -39,13 1530,77 -19,04 362,59 745,01
22 19 8 -91,13 8303,77 -46,04 2119,84 4195,55
23 46 22 -64,13 4112,02 -32,04 1026,67 2054,67
24 7 2 -103,13 10634,77 -52,04 2708,34 5366,80
Сумма 2643 1297 0,00 64896,63 0,00 16340,96 32561,88
Среднее 110,13 54,04
2704,03
680,87 1356,74
Таблица 3
№ образца YX Xкв
Yкв
В А Yрасч
е=Y-Yрасч
e/Y*100%
1 11174 5476 22801 1,993 2,439 149,90 1,10 0,73
2 2700 1296 5625
74,17 0,83 1,10
3 13530 6724 27225
165,84 -0,84 0,51
4 3120 1521 6400
80,15 -0,15 0,19
5 5777 2809 11881
108,05 0,95 0,87
6 4140 2025 8464
92,11 -0,11 0,12
7 18720 9216 38025
193,73 1,27 0,65
8 18624 9216 37636
193,73 0,27 0,14
9 684 324 1444
38,31 -0,31 0,81
10 8844 4356 17956
133,95 0,05 0,03
11 12402 6084 25281
157,87 1,13 0,71
12 10440 5184 21025
145,91 -0,91 0,63
13 11026 5476 22201
149,90 -0,90 0,60
14 3784 1849 7744
88,12 -0,12 0,14
15 15225 7569 30625
175,80 -0,80 0,46
16 10804 5329 21904
147,90 0,10 0,07
17 2520 1225 5184
72,18 -0,18 0,25
18 5512 2704 11236
106,06 -0,06 0,05
19 8001 3969 16129
127,98 -0,98 0,77
20 4704 2304 9604
98,09 -0,09 0,09
21 2485 1225 5041
72,18 -1,18 1,66
22 152 64 361
18,38 0,62 3,26
23 1012 484 2116
46,28 -0,28 0,60
24 14 4 49
6,42 0,58 8,23
Сумма 175394,00 86433,00 355957,00
2643,00 0,00 22,67
Среднее 7308,08 3601,38 14831,54
110,13 0,00
Рассчитаем коэффициент детерминации:
Вариация результата Y (показатели качества зерна пшеницы) на 99,8% объясняется вариацией фактора Х .
Оценку значимости равнения регрессии проведем с помощь. F-критерия Фишера:
для ; , .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. .
Определим среднюю относительную ошибку:
Данный показатель отражает на сколько в среднем расчетные значения для линейной модели отличаются от фактических значений (на 0,94%).
Построение степенной модели парной регрессии.
Уравнение степенной модели имеет вид: .
Для построения этой модели необходимо произвести линеаризацию переменных
. Для этого произведем логарифмирование обеих частей уравнения: .
Таблица 4
№п/п Факт Y(t) lg (Y) Переменная Х(t) lg (X)
1 151 2,179 74 1,869
2 75 1,875 36 1,556
3 165 2,217 82 1,914
4 80 1,903 39 1,591
5 109 2,037 53 1,724
6 92 1,964 45 1,653
7 195 2,290 96 1,982
8 194 2,288 96 1,982
9 38 1,580 18 1,255
10 134 2,127 66 1,820
11 159 2,201 78 1,892
12 145 2,161 72 1,857
13 149 2,173 74 1,869
14 88 1,944 43 1,633
15 175 2,243 87 1,940
16 148 2,170 73 1,863
17 72 1,857 35 1,544
18 106 2,025 52 1,716
19 127 2,104 63 1,799
20 98 1,991 48 1,681
21 71 1,851 35 1,544
22 19 1,279 8 0,903
23 46 1,663 22 1,342
24 7 0,845 2 0,301
Сумма 2643 46,970 1297,000 39,233
Среднее 110,125 1,957 54,042 1,635
Обозначим Y=lg, Х=lgx, А=lga.
Тогда уравнение имеет вид: Y=A+bX – линейное уравнение регрессии.
Рассчитаем его параметры, используя таблицу 5.
Таблица 5
№ y Y x X YX Xкв
Y расч
Е e/Y*100% Е кв
1 151 2,179 74 1,869 4,073 3,494 134,14 16,86 11,167 284,308
2 75 1,875 36 1,556 2,918 2,422 71,87 3,13 4,171 9,787
3 165 2,217 82 1,914 4,244 3,663 146,61 18,39 11,146 338,215
4 80 1,903 39 1,591 3,028 2,531 77,03 2,97 3,712 8,820
5 109 2,037 53 1,724 3,513 2,973 100,47 8,53 7,829 72,818
6 92 1,964 45 1,653 3,247 2,733 87,19 4,81 5,225 23,108
7 195 2,290 96 1,982 4,539 3,929 168,05 26,95 13,819 726,149
8 194 2,288 96 1,982 4,535 3,929 168,05 25,95 13,375 673,255
9 38 1,580 18 1,255 1,983 1,576 39,43 -1,43 3,772 2,055
10 134 2,127 66 1,820 3,870 3,311 121,49 12,51 9,339 156,616
11 159 2,201 78 1,892 4,165 3,580 140,40 18,60 11,701 346,131
12 145 2,161 72 1,857 4,014 3,450 130,99 14,01 9,660 196,189
13 149 2,173 74 1,869 4,062 3,494 134,14 14,86 9,974 220,862
14 88 1,944 43 1,633 3,176 2,668 83,83 4,17 4,742 17,416
15 175 2,243 87 1,940 4,350 3,762 154,32 20,68 11,817 427,656
16 148 2,170 73 1,863 4,044 3,472 132,57 15,43 10,427 238,167
17 72 1,857 35 1,544 2,868 2,384 70,14 1,86 2,584 3,462
18 106 2,025 52 1,716 3,475 2,945 98,82 7,18 6,771 51,510
19 127 2,104 63 1,799 3,785 3,238 116,69 10,31 8,119 106,328
20 98 1,991 48 1,681 3,348 2,827 92,20 5,80 5,913 33,583
21 71 1,851 35 1,544 2,858 2,384 70,14 0,86 1,212 0,741
22 19 1,279 8 0,903 1,155 0,816 19,54 -0,54 2,830 0,289
23 46 1,663 22 1,342 2,232 1,802 46,92 -0,92 1,995 0,842
24 7 0,845 2 0,301 0,254 0,091 5,88 1,12 15,978 1,251
Сумма 2643 46,970 1297,000 39,233 79,739 67,473 2410,91 232,09 187,280 3939,56
Среднее 110,125 1,957 54,042 1,635 3,322 2,811 100,45 9,671 7,803 164,148
Уравнение регрессии будет иметь вид:
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения и получим уравнение степенной модели регрессии.
Определим индекс корреляции:
Связь между показателем и фактором можно считать средней по силе.
Рассчитаем коэффициент детерминации:
Вариация результата Y на 93,9% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
для ; , .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к. .
Определим среднюю относительную ошибку:
В среднем расчетные значения для степенной модели отличаются от фактических значений на 7,80%.
Построение показательной функции.
Уравнение показательной кривой: .
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:
, обозначим: , , .
Получим линейное уравнение регрессии: .
Рассчитаем его параметры, используя данные таблицы 6.
Таблица 6
№ y Y x Yx
х кв
Y-Yср
(Y-Yср)кв
X-Xср
(X-Xср)кв
Y расч
y-yрасч
(y-yрасч)кв
Еi
e/Y*100%
1 151 2,179 74 161,24 5476 0,22 0,05 19,96 398,34 155,21 -4,21 17,75 -4,21 2,79
2 75 1,875 36 67,50 1296 -0,08 0,01 -18,04 325,50 56,40 18,60 346,10 18,60 24,80
3 165 2,217 82 181,83 6724 0,26 0,07 27,96 781,67 192,08 -27,08 733,55 -27,08 16,41
4 80 1,903 39 74,22 1521 -0,05 0,00 -15,04 226,25 61,09 18,91 357,63 18,91 23,64
5 109 2,037 53 107,98 2809 0,08 0,01 -1,04 1,09 88,71 20,29 411,88 20,29 18,62
6 92 1,964 45 88,37 2025 0,01 0,00 -9,04 81,75 71,68 20,32 412,99 20,32 22,09
7 195 2,290 96 219,84 9216 0,33 0,11 41,96 1760,50 278,92 -83,92 7042,35 -83,92 43,04
8 194 2,288 96 219,63 9216 0,33 0,11 41,96 1760,50 278,92 -84,92 7211,19 -84,92 43,77
9 38 1,580 18 28,44 324 -0,38 0,14 -36,04 1299,00 34,91 3,09 9,53 3,09 8,12
10 134 2,127 66 140,39 4356 0,17 0,03 11,96 143,00 125,42 8,58 73,63 8,58 6,40
11 159 2,201 78 171,71 6084 0,24 0,06 23,96 574,00 172,67 -13,67 186,79 -13,67 8,60
12 145 2,161 72 155,62 5184 0,20 0,04 17,96 322,50 147,16 -2,16 4,66 -2,16 1,49
13 149 2,173 74 160,82 5476 0,22 0,05 19,96 398,34 155,21 -6,21 38,60 -6,21 4,17
14 88 1,944 43 83,61 1849 -0,01 0,00 -11,04 121,92 67,96 20,04 401,66 20,04 22,77
15 175 2,243 87 195,14 7569 0,29 0,08 32,96 1086,25 219,45 -44,45 1976,16 -44,45 25,40
16 148 2,170 73 158,43 5329 0,21 0,05 18,96 359,42 151,13 -3,13 9,81 -3,13 2,12
17 72 1,857 35 65,01 1225 -0,10 0,01 -19,04 362,59 54,91 17,09 291,94 17,09 23,73
18 106 2,025 52 105,32 2704 0,07 0,00 -2,04 4,17 86,37 19,63 385,22 19,63 18,52
19 127 2,104 63 132,54 3969 0,15 0,02 8,96 80,25 115,79 11,21 125,77 11,21 8,83
20 98 1,991 48 95,58 2304 0,03 0,00 -6,04 36,50 77,64 20,36 414,45 20,36 20,77
21 71 1,851 35 64,79 1225 -0,11 0,01 -19,04 362,59 54,91 16,09 258,77 16,09 22,66
22 19 1,279 8 10,23 64 -0,68 0,46 -46,04 2119,84 26,75 -7,75 60,02 -7,75 40,77
23 46 1,663 22 36,58 484 -0,29 0,09 -32,04 1026,67 38,84 7,16 51,28 7,16 15,57
24 7 0,845 2 1,69 4 -1,11 1,24 -52,04 2708,34 22,80 -15,80 249,51 -15,80 225,66
Сумма 2643 46,97 1297 2726,52 86433 0,00 2,63 0,00 16340,96 2734,93 -91,93 21071,24 -91,93 650,75
Среднее 110,13 1,957 54,04 113,60 3601,38 0,00 0,11 0,00 680,87 113,96 -3,83 877,97 -3,83 27,11
Уравнение регрессии будет иметь вид:
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
Определим индекс корреляции:
Данный показатель характеризует сильную связь между показателем и фактором.
Индекс детерминации:
Вариация результата Y на 67,5% объясняется вариацией фактора Х.
Рассчитаем F-критерий Фишера:
для ; , .
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к