Составить уравнение регрессии, описывающее зависимость товарооборота от заданного фактора, по имеющимся данным. Оценить качество модели.
№ п/п Товарооборот за месяц (y), тыс. руб. Площадь торгового зала (x), кв м
1 114,9 6,9
2 166,5 9
3 221,4 9,2
4 325,4 11,2
5 383,1 11,6
6 474,8 16,1
7 497,8 16,7
8 581,7 17,9
9 683,7 18,6
10 872,1 19
11 889,8 20,5
12 1015,2 22,2
13 1222,8 22,7
14 1247 24,1
15 1342,6 25,1
16 1391,8 25,4
17 1582,2 26,4
18 1640,1 30,5
19 1976 34,9
20 2145,2 41,1
Решение
Уравнение парной линейной регрессии имеет вид:
yx=a+bx
Оценка параметров линейной регрессии основана на методе наименьших квадратов (МНК), позволяющем получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного признака y от расчетных (теоретических ) минимальна: i(yi-yxi)²→min
Параметры a и b находят из следующей системы уравнений
где n – число наблюдений.
Решая систему нормальных уравнений, найдем искомые оценки параметров a и b. Используем следующие формулы для a и b:
.
.
Таблица 1 – Расчетные данные
n x y xy
x2 y2
1 6,9 114,9 792,81 47,61 13202,01
2 9 166,5 1498,50 81,00 27722,25
3 9,2 221,4 2036,88 84,64 49017,96
4 11,2 325,4 3644,48 125,44 105885,16
5 11,6 383,1 4443,96 134,56 146765,61
6 16,1 474,8 7644,28 259,21 225435,04
7 16,7 497,8 8313,26 278,89 247804,84
8 17,9 581,7 10412,43 320,41 338374,89
9 18,6 683,7 12716,82 345,96 467445,69
10 19 872,1 16569,90 361,00 760558,41
11 20,5 889,8 18240,90 420,25 791744,04
12 22,2 1015,2 22537,44 492,84 1030631,04
13 22,7 1222,8 27757,56 515,29 1495239,84
14 24,1 1247 30052,70 580,81 1555009,00
15 25,1 1342,6 33699,26 630,01 1802574,76
16 25,4 1391,8 35351,72 645,16 1937107,24
17 26,4 1582,2 41770,08 696,96 2503356,84
18 30,5 1640,1 50023,05 930,25 2689928,01
19 34,9 1976 68962,40 1218,01 3904576,00
20 41,1 2145,2 88167,72 1689,21 4601883,04
Итого 409,1 18774 484636,15 9857,51 24694261,67
Среднее 20,46 938,71 24231,81 492,88 1234713,08
Находим параметры a и b:
b=yx-yxx2-x2=24231,81-938,71·20,46492,88-20,46²=5030,674,47=67,553
a=y-bx=938,71-67,553∙20,46=-443,1
Таким образом, уравнение регрессии имеет вид:
yx=a+bx
yx=-443,1+67,553x
Вывод: Если увеличение площади торгового зала равняется нулю, то товарооборот снизится в среднем на 0,06 руб
.
Находим коэффициент корреляции:
Вывод: в данном случае величина коэффициента корреляции является существенной, сила связи – весьма высокая, что позволяет сделать вывод о том, что площадь торгового зала – один из главных факторов, от которых зависит товарооборот магазина.
Находим коэффициент детерминации:
rxy2=0,9804²=0,9612
Вывод. Товарооборот магазина на 96,12% зависит от площади торгового зала и на 3,88% - от прочих факторов, не включенных в модель.
Для оценки качества модели произведем расчеты, отраженные в таблице 2.
Таблица 2 – Расчетные данные
n x y (х - )2 (y - )2 (-)2 (y - )2 y- yxy
1 6,9 114,9 23,0 183,87 678646,44 838506,49 8445,61 0,79983
2 9 166,5 164,9 131,33 596292,84 598766,44 2,56 0,00961
3 9,2 221,4 178,4 126,79 514519,29 578056,09 1849 0,19422
4 11,2 325,4 313,5 85,75 376136,89 390875,04 141,61 0,03657
5 11,6 383,1 340,5 78,50 308691,36 357843,24 1814,76 0,11120
6 16,1 474,8 644,5 19,01 215203,21 86553,64 28798,09 -0,35741
7 16,7 497,8 685,0 14,14 194392,81 64363,69 35043,84 -0,37605
8 17,9 581,7 766,1 6,55 127449 29790,76 34003,36 -0,31700
Продолжение таблицы 2
9 18,6 683,7 813,4 3,46 65025 15700,09 16822,09 -0,18970
10 19 872,1 840,4 2,13 4435,56 9662,89 1004,89 0,03635
11 20,5 889,8 941,7 0,00 2391,21 9,00 2693,61 -0,05833
12 22,2 1015,2 1056,6 3,03 5852,25 13900,41 1713,96 -0,04078
13 22,7 1222,8 1090,4 5,02 80712,81 23012,89 17529,76 0,10828
14 24,1 1247,0 1184,9 13,25 95048,89 60614,44 3856,41 0,04980
15 25,1 1342,6 1252,5 21,53 163135,21 98470,44 8118,01 0,06711
16 25,4 1391,8 1272,7 24,40 205299,61 111556 14184,81 0,08557
17 26,4 1582,2 1340,3 35,28 414092,25 161282,56 58515,61 0,15289
18 30,5 1640,1 1617,3 100,80 491961,96 460497,96 519,84 0,01390
19 34,9 1976,0 1914,5 208,51 1075991,3 952185,64 3782,25 0,03112
20 41,1 2145,2 2333,3 426,01 1455642,3 1944909,16 35381,61 -0,08768
Итого 409,1 18774 18774 1489,37 7070920,1 6796556,87 274221,7 0,26948
Найдем среднюю ошибку аппроксимации:
A=1ny-yy∙100%=120∙0,26948∙100=1,35%.
Вывод