Парная регрессия
Требуется:
1. Для характеристики y от x построить следующие модели:
— линейную,
— экспоненциальную,
— гиперболическую.
2. Оценить каждую модель, определив:
— индекс корреляции,
— коэффициент детерминации,
— F-критерий Фишера.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. По лучшей модели рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 10 % относительно его среднего уровня.
5. На графике отобразить диаграмму рассеяния, график лучшей модельной кривой и прогнозное значение.
Вариант 5.
х - энерговооруженность (кВт),
у - производительность труда (тыс. руб.).
х 3,2 3,7 4,0 4,8 6,0 5,4 5,2 5,4 6,0 9,0
у 8,4 8,8 9,1 9,8 10,6 10,7 11,1 11,8 12,1 12,4
Решение
Построение моделей регрессии
Построение линейной модели парной регрессии.
Составим расчетную таблицу:
Таблица 1.1
t y x y x x2
1 8,4 3,2 26,88 10,24 -2,08 4,33 -2,07 4,2849 4,3056
2 8,8 3,7 32,56 13,69 -1,68 2,82 -1,57 2,4649 2,6376
3 9,1 4 36,4 16 -1,38 1,90 -1,27 1,6129 1,7526
4 9,8 4,8 47,04 23,04 -0,68 0,46 -0,47 0,2209 0,3196
5 10,6 6 63,6 36 0,12 0,01 0,73 0,5329 0,0876
6 10,7 5,4 57,78 29,16 0,22 0,05 0,13 0,0169 0,0286
7 11,1 5,2 57,72 27,04 0,62 0,38 -0,07 0,0049 -0,0434
8 11,8 5,4 63,72 29,16 1,32 1,74 0,13 0,0169 0,1716
9 12,1 6 72,6 36 1,62 2,62 0,73 0,5329 1,1826
10 12,4 9 111,6 81 1,92 3,69 3,73 13,9129 7,1616
Сумма 104,8 52,7 569,9 301,33 18,02 23,601 17,604
Среднее 10,48 5,27 56,99 30,133
Определим линейный коэффициент парной корреляции по следующей формуле, используя данные таблицы 1.1:
Можно сказать, что связь между энерговооруженностью X и производительностью труда Y прямая, тесная .
Уравнение линейной регрессии имеет вид: .
Значения параметров a и b линейной модели определим, используя данные таблицы 1.1.
Уравнение регрессии имеет вид: .
С увеличением энерговооруженности на 1 кВт производительность труда увеличится в среднем на 0,75 тыс. руб. Это свидетельствует об эффективности работы предприятий.
Вычислим расчетные значения , подставив в уравнение регрессии наблюдаемые значения х:
Таблица 1.1.1
t y x
1 8,4 3,2 8,9 -0,54 6,38
2 8,8 3,7 9,3 -0,51 5,78
3 9,1 4 9,5 -0,43 4,76
4 9,8 4,8 10,1 -0,33 3,36
5 10,6 6 11,0 -0,42 4,00
6 10,7 5,4 10,6 0,12 1,15
7 11,1 5,2 10,4 0,67 6,06
8 11,8 5,4 10,6 1,22 10,36
9 12,1 6 11,0 1,08 8,89
10 12,4 9 13,3 -0,86 6,95
Сумма
0,00 57,70
Среднее
5,77
Рассчитаем коэффициент детерминации: 0,8542 = 0,729.
Вариация результата Y (производительности труда) на 72,9% объясняется вариацией фактора X (величиной энерговооруженности).
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:
;
F<Fтабл = 5,32 для =0,05; k1 = m = 1, k2 = n – m – 1 = 102=8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к
. F Fтабл.
Определим среднюю ошибку аппроксимации:
.
В среднем расчетные значения для линейной модели отличаются от фактических значений на 5,77% (меньше 8%, точность высокая).
Построение экспоненциальной функции
Экспоненциальная регрессия имеет уравнение , его можно записать в виде показательной функции , где .
Сводим модель к линейной путем логарифмирования уравнения : Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:
.
Обозначим: .
Получим линейное уравнение регрессии:
Y=A+Bx.
Рассчитаем его параметры, используя данные таблицы 1.2.
Таблица 1.2
t y Y x Y х х 2 Ei
1 8,4 0,924 3,2 2,96 10,24 8,95 0,307 4,326 -0,55 6,60
2 8,8 0,944 3,7 3,49 13,69 9,28 0,233 2,822 -0,48 5,48
3 9,1 0,959 4 3,84 16 9,48 0,148 1,904 -0,38 4,23
4 9,8 0,991 4,8 4,76 23,04 10,05 0,061 0,462 -0,25 2,52
5 10,6 1,025 6 6,15 36 10,95 0,124 0,014 -0,35 3,33
6 10,7 1,029 5,4 5,56 29,16 10,49 0,044 0,048 0,21 1,96
7 11,1 1,045 5,2 5,44 27,04 10,34 0,577 0,384 0,76 6,85
8 11,8 1,072 5,4 5,79 29,16 10,49 1,716 1,742 1,31 11,10
9 12,1 1,083 6 6,50 36 10,95 1,316 2,624 1,15 9,48
10 12,4 1,093 9 9,84 81 13,59 1,419 3,686 -1,19 9,61
Сумма 104,8 10,167 52,7 54,32 301,33 5,946 18,016 0,21 61,15
Среднее 10,48 1,017 5,27 5,43 30,133 6,12
Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:
Или в экспоненциальном виде:
Определим индекс корреляции:
Связь между показателем y и фактором x можно считать тесной ( 0,7).
Индекс детерминации: R2 = = 0,819 2 = 0,670.
Вариация результата Y (производительности труда) на 67,0% объясняется вариацией фактора X (величиной энерговооруженности).
Рассчитаем F-критерий Фишера:
F Fтабл = 5,32 для = 0,05; k1=m=1, k2 = n – m – 1 = 8.
Уравнение регрессии с вероятностью 0,95 в целом статистически значимое, т.к