Для 10 предприятий известны валовая продукция х и прибыль у, приходящаяся на одного работника, в тыс. руб. в год.
Номер предприятия Валовая продукция, тыс.руб.,
х Прибыль, приходящаяся на одного работника, тыс.руб.,
у
1 440 27
2 350 22
3 400 16
4 300 24
5 340 23
6 410 13
7 370 17
8 400 19
9 450 21
10 390 23
Требуется:
1. Методом наименьших квадратов оценить уравнение парной линейной регрессии у по х: . Дать экономическую интерпретацию параметров регрессии.
2. Оценить статистическую значимость параметров регрессии а и b с помощью t-статистики Стьюдента и путем расчета доверительного интервала для каждого из параметров (на уровне значимости = 0,05).
3. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
4. Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции .
5. Оценить качество уравнения при помощи коэффициента детерминации .
6. С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования.
7. Оценить с помощью средней ошибки аппроксимации качество уравнения.
8. Рассчитать прогнозное значение результата , если прогнозное значение фактора увеличится на 11% от его среднего уровня.
Определить доверительные интервалы прогноза для уровня значимости = 0,05.
9. Оценить полученные результаты, выводы оформить в аналитической записке.
Решение
Строим поле корреляции (диаграмму рассеивания), для чего на координатную плоскость Оху наносим точки с координатами (хi,уi) (рис.1).
Рис.1 – Поле корреляции
По виду точек на диаграмме делаем предположение об обратной слабой линейной зависимости между переменными х и у.
Уравнение линейной регрессии ищем в виде .
Для нахождения коэффициентов регрессии a и b воспользуемся методом наименьших квадратов, для чего составим расчетную таблицу 1.
Таблица 1 – Расчетная таблица для нахождения коэффициентов регрессии
i xi yi x2i y2i xiyi
1 440 27 193600 729 11880
2 350 22 122500 484 7700
3 400 16 160000 256 6400
4 300 24 90000 576 7200
5 340 23 115600 529 7820
6 410 13 168100 169 5330
7 370 17 136900 289 6290
8 400 19 160000 361 7600
9 450 21 202500 441 9450
10 390 23 152100 529 8970
Σ 3850 205 1501300 4363 78640
Средние 385 20,5 150130 436,3 7864
По данным таблицы 1 определяем следующие величины:
– выборочные средние:
– вспомогательные величины
– выборочные дисперсии и среднеквадратические отклонения:
Определим коэффициенты линейной зависимости у от х. Согласно методу наименьших квадратов они находятся по формулам
Поэтому коэффициенты регрессии будут равны
Тогда уравнение связи будет иметь вид .
Покажем линейную линию регрессии на графике исходных данных (рис.2).
Рис.2 – График линейной регрессии
Коэффициент а=26,26 линейной регрессии не имеет экономического смысла. Коэффициент b=-0,015 показывает, что при увеличении валовой продукции на 1 тыс.руб. прибыль, приходящаяся на одного работника в год, уменьшается в среднем на 0,015 тыс.руб.
2) Найдем остаточную дисперсию и стандартную ошибку регрессии соответственно по формулам
и ,
где – отклонения между выборочными значениями результативного признака и соответствующими значениями, полученными по уравнению регрессии; n=10 – количество наблюдений; m=1 – количество факторов.
Составим расчетную таблицу 2.
Таблица 2 – Расчетная таблица
i xi yi ei e2i |ei|/yi
1 440 27 19,677 7,323 53,624 0,271
2 350 22 21,024 0,976 0,953 0,044
3 400 16 20,276 -4,276 18,281 0,267
4 300 24 21,772 2,228 4,966 0,093
5 340 23 21,173 1,827 3,337 0,079
6 410 13 20,126 -7,126 50,780 0,548
7 370 17 20,724 -3,724 13,871 0,219
8 400 19 20,276 -1,276 1,627 0,067
9 450 21 19,528 1,472 2,168 0,070
10 390 23 20,425 2,575 6,630 0,112
Σ 3850 205 205 156,24 1,772
Средние 385 20,5 20,5 0,177
Используя данные таблицы 2, находим остаточную дисперсию
и стандартную ошибку регрессии
.
Определяем стандартные ошибки коэффициентов регрессии по формулам
где S – стандартная ошибка регрессии.
Получим
Вычислим наблюдаемые значения t-статистики для коэффициентов регрессии:
Для уровня значимости α=0,05 при степенях свободы ν=n–2=8 по таблице распределения Стьюдента находим критическое значение статистики
.
Так как , то коэффициент регрессии а – не значим (принимаем гипотезу о равенстве нулю этого коэффициента); поскольку , то коэффициент регрессии b – также не значим (принимаем гипотезу о равенстве нулю этого коэффициента).
Найдем доверительные интервалы для коэффициентов регрессии:
3) Вычислим коэффициент эластичности по формуле:
.
Коэффициент эластичности показывает, на сколько процентов изменится в среднем результативный признак, если факторный признак изменится на 1%.
Вычисленный коэффициент эластичности показывает, что с ростом валовой продукции в год (х) на 1% прибыль, приходящаяся на одного работника в год (у), уменьшается в среднем на 0,281%.
4) Оценим тесноту связи с помощью коэффициента корреляции:
.
Данное значение коэффициента корреляции позволяет судить об обратной слабой линейной зависимости между переменными х и у.
Проверим значимость коэффициента корреляции
. Для этого рассмотрим нулевую гипотезу о равенстве нулю генерального коэффициента корреляции между переменными х и у. Вычисляем наблюдаемое значение t-статистики:
Для уровня значимости α=0,05 при степенях свободы ν=n–2=8 по таблице распределения Стьюдента находим критическое значение статистики
.
Так как , то нулевая гипотеза о равенстве нулю генерального коэффициента корреляции принимается.
Таким образом, коэффициент корреляции статистически незначим.
5) Вычислим теперь коэффициент детерминации:
.
Коэффициент детерминации R2 показывает, что доля разброса зависимой переменной, объясняемая регрессией у на х, равна 2,7%, что говорит о том, что практически переменная у на 2,7% зависит от переменной х, остальные 97,3% вариации результативного признака обусловлены неучтенными факторами.
6) Для проверки значимости уравнения регрессии проверяем нулевую гипотезу о значимости коэффициента детерминации R2:
H0: R2=0
при конкурирующей гипотезе
H1: R2>0.
Для проверки данной гипотезы используем следующую F-статистику:
,
где
n=10 –количество наблюдений,
m=1 – количество оцениваемых коэффициентов регрессии.
Получим
.
Для проверки нулевой гипотезы при уровне значимости α=0,05 и числе степеней свободы ν1=m=1 и ν2=n–m–1=10–1–1=8 по таблице критических точек распределения Фишера находим критическое значение
Fкр.=Fα;m;n-m-1= F0,05;1;8=5,32.
Поскольку F<Fкр, то нулевая гипотеза принимается