Экономист, изучая зависимость уровня Y (тыс. руб.) издержек oбpaщения от объема X (тыс. руб.) товарооборота, обследовал по 10 магазинов, торгующих одинаковым ассортиментом товаров в 5 районах. Полученные данные отражены в таблице 3.
Задание
Для каждого из районов (в каждой задаче) требуется:
найти коэффициенты корреляции между X и Y ;
построить регрессионные функции линейной зависимости Y = a + b * X фактора Y от фактора X и исследовать их на надежность по критерию Фишера при уровне значимости 0,05;
найти коэффициент эластичности Y по X при среднем значении X ;
определить надежность коэффициентов регрессии по критерию Стьюдента:
найти доверительные интервалы для коэффициентов регрессии;
построить график регрессионной функции и диаграмму рассеяния;
используя полученное уравнение линейной регрессии, оценить ожидаемое среднее значение признака Y при X = 140 тыс. руб.
Таблица 3
12
X
тыс. руб. Y
тыс. руб.
84 4,2
60 4,9
110 7,2
130 9,1
120 6,4
50 3,9
90 5,1
150 8,4
70 3,5
125 8,7
Решение
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим :
Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
Следовательно, связь между признаком Y фактором X прямая, весьма высокая.
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
84 4,2 352,8 7056 17,64 5,28872
60 4,9 294 3600 24,01 3,91753
110 7,2 792 12100 51,84 6,77418
130 9,1 1183 16900 82,81 7,91684
120 6,4 768 14400 40,96 7,34551
50 3,9 195 2500 15,21 3,3462
90 5,1 459 8100 26,01 5,63152
150 8,4 1260 22500 70,56 9,0595
70 3,5 245 4900 12,25 4,48886
125 8,7 1087,5 15625 75,69 7,63117
Итого 989 61,4 6636,3 107681 416,98 61,4
Средние значения 98,9 6,14 663,63 10768,1 41,698 6,14
31,4148 1,9996
986,89 3,9984
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемобъема товарооборота на 1 тыс.руб
. уровень издержек обращения возрастает в среднем на 0,057тыс.руб.
Коэффициент детерминации:
.
Коэффициент детерминации характеризует долю вариации признака Y, объясненную линейным уравнением регрессии. Таким образом, в среднем 81% вариации уровня издержек обращения объясняется вариацией объема товарооборота, а 19% зависит от вариации не учтенных в модели факторов .
Фактическое значение Fфакт определяется по формуле:
Табличное значение Fфакт по таблице значений F-критерия Фишера при α = 0,05, k1 = m = 1 и k2 = n – m – 1 = 10 – 1 – 1 = 8 равно 5,32 (m – число параметров при переменной х).
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и показателя тесноты связи , то есть они статистически надежны и сформировались под неслучайным воздействием фактора х.
Найдем коэффициент эластичности Y по X при среднем значении X
Увеличение объема товарооборота (от своего среднего значения) на 1% увеличивает в среднем уровень издержек oбpaщения на 0,92%.
Оценку статистической значимости параметров регрессии икорреляции проведем с помощью статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение критерия для числа степеней свободыи уровня значимости α = 0,05 составит tтабл = 2,31.
Далее рассчитываем по каждому из параметров его стандартные ошибки: , и .
Фактическое значение статистик
, ,
Фактическое значение статистики превосходит табличноезначение:, поэтому параметр не случайно отличается от нуля, а статистически значим