Экономист, изучая зависимость уровня Y (тыс. руб.) издержек обращения от объема X (тыс. руб.) товарооборота, обследовал по 10 магазинов, торгующих одинаковым ассортиментом товаров в 5 районах. Полученные данные отражены в таблице 1.
Задание
Для каждого из районов (в каждой задаче) требуется:
найти коэффициенты корреляции между X и Y;
построить регрессионную функцию линейной зависимости Y = a + b * X фактора Y от фактора X и исследовать ее на надежность по критерию Фишера при уровне значимости 0,05;
найти коэффициент эластичности Y по X при среднем значении X;
определить надежность коэффициентов регрессии по критерию Стьюдента:
найти доверительные интервалы для коэффициентов регрессии;
построить график регрессионной функции и диаграмму рассеяния;
используя полученное уравнение линейной регрессии, оценить ожидаемое среднее значение признака Y при X = 130 тыс. руб.
Таблица 1
4
X
тыс. руб. Y
тыс. руб.
50 4,2
130 10,8
100 9,6
80 5,1
90 7,4
70 6,2
150 11,4
60 3,3
140 12,2
110 10,5
Решение
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим :
Линейный коэффициент корреляции принимает значения от –1 до +1. Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
Следовательно, связь между признаком Y фактором X прямая, весьма высокая.
Рассчитаем параметры линейной парной регрессии от :
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
50 4,2 210 2500 17,64 3,777273
130 10,8 1404 16900 116,64 10,93182
100 9,6 960 10000 92,16 8,248864
80 5,1 408 6400 26,01 6,460227
90 7,4 666 8100 54,76 7,354545
70 6,2 434 4900 38,44 5,565909
150 11,4 1710 22500 129,96 12,72045
60 3,3 198 3600 10,89 4,671591
140 12,2 1708 19600 148,84 11,82614
110 10,5 1155 12100 110,25 9,143182
Итого 980 80,7 8853 106600 745,59 80,7
Средние значения 98 8,07 885,3 10660 74,559 8,07
32,49615 3,071498
1056 9,4341
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Параметр регрессии позволяет сделать вывод, что с увеличениемобъема товарооборота на 1 тыс.руб
. уровень издержек обращения возрастает в среднем на 0,089 тыс.руб.
Коэффициент детерминации:
.
Коэффициент детерминации характеризует долю вариации признака Y, объясненную линейным уравнением регрессии. Таким образом, в среднем 89,5% вариации уровня издержек обращения объясняется вариацией объема товарооборота, а 10,5% зависит от вариации не учтенных в модели факторов .
Фактическое значение Fфакт определяется по формуле:
Табличное значение Fфакт по таблице значений F-критерия Фишера при α = 0,05, k1 = m = 1 и k2 = n – m – 1 = 10 – 1 – 1 = 8 равно 5,318 (m – число параметров при переменной х).
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и показателя тесноты связи , то есть они статистически надежны и сформировались под неслучайным воздействием фактора х.
Найдем коэффициент эластичности Y по X при среднем значении X:
Увеличение объема товарооборота (от своего среднегозначения) на 1% увеличивает в среднем уровень издержек обращения на 1,09%.
Оценку статистической значимости параметров регрессии икорреляции проведем с помощью статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Табличное значение критерия для числа степеней свободыи уровня значимости α = 0,05 составит tтабл = 2,31.
Далее рассчитываем по каждому из параметров его стандартные ошибки: , и .
Фактическое значение статистик
, ,
Фактическое значение статистики превосходит табличноезначение:, поэтому параметр не случайно отличается от нуля, а статистически значим