Выполнить экономический анализ задачи и сделать выводы, что вы выбираете в качестве изучаемого показателя (У), и что в качестве влияющего (Х). Постройте поле корреляции результата и фактора и сформулируйте гипотезу о форме связи.
Определить выборочный коэффициент корреляции и поясните его смысл. Сделать вывод о силе линейной зависимости между переменными и .
Оценить параметры парной линейной регрессионной модели методом наименьших квадратов. Дать экономическую интерпретацию найденных коэффициентов.
Определить RSS, TSS, ESS. Найти оценку дисперсии ошибки модели.
Определить стандартные ошибки коэффициентов регрессии.
Определите коэффициент детерминации и дайте его интерпретацию.
Построить 95%-ые доверительные интервалы для коэффициентов регрессии.
На уровне значимости 0,05 оцените статистическую значимость коэффициента регрессии b. Сделайте выводы.
На уровне значимости 0,05 оцените статистическую значимость уравнения регрессии в целом. Сделайте выводы.
С вероятностью 0,95 постройте доверительный интервал ожидаемого значения результативного признака, если факторный признак увеличится на 5% от своего среднего значения.
Задача.Имеются данные
Во время недавних переговоров между работниками и руководством представители профсоюза пожаловались на слабость управления, выражающуюся в потерях времени из-за нехватки материалов и выхода оборудования из строя. В настоящее время в компании действует система оплаты труда, согласно которой до 25% заработной платы работника формируется за счёт дополнительных начислений по результатам производительности труда. Участники переговоров со стороны профсоюза сделали упор на то, что работники теряют в заработной плате не по своей вине. Для подтверждения этого они представили данные по средним суммам начислений за производительность труда группе из 50 работников в сравнении с временными потерями за период в 10 недель.
Неделя Средняя сумма начислений за производительность труда (ф. ст.) Потери производственного времени (%)
1 40 8
2 35 6
3 20 10
4 25 11
5 45 5
6 60 4
7 75 4
8 40 6
9 20 12
10 50 8
Решение
Выполним экономический анализ задачи и сделаем выводы, что вы выбираем в качестве изучаемого показателя (Y), и что в качестве влияющего (Х). Построим поле корреляции результата и фактора и сформулируем гипотезу о форме связи.
В качестве зависимой переменной выступает Средняя сумма начислений за производительность труда (Y), а независимая – Потери производственного времени (Х).
Построим поле корреляции и сформулировать гипотезу о форме связи:
Рис.1 Поле корреляции
По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует обратная, линейная связь.
Определим выборочный коэффициент корреляции и поясним его смысл. Сделаем вывод о силе линейной зависимости между переменными и .
Линейный коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Его можно определить по следующей формуле:
,
где ;
Вычислим :
Значения линейного коэффициента корреляции принадлежит промежутку [-1;1]. Связь между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
менее 0,1 отсутствует линейная связь0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X высокая, тесная, прямая линейная.
Для нашей задачи r = – 0,843, что подтверждает вывод, сделанный ранее, что связь между признаками обратная, а также указывает на высокую взаимосвязь между потерями производственного времени и средней суммой начислений за производительность труда
. Отрицательная величина свидетельствует о обратной связи между изучаемыми признаками
Оценим параметры парной линейной регрессионной модели методом наименьших квадратов. Выполним экономическую интерпретацию найденных коэффициентов.
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
Номер региона
8 40 320 64 1600 37,90323
6 35 210 36 1225 48,22581
10 20 200 100 400 27,58065
11 25 275 121 625 22,41935
5 45 225 25 2025 53,3871
4 60 240 16 3600 58,54839
4 75 300 16 5625 58,54839
6 40 240 36 1600 48,22581
12 20 240 144 400 17,25806
8 50 400 64 2500 37,90323
Сумма 74 410 2650 622 19600 410
Ср. знач. 7,4 41 265 62,2 1960 41
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Параметр показывает, что с увеличением потери производственного времени на 1 % средняя сумма начислений за производительность труда снизится в среднем на 5,161 (ф