Данные:
Бюджетное обследование 10 случайным образом отобранных семей дало следующие результаты:
Номер семьи 1 2 3 4 5 6 7 8 9 10
Реальный доход семьи (т.руб.) 6.0 3 5 6 4 7 7 7 6 4
Реальный расход семьи на продовольственные товары (т.руб.) 3,5 3 2 4 1.8 2,2 6,2 3,3 3.6 2,3
Условия:
Выполнить экономический анализ задачи и сделать выводы, что вы выбираете в качестве изучаемого показателя (У), и что в качестве влияющего (Х). Постройте поле корреляции результата и фактора и сформулируйте гипотезу о форме связи.
Определить выборочный коэффициент корреляции и поясните его смысл. Сделать вывод о силе линейной зависимости между переменными и .
Оценить параметры парной линейной регрессионной модели методом наименьших квадратов. Дать экономическую интерпретацию найденных коэффициентов.
Определить RSS, TSS, ESS. Найти оценку дисперсии ошибки модели.
Определить стандартные ошибки коэффициентов регрессии.
Определите коэффициент детерминации и дайте его интерпретацию.
Построить 95%-ые доверительные интервалы для коэффициентов регрессии.
На уровне значимости 0,05 оцените статистическую значимость коэффициента регрессии b. Сделайте выводы.
На уровне значимости 0,05 оцените статистическую значимость уравнения регрессии в целом. Сделайте выводы.
10.С вероятностью 0,95 постройте доверительный интервал ожидаемого значения результативного признака, если факторный признак увеличится на 5% от своего среднего значения.
Решение
1.Выбираем в качестве изучаемого показателя (У) реальные доходы семьи, в качестве влияющего (Х) реальный расход семьи на продовольственные товары. Построим поле корреляции результата и фактора и сформулируйте гипотезу о форме связи.
Рис.1. Поле корреляции
На основе анализа поля рассеяния выдвигаем гипотезу о том, что зависимость реальных доходов семьи от реальных расходов семьи на продовольственные товары описывается линейной регрессионной моделью.
2. Определим выборочный коэффициент корреляции:
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
В нашем примере связь между реальными доходами семьи и реальными расходами семьи на продовольственные товары умеренная и прямая.
3.Рассчитаем параметры уравнений линейной регрессии.
Для расчета заполним таблицу:
Таблица 1
Номер семьи х
у y(x)
1 3,50 6,00 12,25 36,00 21,00 5,67
2 3,00 3,00 9,00 9,00 9,00 5,40
3 2,00 5,00 4,00 25,00 10,00 4,84
4 4,00 6,00 16,00 36,00 24,00 5,95
5 1,80 4,00 3,24 16,00 7,20 4,73
6 2,20 7,00 4,84 49,00 15,40 4,95
7 6,20 7,00 38,44 49,00 43,40 7,18
8 3,30 7,00 10,89 49,00 23,10 5,56
9 3,60 6,00 12,96 36,00 21,60 5,73
10 2,30 4,00 5,29 16,00 9,20 5,00
Сумма 31,90 55,00 116,91 321,00 183,90 55,01
Рассчитаем коэффициенты линейного уравнения регрессии методом наименьших квадратов. Для этого составляем систему нормальных уравнений и находим ее решение:
Решением этой системы являются числа: а=3,721, b=0,558
Получили уравнение регрессии:
. у = 3,721+0,558х
С увеличением на 1 т.руб. реальных расходов семьи на продовольственные товары реальные доходы семьи повышаются в среднем на 0,558.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая.
4.Определим RSS, TSS, ESS. Найдем оценку дисперсии ошибки модели.
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
Таблица 2
x y y(x) (yi-ycp)2 (y-y(x))2 (xi-xcp)2 |y - yx|:y
3 5 5.192 0.185 0.0367 0.0625 0.0383
2.6 4.5 4.81 0.865 0.0962 0.423 0.0689
1.5 4.2 3.761 1.513 0.193 3.063 0.104
3.4 7.5 5.573 4.285 3.713 0.0225 0.257
1.8 3.5 4.047 3.725 0.3 2.103 0.156
5 6.2 7.099 0.593 0.808 3.063 0.145
5.2 7.7 7.29 5.153 0.168 3.803 0.0533
4.3 6 6.431 0.325 0.186 1.103 0.0719
3.6 5.9 5.764 0.221 0.0186 0.123 0.0231
2.1 3.8 4.333 2.657 0.284 1.323 0.14
32.5 54.3 54.3 19.521 5.804 15.085 1.059
TSS ESS RSS
RSS= TSS - ESS =18.500-4.713=13.787
Несмещенной оценкой дисперсии возмущений является величина:
S2 = 1.723 - необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии).
S = 1.313 - стандартная ошибка оценки.
5.Определим стандартные ошибки коэффициентов регрессии.
Стандартная ошибка регрессии рассматривается в качестве меры разброса данных наблюдений от смоделированных значений. Чем меньше значение стандартной ошибки регрессии, тем качество модели выше.
Sa - стандартное отклонение случайной величины a