Собраны данные по 6-ти домохозяйствам зависимости ежемесячных расходов на образование (Study), тыс. руб. от ежемесячных доходов (Income), тыс. руб.
№ Study
Income
1 25 95
2 16 77
3 18 70
4 36 120
5 3 62
6 8 54
1) Постройте диаграмму рассеивания, сделайте предварительные выводы о направлении и силе связи между Study и Income.
2)Оцените регрессионную модель Studyi = β0 + β1 Incomei + ԑi. Найдите β0 и β1.
3)Добавьте на диаграмму рассеивания регрессионную линию.
4) Покажите на построенном в п.3 рисунке остаток для второго наблюдения
5) Проверьте значимость коэффициента β1.
6) Постройте доверительный интервал для коэффициента β1.
7) ***Рассчитайте коэффициент детерминации для полученной модели, дайте интерпретацию.
Решение
Зависимая переменная
Y – ежемесячные расходы на образование Study
Фактор
X – ежемесячный доход Income
1) Диаграмма рассеивания
Предварительно можно сделать вывод о том, что зависимость возрастающая, то есть с увеличением ежемесячного дохода Income будут увеличиваться расходы на образование Study. Связь между Income и Study похоже сильная.
2)
Коэффициенты β0 и β1 регрессионной модели
Study = β0 + β1 Income + ԑ
найдем по формулам
β1=X∙Y-X·YX2-X2
β0=Y-β1∙X
Вспомогательные расчеты сделаны в Excel
β1=1634,17-79,67·17,676835,67-79,672=0,464
β0=17,67-0,464∙79,67=-19,28
Уравнение регрессии
Study=-19,28+0,464*Income+ε
3)
Расчетные значения расходов на образование Y
Линия регрессии
4) Остаток для второго наблюдения e2 = 16 – 16,43 = 0,43
5) Значимость коэффициента 1
Оценивается с помощью t-критерия Стьюдента.
Стандартизированная ошибка 1
SEβ1=Yi-Yi2n-2*1(X-X)2
Yi-Yi2=70,479 (рассчитана ниже в пункте 7)
SEβ1=70,4796-2*12933,33=0,0775
Расчетное значение статистики Стьюдента
tрасч=β1SEβ1=0,4640,0775=5,98
На уровне значимости 5% критическое значение критерия Стьюдента для парной регрессии при числе степеней свободы = 6 – 2 = 4
tкрит= 2,78
Так как tрасч>tкрит , то коэффициент 1 значим на уровне 5%.
6) Доверительный интервал для коэффициента β1.
нижняя граница
0,464-2,78∙0,0775=0,249
верхняя граница
0,464+2,78∙0,0775=0,679
Интервал 0,249;0,679
7) Коэффициент детерминации, интерпретация.
R2=1-Yi-Yi2Yi-Y2
R2=1-70,479630,855=0,8995
89,95% дисперсии зависимой переменной Study объясняется уравнением регрессии.
Качество подгонки высокое.