Постройте поле корреляции результативного и факторного признака.
Оценить параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициентов полученной модели.
Рассчитайте коэффициент эластичности, сделайте вывод.
Оцените точность модели с помощью средней ошибки аппроксимации.
Рассчитайте стандартную ошибку оценки и возможные меры вариации
Рассчитайте линейный коэффициент парной корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
С вероятностью 0,95 оцените статистическую значимость параметров модели и уравнения регрессии в целом. Для коэффициентов уравнения регрессии постройте доверительные интервалы. Сделайте выводы.
Рассчитайте прогнозное значение результативного признака для заданного Х* и постройте 95% доверительный интервал для прогноза.
2. Имеются данные по 12 группам населения о среднегодовом доходе и уровне потребления мяса жителями штата Канзас (США):
№ п/п 1 2 3 4 5 6 7 8 9 10 11 12
Среднегодовой доход в среднем по группе, тыс. дол. 41,5 29,6 31,8 69,8 100,5 93,3 82,1 77,4 55,7 38,9 45,2 60,2
Годовое потребление мяса на душу населения в среднем по группе, кг. 41,2 35,3 40,7 55,1 80,1 65,9 64,2 70,5 61,1 51,7 59,4 65,8
К заданию 8) Х* = 51,4.
Решение
Построим поле результативного и факторного признака.
Рис.1 Поле корреляции
По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует прямая, линейная связь, т.е. с ростом среднегодового дохода, увеличивается и уровень потребления мяса жителями штата Канзас (США).
Оценим параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициентов полученной модели.
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
Номер региона
41,5 41,2 1709,8 1722,25 1697,44 48,420
29,6 35,3 1044,88 876,16 1246,09 42,681
31,8 40,7 1294,26 1011,24 1656,49 43,742
69,8 55,1 3845,98 4872,04 3036,01 62,069
100,5 80,1 8050,05 10100,25 6416,01 76,875
93,3 65,9 6148,47 8704,89 4342,81 73,402
82,1 64,2 5270,82 6740,41 4121,64 68,001
77,4 70,5 5456,7 5990,76 4970,25 65,734
55,7 61,1 3403,27 3102,49 3733,21 55,268
38,9 51,7 2011,13 1513,21 2672,89 47,166
45,2 59,4 2684,88 2043,04 3528,36 50,204
60,2 65,8 3961,16 3624,04 4329,64 57,439
Сумма 726 691 44881,4 50300,78 41750,84 691
Ср
. знач. 60,5 57,58 3740,12 4191,73 3479,24 57,58
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Параметр показывает, что с увеличением среднегодового дохода на 1 тыс. дол. уровень потребления мяса жителями штата Канзас (США) увеличивается в среднем на 0,48 кг.
Рассчитаем коэффициент эластичности, сформулируем вывод:
Вычисляем:
Увеличение среднегодового дохода (от своего среднего значения) на 1% увеличивает в среднем уровень потребления мяса жителями штата Канзас (США) на 0,51%.
Оценим точность модели с помощью средней ошибки аппроксимации:
Найдем величину средней ошибки аппроксимации по формуле:
.
В среднем, расчетные значения отклоняются от фактических на 11,1% поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.
Рассчитайте стандартную ошибку оценки и возможные меры вариации
Определим RSS, TSS, ESS. Найдем оценку дисперсии ошибки модели.
– сумма квадратов остатков (Residual Sum of Squares);
— общая сумма квадратов (Total Sum of Squares);
— объясненная сумма квадратов (Explained Sum of Squares).
Таблица 2
Вспомогательные расчеты
Номер региона
41,2 48,420 52,128 268,414 83,968
35,3 42,681 54,476 496,547 222,087
40,7 43,742 9,252 285,047 191,588
55,1 62,069 48,561 6,167 20,117
80,1 76,875 10,403 507,000 372,156
65,9 73,402 56,284 69,167 250,238
64,2 68,001 14,445 43,780 108,521
70,5 65,734 22,715 166,840 66,432
61,1 55,268 34,008 12,367 5,359
51,7 47,166 20,557 34,614 108,521
59,4 50,204 84,559 3,300 54,449
65,8 57,439 69,912 67,514 0,021
Сумма 691 691 477,30 1960,76 1483,46
;
.
При проведении регрессионного анализа основная трудность заключается в том, что генеральная дисперсия случайной ошибки является неизвестной величиной, что вызывает необходимость в расчёте её несмещённой выборочной оценки.
Несмещённой оценкой дисперсии (или исправленной дисперсией) случайной ошибки линейной модели парной регрессии называется величина, рассчитываемая по формуле:
где n – это объём выборочной совокупности;
еi– остатки регрессионной модели:
Рассчитайте линейный коэффициент парной корреляции и поясните его смысл