Постройте поле корреляции результативного и факторного признака.
Оценить параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициентов полученной модели.
Рассчитайте коэффициент эластичности, сделайте вывод.
Оцените точность модели с помощью средней ошибки аппроксимации.
Рассчитайте стандартную ошибку оценки и возможные меры вариации
Рассчитайте линейный коэффициент парной корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
С вероятностью 0,95 оцените статистическую значимость параметров модели и уравнения регрессии в целом. Для коэффициентов уравнения регрессии постройте доверительные интервалы. Сделайте выводы.
Рассчитайте прогнозное значение результативного признака для заданного Х* и постройте 95% доверительный интервал для прогноза.
7. Администрация страховой компании приняла решение о введении нового вида услуг – страхования на случай пожара. С целью определения тарифов по выборке анализируется зависимость стоимости ущерба, нанесенного пожаром, от расстояния до ближайшей пожарной станции:
№ п/п 1 2 3 4 5 6 7 8 9 10
Общая сумма ущерба (млн.руб.) 25 38,9 68,1 75,4 91,4 55,3 40,7 79,3 88,8 19,1
Расстояние до ближайшей пожарной станции (км) 4,5 3,8 5,1 4,8 10,1 8,2 6,1 9,2 3,1 2,1
К заданию 8) Х* = 5,5.
Решение
Построим поле результативного и факторного признака.
Рис.1 Поле корреляции
По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует прямая, линейная связь, т.е. с ростом расстояния до ближайшей пожарной станции, общая сумма ущерба увеличивается.
Оценим параметры уравнения парной линейной регрессии и дайте интерпретацию коэффициентов полученной модели.
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
Номер региона
4,5 25 112,5 20,25 625 52,159
3,8 38,9 147,82 14,44 1513,21 48,636
5,1 68,1 347,31 26,01 4637,61 55,180
4,8 75,4 361,92 23,04 5685,16 53,669
10,1 91,4 923,14 102,01 8353,96 80,349
8,2 55,3 453,46 67,24 3058,09 70,785
6,1 40,7 248,27 37,21 1656,49 60,214
9,2 79,3 729,56 84,64 6288,49 75,819
3,1 88,8 275,28 9,61 7885,44 45,112
2,1 19,1 40,11 4,41 364,81 40,078
Сумма 57 582 3639,37 388,86 40068,26 582
Ср
. знач. 5,7 58,2 363,937 38,886 4006,826 58,2
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Параметр показывает, что с увеличением расстояния до ближайшей пожарной станции на 1 км. общая сумма ущерба увеличивается в среднем на 5,03 млн. руб.
Рассчитаем коэффициент эластичности, сформулируем вывод:
Вычисляем:
Увеличение расстояния до ближайшей пожарной станции (от своего среднегозначения) на 1% увеличивает в среднем общую сумму ущерба на 0,49%.
Оценим точность модели с помощью средней ошибки аппроксимации:
Найдем величину средней ошибки аппроксимации по формуле:
.
В среднем, расчетные значения отклоняются от фактических на 43,29% поскольку ошибка больше 7%, то данное уравнение нельзя использовать в качестве регрессии.
Рассчитайте стандартную ошибку оценки и возможные меры вариации
Определим RSS, TSS, ESS. Найдем оценку дисперсии ошибки модели.
– сумма квадратов остатков (Residual Sum of Squares);
— общая сумма квадратов (Total Sum of Squares);
— объясненная сумма квадратов (Explained Sum of Squares).
Таблица 2
Вспомогательные расчеты
Номер региона
25 52,159 737,627 1102,24 36,490
38,9 48,636 94,781 372,49 91,479
68,1 55,180 166,936 98,01 9,123
75,4 53,669 472,216 295,84 20,526
91,4 80,349 122,118 1102,24 490,591
55,3 70,785 239,780 8,41 158,378
40,7 60,214 380,779 306,25 4,054
79,3 75,819 12,119 445,21 310,420
88,8 45,112 1908,660 936,36 171,301
19,1 40,078 440,071 1528,81 328,412
Сумма 582 582 4575,086 6195,86 1620,774
;
.
При проведении регрессионного анализа основная трудность заключается в том, что генеральная дисперсия случайной ошибки является неизвестной величиной, что вызывает необходимость в расчёте её несмещённой выборочной оценки.
Несмещённой оценкой дисперсии (или исправленной дисперсией) случайной ошибки линейной модели парной регрессии называется величина, рассчитываемая по формуле:
где n – это объём выборочной совокупности;
еi– остатки регрессионной модели:
Рассчитайте линейный коэффициент парной корреляции и поясните его смысл