По четырнадцати страховым компаниям имеются данные, характеризующие зависимость чистой годовой прибыли от годовых размеров собственных средств, страховых резервов, страховых премий и страховых выплат (все в тыс. руб.):
№ компании Годовая прибыль Собственные средства Страховые резервы Страховые премии Страховые выплаты
1 92 3444 9563 11456 1659
2 42 2658 6354 5249 2625
3 186 9723 10245 12968 4489
4 48 4526 6398 7589 6896
5 38 5369 5692 7256 5698
6 74 2248 6359 4963 4321
7 48 5671 6892 7259 6692
8 82 4312 7256 6935 756
9 45 2226 8256 2693 5532
10 46 3654 5982 6324 3235
11 65 2635 6359 7853 5325
12 29 2463 7532 8253 6862
13 34 3265 5632 7564 6325
14 66 7546 7625 9638 4569
Требуется:
Построить линейную регрессионную модель годовой прибыли страховой компании, не содержащую коллинеарных факторов. Оценить параметры модели.
Значимы ли статистически уравнение регрессии и его коэффициенты?
Имеют ли остатки регрессии одинаковую дисперсию?
Приемлема ли точность регрессионной модели?
Дать экономическую интерпретацию коэффициентам уравнения регрессии.
Решение
Построить матрицу парных корреляций и обосновать выбор факторных признаков.
Вычислим матрицу коэффициентов парной корреляции, проверим значимость коэффициентов корреляции:
Для построения корреляционного анализа воспользуемся пакетом прикладных программ Microsoft Excel, функцией «Анализ данных».
Выполняем следующие действия:
Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
Выбрать команду «Сервис» → «Анализ данных».
В диалоговом окне «Анализ данных» выбрать инструмент «Корреляция», а затем щелкнуть кнопку «ОК».
В диалоговом окне «Корреляция» в поле «Входной интервал» необходимо ввести диапазон ячеек, содержащих исходные данные. Если введены и заголовки столбцов, то установить флажок «Метки в первой строке».
Выбрать параметры вывода. В данном случае «Новый рабочий лист».
«ОК»
Результаты корреляционного анализа
Рис.1
Анализ матрицы коэффициентов парной корреляции начнем с анализа первого столбца матрицы, в котором расположены коэффициенты корреляции, отражающие тесноту связи, зависимой годовая прибыль с включенными в анализ факторами. Анализ показывает, что зависимая переменная, то есть годовая прибыль, имеет тесную связь с собственными средствами (ryx1 = 0,662), со страховыми резервами (ryx2 = 0,752) и с страховыми премиями (ryx3 = 0,664) и умеренная связь со страховыми выплатами (ryx4 = - 0,343).
Оценим значимость коэффициентов корреляции первого столбца матрицы. Для этого рассчитаем значение t – статистики для всех элементов первого столбца:
Табличное значение критерия Стьюдента равно: tтабл (α = 0,05; k = n – 5 = 9) =2,26
. Сравним числовые значения критериев с табличным. Сделаем вывод, что tрасч > tтабл т.е. полученные значения коэффициентов корреляции значимы для всех факторов, за исключением фактора страховых выплат (ryx4 = - 0,343),.
Значимость коэффициентов корреляции можно проверить, используя критическое значение коэффициента корреляции. При условии, что нулевая гипотеза , критическое значение коэффициента корреляции определяется статистикой
где критическое значение t-статистики Стьюдента для уровня значимости и количества степеней свободы, равного n-2.
Так как в нашем примере критическое (табличное) значение критерия Стьюдента (α = 0,05; k = n – 2 = 9) равно 2,26, то критическое значение коэффициента корреляции будет равно 0,602. Коэффициенты парной корреляции страховых выплат в анализируемой матрице меньше значение 0,602 по абсолютной величине и следовательно будет не значимым, а все остальные коэффициенты парной корреляции в анализируемой матрице превышающие значение 0,602 по абсолютной величине будут значимы.
Один из подходов определения наличия или отсутствия мультиколлинеарности заключается в анализе матрицы коэффициентов парной корреляции. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7.
Факторы Х1 и Х3 тесно связаны между собой (= 0,68), что свидетельствует о наличии коллинеарности. Из этих двух переменных оставим Х1 – собственные средства, а Х3 будет исключен.
Таким образом, на основе анализа корреляционной матрицы для включения в модель регрессии остаются два фактора – относительный образовательный уровень населения, относительный возрастной показатель и относительная заработная плата (n = 14, k =3).
Построить модель множественной линейной регрессии со статистически значимыми факторами.
В качестве программного средства реализации анализа воспользуемся пакетом прикладных программ Microsoft Excel, функцией «Анализ данных», инструмент «Регрессия»