Таблица 2. Экономический смысл показателей X и Y;
№ варианта Y X
7 число детей в семье общий доход семьи (в тысячах рублей)
№ Вариант 7
Y X
1 2 18
2 1 20
3 1 35
4 3 35
5 2 30
6 3 50
7 2 24
Задания.
1. Вычислите коэффициент корреляции, сделайте выводы по его знаку и абсолютному значению; оцените его статистическую значимость по критерию Стьюдента.
2. Постройте парную линейную регрессию, запишите эмпирическое и теоретическое уравнение.
3. Проинтерпретируйте значения математических ожиданий, средних квадратических отклонений и коэффициент регрессии.
4. Сделайте прогноз при x = x0. Значения x0 и его интерпретация приведены в третьей таблице для каждого варианта.
5. Оцените качество регрессии по значению коэффициента детерминации, критерию Фишера, средней ошибки аппроксимации.
Решение
1. Вычислите коэффициент корреляции, сделайте выводы по его знаку и абсолютному значению; оцените его статистическую значимость по критерию Стьюдента.
Таблица 1
Вспомогательные расчеты
18 2 36 324 4 1,494712 0,505288 0,255316 0,252644
20 1 20 400 1 1,576968 -0,57697 0,332892 0,576968
35 1 35 1225 1 2,19389 -1,19389 1,425372 1,19389
35 3 105 1225 9 2,19389 0,80611 0,649814 0,268703
30 2 60 900 4 1,988249 0,011751 0,000138 0,005875
50 3 150 2500 9 2,810811 0,189189 0,035793 0,063063
24 2 48 576 4 1,741481 0,258519 0,066832 0,12926
Итого 212 14 454 7150 32 14 -8,9E-16 2,766157 2,490403
Средние значения 30,2856 2 64,85714 1021,429 4,571429 2
10,208 0,756
104,204 0,571
Для анализа полученной модели вычислим коэффициент корреляции по формуле:
где ,
Вычислим :
Значения линейного коэффициента корреляции принадлежит промежутку [-1;1]. Связь между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
менее 0,1 отсутствует линейная связь0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
Для нашей задачи r =0,555, что указывает на заметную взаимосвязь между числом детей в семье и общим доходом семьи
. Положительная величина свидетельствует о прямой связи между изучаемыми признаками.
Оценку статистической значимости параметра корреляции проведем с помощью статистики Стьюдента.
Табличное значение критерия для числа степеней свободыи уровня значимости α = 0,05 составит tтабл = 2,57.
Далее рассчитываем его стандартные ошибки:.
Фактическое значение статистик
Фактическое значениестатистики не превосходит табличноезначение:,поэтому параметр случайно отличается от нуля, а статистически незначим.
2. Постройте парную линейную регрессию, запишите эмпирическое и теоретическое уравнение.
Теоретическое уравнение однофакторной линейной эконометрической модели записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Эмпирическим уравнением является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
3