В следующей выборке представлены данные по цене P некоторого товара и количеству (Q) данного товара, приобретаемому домохозяйством ежемесячно в течение года.
Месяц 1 2 3 4 5 6 7 8 9 10 11 12
P 10 20 15 25 30 35 40 35 25 40 45 40
Q 110 75 100 80 60 55 40 80 60 30 40 30
а) Постройте корреляционное поле и по его виду определите формулу зависимости между P и Q.
б) Оцените по МНК параметры уравнения линейной регрессии.
в) Оцените выборочный коэффициент корреляции.
г) Проверьте значимость уравнения регрессии на 5%-ном уровне по критерию Фишера.
д) Спрогнозируйте возможное количество приобретаемого товара при его цене 50 и постройте для него 95%-ный доверительный интервал.
Решение
А) Корреляционное поле, построенное по исходным данным представлено на рисунке 1.
Рис. 1. Корреляционное поле.
По виду корреляционного поля можно выдвинуть предположение о том, что исходные данные связаны обратной линейной зависимостью yi=b0+b1xi.
б) По МНК найдем параметры уравнения линейной регрессии.
Сделаем дополнительные расчеты:
i
P(xi) Q(yi) x2 xiyi
y2 e2 (y-yср)2
1 10 110 100 1100 12100
2 20 75 400 1500 5625
3 15 100 225 1500 10000
4 25 80 625 2000 6400
5 30 60 900 1800 3600
6 35 55 1225 1925 3025
7 40 40 1600 1600 1600
8 35 80 1225 2800 6400
9 25 60 625 1500 3600
10 40 30 1600 1200 900
11 45 40 2025 1800 1600
12 40 30 1600 1200 900
∑ 360 760 12150 19925 55750
Среднее 30 63,33 1012,5 1660,42 4645,83
b1=xy-xyx2-(x)2=1660,42-30×63,331012,5-302=-239,48112,5=-2,13
b0=y-b1x=63,33—(-2,13)×30=63,33+63,9=127,23
Уравнение регрессии имеет вид: y=127,23-2,13x.
Из полученных результатов следует, что при увеличении цены (Р), приобретаемое домохозяйством количество товара (Q) уменьшается в среднем на 2,13 ед. Коэффициент b0 = 127,23 формально показывает прогнозируемый уровень y, но только в том случае, если x=0 находится близко с выборочными значениями.
Но если x=0 находится далеко от выборочных значений x, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
График линии регрессии представлен на рисунке 2.
Рис
. 2. Линия регрессии.
в) Найдем выборочный коэффициент корреляции.
Рассчитаем показатель тесноты связи. Таким показателем является выборочный коэффициент корреляции, который рассчитывается по формуле:
rxy=xy-x×yx2-(x)2×y2-(y)2
rxy=1660,42-30×63,331012,5-302×4645,83-63,332=1660,42-1899,9112,5×635,14=-239,4810,61×25,2=-239,48267,37=-0,897
Линейный коэффициент корреляции принимает значения от -1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0,1<rxy<0,3:слабая;
0,3<rxy<0,5:умеренная;
0,5<rxy<0,7:заметная;
0,7<rxy<0,9:высокая;
0,9<rxy<1:весьма высокая.
В данном случае связь между признаком Y и фактором X высокая и обратная.
г) Оценка значимости построенного уравнения регрессии.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Коэффициент детерминации:
R2=1-i=112e2ii=112(yi-y)2=1-1493,9817616,667=0,804
Множественный коэффициент детерминации , показывает, что около 80,4% вариации зависимой переменной количество (Q) товара, приобретаемому домохозяйством ежемесячно учтено в модели и обусловлено влиянием включенного фактора цене P некоторого товара и на 19,6% — другими факторами, не включенными в модель.
Значение коэффициента детерминации свидетельствует о высоком качестве уравнения регрессии.
Оценку значимости уравнения регрессии проведем с помощью F-критерий Фишера:
Для определения табличного значения F-критерия при доверительной вероятности 0,05 и при и воспользуемся функцией FРАСПОБР