Компания, занимающаяся продажей радиоаппаратуры, установила на видеомагнитофон определенной модели цену, дифференцированную по регионам. Следующие данные показывают цены на видеомагнитофон в 8 различных регионах и соответствующее им число продаж:
Номер региона Число продаж, шт.,
y Цена, у.е,
x
1 410 5.5
2 370 6.1
3 350 6.5
4 400 6.2
5 440 5.0
6 380 5.7
7 440 4.5
8 410 5.0
1) Определите параметры уравнения парной линейной регрессии. Дайте интерпретацию найденных параметров и всего уравнения в целом.
2) Постройте теоретическую линию регрессии, совместив ее с полем корреляции. Сделайте выводы.
3) Рассчитайте линейный коэффициент корреляции и поясните его смысл. Определите коэффициент детерминации и дайте его интерпретацию.
4) С вероятностью 0,95 оцените статистическую значимость коэффициента регрессии и уравнения регрессии в целом. Сделайте выводы.
5) С вероятностью 0,95 постройте доверительный интервал для прогноза оценки yi и доверительный интервал генерального значения y при x* = 5,75.
6) Определите значение коэффициента эластичности и объясните его.
Решение
Проводится исследование зависимости числа продаж видеомагнитофонов (y) от цены (х) по статистическим данным выборки.
1)
Зависимая переменная y – число продаж, шт.
Фактор х – цена видеомагнитофона, у.е.
Диаграмма рассеивания:
По диаграмме можно сделать вывод, что между признаками наблюдается линейная убывающая связь.
Эта связь, то есть зависимость у от х описывается уравнением
у=b0+b1*x
Для оценки коэффициентов уравнения b0 и b1 применяют метод наименьших квадратов, он состоит в минимизации суммы квадратов отклонений фактических значений зависимой переменной yi от расчетных yi
yi-yi2=yi-(b0+b1xi)2b0,b1min
Чтобы решить задачу минимизации, то есть рассчитать b0 и b1, нужно составить и решить относительно b0 и b1 систему нормальных уравнений
nb0+b1∑xi = ∑yib0∑xi+b1∑xi2=∑xiyi
Решением системы являются
b1=∑xiyi-1n∙∑xi·∑yi∑xi2-1n∑xi2
b0=∑yin-b1∙∑xin
Расчеты проведены в Excel:
Уравнение регрессии
у=626,89-40,79*x
Коэффициент b1=-40,79 показывает, что при увеличении цены на видеомагнитофон (за 1 шт.) на 1 у.е
. количество проданных единиц (число продаж y) снижается на 40,79 шт. в среднем.
Коэффициент b0=626,89 интерпретировать можно так: если бы цена на видеомагнитофон (за 1 шт.) была равна 0 у.е., мы бы “продали” 626,89 штук в среднем (то есть отдали бы даром).
2)
Найдем прогнозные значения yi и построим теоретическую линию регрессии.
Можно сделать вывод о том, что модель адекватна исходным данным.
3)
Рассчитаем следующие суммы квадратов
Общая сумма квадратов (общая дисперсия)
Qобщ=yi-y2
Сумма квадратов остатков (остаточная дисперсия)
Qост=yi-yi2
Сумма квадратов, объясненная регрессией
Qрегр=yi-y2
Коэффициент детерминации показывает долю дисперсии зависимой переменной у, объясненную уравнением и является мерой адекватности построенной модели.
Формула расчета
R2=1-QостQобщ
R2=1-1611,917200=0,7761
77,61% дисперсии количества проданных единиц видеомагнитофонов объяснено построенной моделью. Так как процент высокий, модель адекватно описывает исходные данные.
Линейный коэффициент корреляции является мерой линейной зависимости между зависимой переменной у и фактором х.
Формула расчета
R=R2
R=0,7761=0,88
Так как R > 0,7 то связь между признаками сильная.
4)
Для оценки значимости уравнения регрессии рассчитаем F-статистику
Fнабл=Qрегр1Qост(n-2)=5588,091611,91/6=20,8
Критическое значение распределения Фишера при уровне значимости = 0,05 и числе степеней свободы k1 = 1 и k2 = n – 2 найдем функцией Excel FРАСПОБР с параметрами (0,05;1;8-2)
Fкрит=5,987
Так как Fнабл > Fкрит, то уравнение признается значимым с вероятностью 95%.
Статистическая значимость коэффициентов регрессии проверяется критерием Стьюдента.
Сначала вычисляются стандартизированные ошибки коэффициентов регрессии
Sb0=Qостn-2*x2n*x-x2
Sb1=Qостn-2*1(x-x)2
Далее t-статистики коэффициентов
tb0=b0Sb0
tb1=b1Sb1
Далее критическое значение распределения Стьюдента при уровне значимости = 0,05 и числе степеней свободы k = n – 2 функцией Excel
tкрит= СТЬЮДРАСПОБР(0,05; 8-2)
Расчеты с помощью Excel
Так как расчетные t-статистики по модулю больше чем критическое значение распределения Стьюдента:
tb0>tкрит
tb1>tкрит
то оба коэффициента b0 и b1 значимы с вероятностью 95%.
Интервальные оценки генеральных параметров β0 и β1
b0-tкрит*Sb0<β0<b0+tкрит*Sb0
b1-tкрит*Sb1<β1<b1+tкрит*Sb1
С доверительной вероятностью 95% параметры попадают в интервалы:
β0∈(504,34;749,44)
β1∈-62,67;-18,91
5)
По уравнению у=626,89-40,79*x
точечный прогноз зависимой переменной y (число проданных видеомагнитофонов, шт.) при цене x* = 5,75 у.е.
y*=626,89-40,79*5,75=392,35
Стандартная ошибка прогноза
Sy*=Qостn-2∙1+1n+(x*-x)2(x-x)2
Интервальный прогноз зависимой переменной Y
y*-tкрит*Sy*<Y*<y*+tкрит*Sy*
С доверительной вероятностью 95% число проданных видеомагнитофонов Y при цене 5,75 у.е