Оценивается зависимость количества продаваемых чебуреков qch от цены на чебуреки pch, цены на шаурму psh, цены на мороженое pmor, цены на пончики ppon и цены на сахарную вату psah в виде линейной регрессии:
qchi=α+β1∙pchi+β2∙pshi+β3∙pmori+β4∙pponi+β5∙psahi+εi
В программе MS Excel оценена данная регрессия, а также несколько вспомогательных регрессий:
(a) На уровне значимости 10 % протестируйте на значимость регрессию
qchi=α+β1∙pchi+β2∙pshi+β3∙pmori+β4∙pponi+β5∙psahi+εi
В терминах коэффициентов модели укажите основную и альтернативную гипотезы.
Приведите формулу тестовой статистики.
Укажите распределение тестовой статистики.
Рассчитайте наблюдаемое значение тестовой статистики.
Укажите область, в которой гипотеза H0 не отвергается.
Сделайте статистический вывод.
(b) На уровне значимости 10 % протестируйте гипотезу о том, что группа переменных «цена на мороженое», «цена на пончики» и «цена на сахарную вату» не оказывает влияние на количество продаваемых чебуреков.
В терминах коэффициентов модели укажите основную и альтернативную гипотезы.
Приведите формулу тестовой статистики.
Укажите распределение тестовой статистики.
Рассчитайте наблюдаемое значение тестовой статистики.
Укажите область, в которой гипотеза H0 не отвергается.
Сделайте статистический вывод.
Решение
Анализ “длинной” регрессии
qchi=α+β1∙pchi+β2∙pshi+β3∙pmori+β4∙pponi+β5∙psahi+εi
МножественныйR – коэффициент корреляции, показывает тесноту связи в уравнении. Равен 0,92 – значит связь тесная.
R-квадрат – коэффициент детерминации, равен 0,85 (то есть 85%) – 85% полной вариации переменной qch объясняется оцененным уравнением с факторами pch, psh, pmor, ppon и psah.
Уравнение по коэффициентам
qch=402,87-6,11∙pch+4,17∙psh-3,20∙pmor+1,02∙ppon-0,76∙psah
Выберем уровень значимости 0,1 (10%).
По P-значениям коэффициентов с надежностью 90% сделаем вывод о том, что факторы pmor, ppon и psah незначимы, то есть не оказывают влияния на qch, так как P-значения > 0,1 (10%) для этих факторов
Ответы:
(a) На уровне значимости = 10 % протестируем на значимость регрессию qch=402,87-6,11∙pch+4,17∙psh-3,20∙pmor+1,02∙ppon-0,76∙psah
Проверка значимости регрессии “в целом” сводится к проверке гипотезы о том, что коэффициенты этой модели все вместе не равны нулю, то есть в модели присутствует хотя бы один значимый фактор.
Основная гипотеза H0=β1=0β2=0β3=0β4=0β5=0
(все коэффициенты при факторах равны нулю, т.е. регрессия в целом незначима)
Альтернативная гипотеза H1=β1≠0β2≠0β3≠0β4≠0β5≠0
(хотя бы один из коэффициентов при факторе не равен нулю, т.е. регрессия в целом значима)
Тестовая статистика рассчитывается по формуле
T=R21-R2∙n-k-1k
n – объем выборки
k = 5 – количество факторов (pch, psh, pmor, ppon и psah)
R2 – коэффициент детерминации
Укажите распределение тестовой статистики.
Тестовая статистика имеет F-распределение Фишера
T~F(k,n-k-1)
Наблюдаемое значение тестовой статистики рассчитаем, подставляя в формулу тестовой статистики
T=R21-R2∙n-k-1k
параметры найденного уравнения
Коэффициент детерминации R2=0,85
Объем выборки n = 21 (выведен в табл
. “Регрессионная статистика” в строке Наблюдения)
Количество факторов k = 5 (pch, psh, pmor, ppon и psah)
Tнабл=0,851-0,85∙21-5-15=17
Область, в которой нет оснований отвергать основную гипотезу H0
0;Tкрит
Tкрит – критическое значение F-распределения Фишера
Tкрит=F(k,n-k-1)
На заданном уровне значимости = 10 %
Tкрит = F ( 5, 21-5-1 ) = FРАСПОБР ( ; 5; 21-5-1 ) =
= FРАСПОБР ( 0,1; 5; 21-5-1 ) = 2,273
Следовательно, критическая область 0;Tкрит=0;2,273
Сделаем статистический вывод
Сравнение значения тестовой статистики с критическим значением проводится так:
Если Tнабл∈0;Tкрит то с выбранной надежностью нет оснований отвергнуть основную гипотезу в пользу альтернативной, делаем вывод, что
β1=0β2=0β3=0β4=0β5=0
и регрессия в целом незначима.
Если Tнабл0;Tкрит то с надежностью основная гипотеза отвергается в пользу альтернативной, делаем вывод, что хотя бы один из коэффициентов βi≠0 , то есть регрессия в целом значима.
В нашей задаче Tнабл=17 , Tкрит=2,273 , Tнабл0;Tкрит следовательно отвергаем нулевую (основную) гипотезу
H0=β1=0β2=0β3=0β4=0β5=0
и принимаем альтернативную
H1=β1≠0β2≠0β3≠0β4≠0β5≠0
то есть делаем вывод от том, что регрессия “в целом” значима.
(b) На уровне значимости = 10% протестируем гипотезу о том, что группа переменных «цена на мороженое», «цена на пончики» и «цена на сахарную вату» не оказывает влияния на количество продаваемых чебуреков.
Рассмотрим модель регрессии без ограничений (UR-модель), то есть зависимость количества продаваемых чебуреков qch от пяти факторов: цены на чебуреки pch, цены на шаурму psh, цены на мороженое pmor, цены на пончики ppon и цены на сахарную вату psah
qchi=α+β1∙pchi+β2∙pshi+β3∙pmori+β4∙pponi+β5∙psahi+εi
Результаты анализа этой модели
Остаточная дисперсия ESSUR = 6615,99 (строка Остаток на пересечении со столбцом SS в таблице Дисперсионный анализ)
Рассмотрим модель регрессии с ограничениями (R-модель), считая в “длинной” модели β3=0 β4=0 и β5=0, то есть зависимость количества продаваемых чебуреков qch от двух факторов: цены на чебуреки pch и цены на шаурму psh (цена на мороженое pmor, цена на пончики ppon и цена на сахарную вату psah не влияют на количество продаваемых чебуреков)
qchi=α+β1∙pchi+β2∙pshi+εi
Результаты регрессионного анализа по ней
Остаточная дисперсия ESSR = 6962,48
Основная и альтернативная гипотезы в терминах коэффициентов модели
основная гипотеза H0=β3=0β4=0β5=0
(все коэффициенты “длинной” модели при факторах pmor, ppon и psah вместе равны нулю)
альтернативная гипотеза H1=β3=0β4=0β5=0
(хотя бы один из коэффициентов “длинной” модели при факторах pmor, ppon и psah не равен нулю)
Тестовая статистика рассчитывается по формуле
T=(ESSR-ESSUR)/qESSUR/(n-k-1)
n – объем выборки
k – количество факторов в модели без ограничений
q – количество ограничений
ESSUR – остаточная дисперсия в модели без ограничений
ESSR – остаточная дисперсия в модели с ограничениями
Укажите распределение тестовой статистики.
Тестовая статистика имеет F-распределение Фишера
T~F(q,n-k-1)
Наблюдаемое значение тестовой статистики рассчитаем, подставляя в формулу тестовой статистики
Tнабл=(ESSR-ESSUR)/qESSUR/(n-k-1)
параметры “длинной” и “короткой” регрессий
объем выборки n = 21
количество факторов в модели без ограничений k = 5 (pch, psh, pmor, ppon и psah)
количество ограничений (ограничения на коэффициенты β3=0 β4=0 и β5=0 ) q = 3
остаточная дисперсия в модели без ограничений ESSUR = 6615,99
остаточная дисперсия в модели с ограничениями ESSR = 6962,48
Tнабл=(6962,48-6615,99)/36615,99/(21-5-1)=0,262
Область, в которой нет оснований отвергать основную гипотезу H0
0;Tкрит
Tкрит – критическое значение F-распределения Фишера
Tкрит=F(q,n-k-1)
На заданном уровне значимости = 10 %
Tкрит = F ( 3, 21-5-1 ) = FРАСПОБР ( ; 5; 21-5-1 ) =
= FРАСПОБР ( 0,1; 3; 21-5-1 ) = 2,49
Следовательно, критическая область 0;Tкрит=0;2,49
Сделаем статистический вывод
Сравнение значения тестовой статистики с критическим значением проводится так:
Если Tнабл∈0;Tкрит то с выбранной надежностью нет оснований отвергнуть основную гипотезу в пользу альтернативной, cделаем вывод, что
β3=0β4=0β5=0
то есть все коэффициенты при факторах pmor, ppon и psah вместе равны нулю и эта группа факторов не оказывает влияния на зависимую переменную qch.
Если Tнабл0;Tкрит то с надежностью основная гипотеза отвергается в пользу альтернативной, делаем вывод, что хотя бы один из коэффициентов β3 или β4 или β5≠0 , то есть хотя бы один из факторов pmor, ppon и psah оказывает влияние на зависимую переменную qch.
В нашей задаче Tнабл=0,262 , Tкрит=2,49 , Tнабл∈0;Tкрит следовательно на уровне значимости 10% (то есть с надежностью 90%) нет оснований отвергнуть нулевую (основную) гипотезу.
Следовательно, с надежностью 90% делаем вывод, что группа переменных «цена на мороженое», «цена на пончики» и «цена на сахарную вату» не оказывает влияния на количество продаваемых чебуреков qch, и эти переменные должны быть исключены из уравнения регрессии.