Изучается зависимость количество товаров
.pdf
Зарегистрируйся в 2 клика в Кампус и получи неограниченный доступ к материалам с подпиской Кампус+ 🔥
Изучается зависимость количество товаров, произведенных с дефектом (y), от объема сверхурочных часов (x) по 10 однородным заводам за 2014 год.
x 3,5 3,9 4,2 4,7 5,3 5,9 6,4 7,3 8,1 8,2
y 11,3 12,5 13,6 14,7 15,8 16,9 17,5 18,4 19,5 20,2
Необходимо:
1. Рассчитать параметры парной линейной регрессии.
2. Определить коэффициенты корреляции и детерминации.
3. Оценить модель через среднюю ошибку аппроксимации A и F-критерий Фишера.
4. Определить статистическую значимость параметров регрессии и корреляции.
Нужно полное решение этой работы?
Решение
Получаем эмпирические коэффициенты регрессии: b = 1,7154, a = 6,1764
Уравнение парной линейной регрессии имеет вид:
У = 6,18 + 1,72Х
С увеличением сверхурочной работы на 1 час количество товаров, произведенных с дефектом, повышается в среднем на 1,72.
Коэффициент корреляции составляет r = 0,985
ρxy=1-(y-yx)2y-y2=0,985
Коэффициент детерминации: ρxy2=0.985*0.985=0.9708
Т.е. в 97,08% случаев изменения объема сверхурочных часов приводят к изменению количества товаров, произведенных с дефектом. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 2,92% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
В нашем случае связь между количеством товаров, произведенных с дефектом (признаком Y) и объема сверхурочных часов (фактором X) весьма высокая и прямая, т.е
. с ростом сверхурочной работы растет количество дефектов.
Средняя ошибка аппроксимации:A=2,91%.
В среднем, расчетные значения количества товаров, произведенных с дефектом, отклоняются от фактических на 2,91%. Поскольку ошибка меньше 5%, то данное уравнение можно использовать в качестве регрессии.
Фактическое значение F-критерия Фишера F = 265,829.
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5,32.
Так как Fфакт> Fтабл, принимается гипотеза H1 о статистической значимости уравнения регрессии.
Оценка значимости коэффициента корреляции.
Выдвигаем гипотезы:
H0: rxy = 0, нет линейной взаимосвязи между переменными;
H1: rxy ≠ 0, есть линейная взаимосвязь между переменными.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области