X -1 0 1 2 3 4
y 5,5 6 6,5 7,5 8 8
1. Для характеристики зависимости Y от X проверить справедливость дисперсионного анализа.
2. Рассчитать уравнение линейной регрессии.
3. Рассчитать:
- коэффициент линейной корреляции;
- среднюю относительную ошибку;
- коэффициент детерминации;
- F-критерий Фишера.
4. Рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличивается на 110% относительно среднего уровня.
5. Результат расчётов отобразить на графике.
Решение
1. Для характеристики зависимости Y от X проверим справедливость дисперсионного анализа. Для этого выделим две группы по Х: до 1 и свыше 1.
Получаем:
Х До 1 Свыше 1
Y 5,5 7,5
6 8
6,5 8
∑ 18 23,5
Yср 6 7,833
Обозначим р - количество уровней фактора (р=2). Число измерений на каждом уровне одинаково и равно q=3.
В последней строке помещены групповые средние для каждого уровня фактора. Общая средняя вычисляется по формуле:
.
Для расчета Sобщ составляем таблицу 2 квадратов вариант:
N
1 30.25 56.25
2 36 64
3 42.25 64
∑ 108.5 184.25
Sобщ = 108.5 + 184.25 - 3 • 2 • 6.922 = 5.71
Находим факторную сумму квадратов Sф:
Sф = 3(62 + 7.832 - 2 • 6.922) = 5.04
Получаем остаточную сумму квадратов Sост:
Sост = Sобщ - Sф = 5.71 - 5.04 = 0.67.
Определяем факторную дисперсию:
Определяем остаточную дисперсию:
.
С целью оценки влияния фактора на изменения рассматриваемого параметра рассчитывается величина:
.
Полученное значение fнабл сравнивают со значением функции распределения в критической точке fкр, соответствующей выбранному уровню значимости α. Для уровня значимости α=0.05, чисел степеней свободы 1 и 4 находим fкр из таблицы распределения Фишера-Снедекора. fкр(0.05; 1; 4) = 7.71.
В связи с тем, что fнабл > fкр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов принимаем (нулевую гипотезу о равенстве групповых средних отвергаем).
2.Уравнение имеет вид: y=a+bx.
Для расчета параметров регрессии построим расчетную таблицу.
x
y
x2 y2 x • y y(x) (yi-ycp)2 (y-y(x))2 (xi-xcp)2 |y - yx|:y
-1 5,5 1 30,25 -5,5 5,524 2,007 0,000567 6,25 0,00433
0 6 0 36 0 6,081 0,84 0,00655 2,25 0,0135
1 6,5 1 42,25 6,5 6,638 0,174 0,0191 0,25 0,0212
2 7,5 4 56,25 15 7,195 0,34 0,0929 0,25 0,0406
3 8 9 64 24 7,752 1,174 0,0613 2,25 0,031
4 8 16 64 32 8,31 1,174 0,0958 6,25 0,0387
9 41,5 31 292,75 72 41,5 5,708 0,276 17,5 0,149
Для оценки параметров α и β - используют МНК (метод наименьших квадратов). Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a·n + b·∑x = ∑y
a·∑x + b·∑x2 = ∑y·x
Для наших данных система уравнений имеет вид
6a + 9·b = 41.5
9·a + 31·b = 72
Домножим уравнение (1) системы на (-1.5), получим систему, которую решим методом алгебраического сложения.
-9a -13.5 b = -62.25
9*a + 31*b = 72
Получаем:
17.5*b = 9.75
Откуда b = 0.5571
Теперь найдем коэффициент «a» из уравнения (1):
6a + 9*b = 41.5
6a + 9*0.5571 = 41.5
6a = 36.486
a = 6.081
Получаем эмпирические коэффициенты регрессии: b = 0.5571, a = 6.081.
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.5571 x + 6.081.
3
. Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
, где
;
В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации