Выборочная зависимость между величиной основных производственных фондов Х и суточной выработкой продукции У по данным пяти независимых наблюдений представлена в таблице.
Требуется составить выборочное уравнение линейной парной регрессии У на Х, вычислить коэффициент корреляции r между Х и У , на уровне значимости а =0,05 проверить значимость коэффициента корреляции и уравнения регрессии.
№ задачи i
1 2 3 4 5
43 Xi 1,25 1,30 1,40 1,55 1,60
yi
1,40 1,55 1,60 1,70 1,75
Решение
Вычислим по выборке значений случайного вектора xi,yii=1n оценки параметров парной линейной регрессии:
yx=a+b⋅x,
гдеyx – теоретическое значение результирующего показателя;
a, b – оценки регрессионных параметров, вычисляемые по исходным данным;
x – фактор, обуславливающий изменение результирующего показателя.
Метод наименьших квадратов (МНК) — математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных. Он может использоваться для «решения» переопределенных систем уравнений (когда количество уравнений превышает количество неизвестных), для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений, для аппроксимации точечных значений некоторой функции
. МНК является одним из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным.
Усилия направлены на подбор такой функции y=f(x), чтобы сумма квадратов отклонений ei2=yi-f(xi)2 была как можно меньше. Собственно, отсюда и название метода.
На основании исходных данных (табл. 1.1) выполнены расчеты по соотношениям, которые получены на основании метода наименьших квадратов применительно к построению линейной функции регрессии (табл. 2.1).
Таблица 2.1.
№ п/п. xi
yi
xi2
yi2
xiyi
yxi
1 1,25 1,4 1,5625 1,96 1,75 1,4538
2 1,3 1,55 1,69 2,4025 2,015 1,4968
3 1,4 1,6 1,96 2,56 2,24 1,5828
4 1,55 1,7 2,4025 2,89 2,635 1,7118
5 1,6 1,75 2,56 3,0625 2,8 1,7548
6 7,1 8 10,175 12,875 11,44 8,00
Сумма 1,42 1,6 2,035 2,575 2,288 1,60
Среднее значение 1,25 1,4 1,5625 1,96 1,75 1,4538
Значения параметров линейной регрессии, вычисленные по аналитическим формулам:
b=xy-x∙yx2-x2=1,75-1,25∙1,41,5625-1,252=0,8602
a=y-bx=1,4-0,8602∙1,25=0,3785
Тогда уравнение регрессии, являющееся линейной моделью, примет вид:
yx=a+b⋅x=0,3785+0,8602∙x.
Уравнение для коэффициента корреляции имеет следующий вид:
rxy=b∙x2-x2y2-y2=0,8602∙1,5625-1,2522,575-1,62=0,9579
Значение коэффициента корреляции 0,9579 согласно шкале Чеддока говорит о весьма тесной связи.
Вычислению расчетного значения F-статистика для парной степенной регрессии может быть вычислена через коэффициент детерминации и объем выборки:
Fрасч.=R2n-21-R2.
Получение табличной величины F1-αk1;k2=F1-0,51;4=7,709 в Excel осуществляется с помощью функции «FРАСПОБР»