Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости =0,05. Сделать выводы
2. Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.
3. Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера.
4. Выполнить прогноз балансовой прибыли y при прогнозном значении x, составляющем 118% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости =0,05. Сделать выводы.
Решение
1. Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.1)
где , – выборочные дисперсии переменных x и y, – ковариация признаков. Соответствующие средние определяются по формулам:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.2) , MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.3)
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.4) . MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.5)
Для расчета коэффициента корреляции (1.1) строим расчетную таблицу (табл. 1.2):
Таблица 1. SEQ Таблица \* ARABIC \s 1 1
x y xy
x2 y2 e2
1 491,8 133,8 65802,84 241867,2 17902,44 113,0612 20,73878 430,097
2 483 124,1 59940,3 233289 15400,81 101,7687 22,33132 498,6879
3 481,7 92,4 44509,08 232034,9 8537,76 100,1005 -7,70046 59,29714
4 478,7 92,9 44471,23 229153,7 8630,41 96,25073 -3,35073 11,22742
5 476,9 61,4 29281,66 227433,6 3769,96 93,9409 -32,5409 1058,91
6 475,2 72,4 34404,48 225815 5241,76 91,75938 -19,3594 374,7857
7 474,4 99,3 47107,92 225055,4 9860,49 90,73279 8,567211 73,39711
8 459,5 60,9 27983,55 211140,3 3708,81 71,61247 -10,7125 114,7569
9 452,9 74 33514,6 205118,4 5476 63,14306 10,85694 117,8731
446,5 66,1 29513,65 199362,3 4369,21 54,93031 11,16969 124,7621
Итого 4720,6 877,3 416529,3 2230270 82897,65 877,3 -8,5E-13 2863,794
Среднее значение 472,06 87,73 41652,93 223027 8289,765 87,73
По данным таблицы находим:
, ,
, ,
, ,
, ,
, . .
Таким образом, между балансовой прибылью (y) и объемом произведенной продукции (x) существует прямая весьма тесная корреляционная зависимость.
Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.6)
который имеет распределение Стьюдента с k=n–2 и уровнем значимости .
В нашем случае
и .
Поскольку , то коэффициент корреляции существенно отличается от нуля.
Для значимого коэффициента можно построить доверительный интервал, который с заданной вероятностью содержит неизвестный генеральный коэффициент корреляции. Для построения интервальной оценки (для малых выборок n<30), используют z-преобразование Фишера:
MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.7)
Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием и дисперсией
. Поэтому вначале строят доверительный интервал для M[z], а затем делают обратное z-преобразование.
Применяя z-преобразование для найденного коэффициента корреляции, получим
.
Доверительный интервал для M(z) будет иметь вид
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.8)
где t находится с помощью функции Лапласа (t)=/2. Для =0,95 имеем t=1,96. Тогда
,
или
.
Обратное z-преобразование осуществляется по формуле
MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.9)
В результате находим
.
В указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции .
2. Таким образом, между переменными x и y имеет не существенная корреляционная зависимость. Будем считать, что эта зависимость является линейной. Модель парной линейной регрессии имеет вид
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.7)
где y – зависимая переменная (результативный признак), x – независимая (объясняющая) переменная, – случайные отклонения, 0 и 1 – параметры регрессии. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.8)
где b0 и b1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). В соответствие с МНК, сумма квадратов отклонений фактических значений зависимой переменной y от теоретических была минимальной:
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.9)
где – отклонения yi от оцененной линии регрессии. Необходимым условием существования минимума функции двух переменных (1.12) является равенство нулю ее частных производных по неизвестным параметрам b0 и b1. В результате получаем систему нормальных уравнений:
MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.10)
Решая систему (1.13) , найдем
, MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.11)
. MACROBUTTON MTPlaceRef \* MERGEFORMAT SEQ MTEqn \h \* MERGEFORMAT (1.12)
По данным таблицы (1.2) находим
;
.
Получено уравнение регрессии: