Имеются данные о производительности труда и стаже работы рабочих предприятия
Номер п/п Производительность труда, млн.руб. / чел. Стаж работы, лет
1 2,78 4
2 2,65 4
3 2,57 3
4 2,24 1
5 2,53 4
6 2,64 5
7 2,64 7
8 2,63 5
9 2,5 4
10 2,57 3
11 2,42 3
12 2,50 4
13 2,61 7
14 2,55 5
15 2,34 3
16 2,48 4
17 2,47 4
18 2,24 2
Решение
Построим групповую таблицу, показывающую зависимость между указанными признаками. Факторным признаком будет стаж работы, а результативным производительность труда.
Номер п/п Производительность труда, млн.руб. / чел. - у Стаж работы, лет - х
1 2,78 4
2 2,65 4
3 2,57 3
4 2,24 1
5 2,53 4
6 2,64 5
7 2,64 7
8 2,63 5
9 2,5 4
10 2,57 3
11 2,42 3
12 2,50 4
13 2,61 7
14 2,55 5
15 2,34 3
16 2,48 4
17 2,47 4
18 2,24 2
Построим поле корреляции.
Рис. Поле корреляции
Рассчитаем линейный коэффициент корреляции.
.
Строим вспомогательную таблицу.
Номер п/п Производительность труда, млн.руб. / чел. - у Стаж работы, лет - х ху
х2 у2 yx
1 2,78 4 11,12 16 7,73 2,52 0,0935
2 2,65 4 10,6 16 7,02 2,52 0,0491
3 2,57 3 7,71 9 6,60 2,455 0,0447
4 2,24 1 2,24 1 5,02 2,325 0,0379
5 2,53 4 10,12 16 6,40 2,52 0,0040
6 2,64 5 13,2 25 6,97 2,585 0,0208
7 2,64 7 18,48 49 6,97 2,715 0,0284
8 2,63 5 13,15 25 6,92 2,585 0,0171
9 2,5 4 10 16 6,25 2,52 0,0080
10 2,57 3 7,71 9 6,60 2,455 0,0447
11 2,42 3 7,26 9 5,86 2,455 0,0145
12 2,5 4 10 16 6,25 2,52 0,0080
13 2,61 7 18,27 49 6,81 2,715 0,0402
14 2,55 5 12,75 25 6,50 2,585 0,0137
15 2,34 3 7,02 9 5,48 2,455 0,0491
16 2,48 4 9,92 16 6,15 2,52 0,0161
17 2,47 4 9,88 16 6,10 2,52 0,0202
18 2,24 2 4,48 4 5,02 2,39 0,0670
Итого 45,36 72 183,91 326 114,65 45,36 0,5772
Получим:
.
В нашем примере связь между признаком Y и фактором X заметна и прямая.
Выдвигаем гипотезы:
H0: rxy = 0, нет линейной взаимосвязи между переменными;
H1: rxy ≠ 0, есть линейная взаимосвязь между переменными;
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=16 находим tкрит:
tкрит(n-m-1;α/2) = tкрит(16;0.025) = 2.12.
Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции
. Другими словами, коэффициент корреляции статистически – значим.
Построим линейное уравнение вида у=а+bx.
Для этого необходимо решить систему уравнений:
Получаем:
.
Уравнение будет иметь вид: у=2,26+0,065х.
Определим ошибку аппроксимации.
.
Получаем:
.
В среднем, расчетные значения отклоняются от фактических на 3.21%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Построим степеное уравнений зависимости между фактором и результатом.
Степенное уравнение регрессии имеет вид y = a xb.
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = a xb + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти