Построение линейного уравнения парной регрессии
Определить зависимость стоимости продукции Y в млн. рублей, переме-щенной через конкретный таможенный пост от количества основных това-ров Х в штуках.
Полагая, что между признаками существует линейная зависимость, определить уравнение линейной регрессии методом наименьших квадратов (МНК):
1.Построить поле корреляции и сформулировать гипотезу о форме связи.
2. Рассчитать параметры уравнений линейной регрессии.
3. Оценить тесноту связи с помощью показателей корреляции и детерминации.
4.Оценить с помощью средней ошибки аппроксимации качество уравнений регрессии.
5. Построить таблицу дисперсионного анализа. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.
6. Найти доверительные интервалы для параметров регрессии и коэффициента корреляции.
7. Сделать прогноз значения у при , (т.е. увеличив на 5% среднее значение) и найти доверительные интервалы прогноза для двух уравнений регрессии .
9. Оценить полученные результаты и сделать вывод.
Таблица 1
Исходные данные
12 Х 85 65 105 135 125 55 95 155 75 130
У 4,3 5,0 7,3 9,2 6,5 4,0 5,2 8,5 3,6 8,8
Решение
1. Построим диаграмму рассеивания по исходным данным для своего варианта
Рис.1. Поле корреляции
Из диаграммы следует, что между показателями и действительно наблюдается зависимость.
2. Составим исходную расчетную таблицу
Таблица 2
Расчетная таблица
№ п/п х у
1 85 4,3 7225 18,49 365,5 5,2 -0,9 0,89 3,76 21,97
2 65 5 4225 25 325 4,1 0,9 0,80 1,54 17,86
3 105 7,3 11025 53,29 766,5 6,4 0,9 0,84 1,12 12,57
4 135 9,2 18225 84,64 1242 8,1 1,1 1,24 8,76 12,08
5 125 6,5 15625 42,25 812,5 7,5 -1,0 1,04 0,07 15,69
6 55 4 3025 16 220 3,5 0,5 0,21 5,02 11,55
7 95 5,2 9025 27,04 494 5,8 -0,6 0,38 1,08 11,80
8 155 8,5 24025 72,25 1317,5 9,2 -0,7 0,53 5,11 8,54
9 75 3,6 5625 12,96 270 4,7 -1,1 1,16 6,97 29,88
10 130 8,8 16900 77,44 1144 7,8 1,0 0,99 6,55 11,32
Итого 1025 62,4 114925 429,36 6957 62,4 0,0 8,07 39,98 153,26
Ср.зн. 102,5 6,24 11492,5 42,936 695,7 6,24 - - 4,00 15,33
Коэффициент регрессии b найдем по формуле ,
Уранение регресии имеет вид:
Затем, подставляя различные значения из столбца 2, получим теоретические значения для столбца 7:
аналогично для … и .
В столбце 8 находим разность текущего значения и (теоретического), найденного по формуле (4).
,,.
3.Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции
. Найдем его по формуле для
В примере получилась связь прямая, весьма высокая.
Долю дисперсии, объясняемую регрессией, в общей доле дисперсии характеризует индекс детерминации . Он определяется отношением объясненной дисперсии к общей
.
4.Коэффициент аппроксимации определим по формуле:
.
Средняя ошибка аппроксимации:
.=15,33
Допустимый предел значений - не более 10 %, это говорит о том, что уравнение регрессии не точно аппроксимирует исходную зависимость.
5.Дисперсионный анализ. Общая сумма квадратов отклонений (т.е. общая дисперсия ) равна:
,
где - общая сумма квадратов отклонений,
- сумма отклонений, обусловленная регрессией (факторная),
- остаточная сумма квадратов отклонений.
Остаточная сумма определена в таблице в 9 столбце и равна 8,07. Тогда объясненная (факторная) сумма квадратов будет равна
Качество всего уравнения регрессии в целом, проверяется F-тестом.
Составим таблицу дисперсионного анализа:
Источники вариации Число степеней свободы квадр.
отклонений