Выполнить экономический анализ задачи и сделать выводы, что вы выбираете в качестве изучаемого показателя (У), и что в качестве влияющего (Х). Постройте поле корреляции результата и фактора и сформулируйте гипотезу о форме связи.
Используя выборочные данные, заполнить следующую таблицу:
№п/п
Х У X2
Y2
XY
1
2
…..
…
n
i=1n
По выборочным данным найти средние значения по и , дисперсии по и , средние квадратичные отклонения по и , результаты расчетов и соответствующие формулы поместить в следующую таблицу:
Формула для среднего значения Х Среднее значение
Х Единицы измерения
…. ….. ….
Формула для среднего значения Y Среднее значение
Y Единицы измерения
…. … …
Формула для дисперсии по Х Дисперсия по Х Единицы измерения
….. …….. …….
Формула для дисперсии по Y Дисперсия по Y Единицы измерения
…… ….. …..
Формула для среднего квадратичного по Х Среднее квадратичное по Х Единицы измерения
…. …… ……
Формула для среднего квадратичного по Y Среднее квадратичное по Y Единицы измерения
Определить выборочный коэффициент корреляции и поясните его смысл. Сделать вывод о силе линейной зависимости между переменными и .
Оценить параметры парной линейной регрессионной модели методом наименьших квадратов.
Дать экономическую интерпретацию найденных коэффициентов.
Определить RSS, TSS, ESS. Найти оценку дисперсии ошибки модели.
Определить стандартные ошибки оценок параметров регрессии и стандартную ошибку модели.
Определите коэффициент детерминации и дайте его интерпретацию.
Построить 95%-ые доверительные интервалы для коэффициентов регрессии.
На уровне значимости 0,05 оцените статистическую значимость коэффициента регрессии b. Сделайте выводы.
На уровне значимости 0,05 оцените статистическую значимость уравнения регрессии в целом. Сделайте выводы.
Найти точечный прогноз для зависимой переменной и дать интерпретацию полученного результата.
С вероятностью 0,95 постройте доверительный интервал ожидаемого значения результативного признака, если факторный признак увеличится на 5% от своего среднего значения.
С вероятностью 0,95 постройте доверительный интервал индивидуального значения результативного признака, если факторный признак увеличится на 5% от своего среднего значения.
Вариант 5. На крупном промышленном предприятии было проведено исследование зависимости времени подготовки работника, необходимое для выработки у него навыков в определённой области, от возраста. Имеются следующие данные:
Показатели Работник
А Б В Г Д Е Ж З
И К
Возраст (лет) 18 19 20 21 22 23 29 38 40 41
Время подготовки (часов) 4 3 4 6 5 8 6 7 10 8
Решение
Выполним экономический анализ задачи и сделаем выводы, что вы выбираем в качестве изучаемого показателя (Y), и что в качестве влияющего (Х). Построим поле корреляции результата и фактора и сформулируем гипотезу о форме связи.
В качестве зависимой переменной выступает Общая сумма ущерба (тыс.руб.) (Y), а независимая – Расстояние до ближайшей пожарной станции (км) (Х).
Постройте поле корреляции результата и фактора и сформулируйте гипотезу о форме связи:
Построим поле корреляции и сформулировать гипотезу о форме связи:
Рис.1 Поле корреляции
По расположению точек, их концентрации в определенном направлении можно судить о наличие связи. На основании поля корреляции можно выдвинуть гипотезу, что между факторным признаком и результативным признаком существует прямая, линейная связь, т.е. с ростом возраста, время подготовки увеличивается.
Используя выборочные данные, заполнить следующую таблицу:
№ п/п
18 4 72 324 16
19 3 57 361 9
20 4 80 400 16
21 6 126 441 36
22 5 110 484 25
23 8 184 529 64
29 6 174 841 36
38 7 266 1444 49
40 10 400 1600 100
41 8 328 1681 64
Сумма 271 61 1797 8105 415
Ср. знач. 27,1 6,1 179,7 810,5 41,5
По выборочным данным найти средние значения по и , дисперсии по и , средние квадратичные отклонения по и , результаты расчетов и соответствующие формулы поместить в следующую таблицу:
Формула для среднего значения Х Среднее значение
Х Единицы измерения
27,1 лет
Формула для среднего значения Y Среднее значение
Y Единицы измерения
6,1 час
Формула для дисперсии по Х Дисперсия по Х Единицы измерения
76,09 (лет)2
Формула для дисперсии по Y Дисперсия по Y Единицы измерения
4,29 (час)2
Формула для среднего квадратичного по Х Среднее квадратичное по Х Единицы измерения
8,72 лет
Формула для среднего квадратичного по Y Среднее квадратичное по Y Единицы измерения
2,07 час
Определить выборочный коэффициент корреляции и поясните его смысл. Сделать вывод о силе линейной зависимости между переменными и .
Линейный коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками
. Его можно определить по следующей формуле:
,
Вычислим :
Значения линейного коэффициента корреляции принадлежит промежутку [-1;1]. Связь между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
менее 0,1 отсутствует линейная связь0,1 < rxy < 0,3: слабая; 0,3 < rxy < 0,5: умеренная; 0,5 < rxy < 0,7: заметная; 0,7 < rxy < 0,9: высокая; 0,9 < rxy < 1: весьма высокая;
Для нашей задачи rух = 0,796, что подтверждает вывод, сделанный ранее, что связь между признаками прямая, а также указывает на высокую взаимосвязь между временем подготовки и возрастом. Положительная величина свидетельствует о прямой связи между изучаемыми признаками.
Оценим параметры парной линейной регрессионной модели методом наименьших квадратов. Выполним экономическую интерпретацию найденных коэффициентов.
В общем виде однофакторная линейная эконометрическая модель записывается следующим образом:
где вектор наблюдений за результативным показателем;
вектор наблюдений за фактором;
неизвестные параметры, что подлежат определению;
случайная величина ( отклонение, остаток)
Ее оценкой является модель:
вектор оцененных значений результативного показателя;
оценки параметров модели.
Чтобы найти оценки параметров модели воспользуемся 1МНК:
где коэффициент ковариации показателя и фактора характеризует плотность связи этих признаков и разброс и рассчитывается за формулой:
средние значения показателя и фактора:
среднее значение произведения показателя и фактора:
дисперсия фактора характеризует разброс признаки вокруг среднего и рассчитывается за формулой:
среднее значение квадратов фактора:
Таблица 1
Вспомогательные расчеты
Номер региона
18 4 72 324 16 4,379
19 3 57 361 9 4,568
20 4 80 400 16 4,757
21 6 126 441 36 4,946
22 5 110 484 25 5,135
23 8 184 529 64 5,325
29 6 174 841 36 6,459
38 7 266 1444 49 8,161
40 10 400 1600 100 8,540
41 8 328 1681 64 8,729
Сумма 271 61 1797 8105 415 61
Ср. знач. 27,1 6,1 179,7 810,5 41,5 6,1
Найдем компоненты 1МНК :
Находим оценки параметров модели:
Подставим найденные параметры в уравнение получим:
.
Дать экономическую интерпретацию найденных коэффициентов.
Параметр показывает, что с увеличением возраста на 1 год время подготовки увеличивается в среднем на 0,19 час.
Определим RSS, TSS, ESS