По результатам выполнения задания 1 с вероятностью 0,954 определите:
1) ошибку выборки средней величины выручки от продажи продукции и границы, в которых будет находиться средняя величина выручки предприятий генеральной совокупности.
2) ошибку выборки доли предприятий с выручкой от продажи продукции более x млн. руб. (x - средняя величина выручки, рассчитанная в задании 1), а также границы, в которых будет находиться генеральная доля.
Решение
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.В среднем, расчетные значения отклоняются от фактических на 8.37%. Поскольку ошибка больше 7%, то данное уравнение не желательно использовать в качестве регрессии.Определим доверительные интервалы коэффициентов регрессии, которые с надежность 0,954 будут следующими:(b - tкрит Sb; b + tкрит Sb)(0.34 - 2.368*0.0795; 0.34 + 2.368*0.0795)(0.147;0.524)С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.(a - tкрит Sa; a + tкрит Sa)(22.547 - 2.368*19.167; 22.547 + 2.368*19.167)(-22.84;67.933)С вероятностью 0,954 можно утверждать, что значение данного параметра будут лежать в найденном интервале.Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента a статистически незначима.2) F-статистика. Критерий Фишера.Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.где m – число факторов в модели.Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:1
. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.2. Далее определяют фактическое значение F-критерия:или по формуле:гдегде m=1 для парной регрессии.3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.4