Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Введение
В задачах прикладного значения зачастую требуется по выборочным наблюдениям сделать некоторое заключение касаемо интересующих практика характеристик генеральной совокупности или о величинах неизвестных параметров данной совокупности, из которой эта выборка сделана. В данном случае, речь идет о проверке этих предположений или так называемых – статистических гипотез.
В работе ученого, проводящего какие-либо эксперименты, наиболее существенным является – решение вопроса о том, что и как можно было бы извлечь из наблюдений за случайной величиной (и выборочных её значений) для использования в будующем.
Научный современный подход к решению статистических задач в последнее время основан на использовании непараметрической статистики, а не традиционных, классических методах, которые используются только при заранее известных закономерностях. Но в обоих случаях самой важной задачей опытного ученого является проверка выдвинутых им предположений (гипотез).
Фундаментальную основу для решения подобных задач составляет математическая статистика.
Математическая статистика – наука, которая основана на изучении методов исследования законов распределения в массовых случайных процессах по данным, полученным из некоторого числа наблюдений за ними [7].
Выведенные на основании данных методов зависимости относятся не к отдельным экспериментам, из повторения которых складывается данный процесс, а представляют собой выводы об общих вероятностных характеристиках этого явления (процесса).
В качестве данных характеристик могут быть характеристиками вероятность, плотность распределения вероятности, математическое ожидание, дисперсия и др..
Полученные зависимости позволяют построить вероятностную модель изучаемого явления. Примение к этой модели методов теории вероятностей, позволяет решать разного направления задачи (технические или экономические), например, определять вероятность надежной работы оборудования в течение определенного периода времени.
В соответствии с чем, можно сделать вывод о том, что – теория вероятностей по выстроенной модели процесса предполагает его течение, а математическая статистика по полученным результатам эксперимента – строит его вероятностную модель. В этом заключается плотная взаимосвязь между данными теориями [6].
Для определения закона случайного массового явления необходимо провести отбор и анализ статистических сведений, т.е. сведений, характеризующих отдельные единицы данного процесса.
Методы научной статистики довольно широко используются при анализе разных явлений и процессов. Скажем, если сравнивать некоторые методики лечения, или разные способы инвестирования финансовых средств, а также технических измерений и технологических процессов, ставятся вопросы об результативности новых методов обучения, управления, о достоверности математической модели и др. Перед проведением опыта ученый должен четко сформулировать предположение или гипотезу, подлежащих изучению [8].
Таким образом, если по результатам выполненных опытов требуется проверить некоторую гипотезу относительно генеральной совокупности и сформулировать обоснованный вывод, то для этого используется анализ или статистическая проверка гипотез (предположений).
1. Основы теории проверки статистических гипотез
Понятие гипотеза подразумевает – некоторое предположение о параметрах известных распределений (параметрическая) или о виде неизвестного закона распределения (непараметрическая) некоторых случайных величин, выдвигаемое в качестве предварительного объяснения [11].
Предположительное утверждение относительно генеральной совокупности, проверяемое по выборочным данным, называется статистической гипотезой [9].
Теория и способы проверки статистических гипотез является базовым инструментом доказательной, а не интуитивной основы.
Необходимо различать статистические гипотезы и обыкновенные предположения. Они в первую очередь отличаются тем, что статистических гипотез всегда как минимум две и они противопоставляются друг другу. Первая из гипотез это та, которую предполагают опровергнуть – называется нулевая гипотеза Н0, а вторая – называется альтернативная гипотеза Н1 [4].
Основной вопрос заключается именно в первой (нулевой) гипотезе и её необходимо сформулировать или построить так, чтобы была определенная возможность найти интересующие статиста-практика вероятности в условиях истинности данного предположения.
Предположим, что мы исследуем игральный кубик, т.е. – проверяем его на симметричность. Очевидно, что в виде нулевой гипотезы будет предположение о полной симметрии кубика.
В соответствии с чем, если нулевая гипотеза Н0 достоверна, то вероятности выпадения всех шести цифр на гранях будут одинаковы – по 1/6. Но, а если нулевая гипотеза — это предположение об асимметрии кубика, то это не имело бы практического значения, так как мы ничего бы не смогли сказать о значениях вероятностях выпадения цифр на кубике.
Основной принцип, по которому принимается решение об отклонении или принятии нулевой гипотезы H0, называется критерием.
Непосредственно сама проверка статистической гипотезы основана в том, что всё выборочное пространство делится на две взаимодополняющие области: критическую – Sкр (область неправдоподобных значений) и область допустимых правдоподобных значений Sкр. В зависимости от типа альтернативной гипотезы H1 различают односторонние, где критическая область с одной стороны и двухсторонние критерии, где две критические области. После этого по выборке x1,...,xn определяют специально составленную выборочную характеристику – критическую статистику θкр (x1,x2,...,xn), точное или приблизительное распределение которой известно [10]. Для данного распределения по специальным таблицам определяют точки θкр.н и θкр.в (в случае двухсторонней критической области) или точка θкр (в случае односторонней критической области), разделяющие критическую область Sкр и область допустимых значений Sкр.
Для одностороннего критерия область принятия нулевой гипотезы ограничена только с одной стороны (сверху или снизу), в связи с чем, необходимо определить квантиль уровня 1-α, или квантиль уровня α. Для двухстороннего критерия область принятия нулевой гипотезы имеет два ограничения – сверху (квантиль уровня 1-α/2) и снизу (квантиль уровня α / 2).
После этого определяется эмпирическое значение статистики θэмп подстановкой в θкр конкретных выборочных значений. Если θэмп ∈ Sкр, то основная гипотеза отклоняется и принимается альтернативная гипотеза. Если же θэмп ∈ Sкр, то делается заключение о том, что нет оснований для отклонения основной гипотезы [10].
Так как статист работает с выборочными данными, которые попадают из генеральной совокупности случайным образом, то можно совершить следующие ошибки (табл.1).
Таблица 1.
гипотеза H 0 не отвергается отвергается
верна правильное решение ошибка 1-го рода
не верна ошибка 2-го рода правильное решение
В случае, если верной является нулевая гипотеза, но будет принята альтернативная гипотеза, то данная ошибка называется ошибкой первого рода. Вероятность P (H1 / H0) = α допустить ошибку 1-го рода называется уровнем значимости критерия [7].
Ошибка второго рода – это утверждение нулевой гипотезы в то время, когда в реальности достоверной является альтернативная гипотеза.
Вероятность допустить ошибку 2-го рода: P (H0 / H1) = β .
При реализации этапов проверки гипотез необходимо минимизировать значения всех ошибок (обоих родов), но в практике это не всегда представляется возможным: при ограниченном объёме выборки можно минимизировать лишь что-нибудь одно – или α или β, при этом другая будет становиться больше. В связи с этим поступают следующим образом: фиксируют вероятность ошибки первого рода на каком-то определённом уровне (обычно для α используют стандартные значения, например, равные 0,05 или 0,01), а вероятность ошибки второго рода – стараются свести к минимуму [7].
Вероятность не допустить ошибку 2-го рода P (H1 / H1) =1-P(H0/H1) =1- β имеет определение – мощностью критерия.
Оптимальным критерием признается такой, в результате использования которого при заданном уровне значимости α достигается – максимальное значение функции мощности критерия 1- β (задача Неймана-Пирсона) [7].
Если пользоваться определением – статистический контроль качества продукции, то вероятность α можно трактовать как «риски производителя», т.е. вероятность по результатам выборочного контроля забраковать всю партию изделий, удовлетворяющую стандарту; а вероятность β - «риск покупателя» - вероятность приёмки некачественной продукции.
Процесс анализа сформулированной гипотезы с имеющимися выборочными данными, производится при помощи статистического критерия, который называется – статистической проверкой гипотезы [7].
По своему прикладному значению статистические гипотезы можно подразделить на следующие основные виды:
- о значениях числовых параметров;
- о тождестве числовых характеристик генеральных совокупностей;
- об однородности выборок генеральных совокупностей;
- о стохастической независимости элементов выборки;
- о согласии экспериментального (эмпирического) распределения и выбранной математической модели.
2
. Определение основных методов проверки гипотез
Иногда при работе с некоторыми массивами данных требуется сравнить их и определить вызвано ли различие в числовых характеристиках этих групп систематическими или случайными факторами. Для нахождения решения таких задач в математической статистике имеется 2 варианта – параметрические и непараметрические методы [2].
Методы обработки, основанные на предположении, что результаты экспериментов имеют закон распределения, принадлежащий тому или иному параметрическому семейству – нормальному или показательному –называются параметрическими.
Проверка гипотез о равенстве числовых характеристик генеральных совокупностей – это есть параметрические методы проверки гипотез об однородности выборок. Методы обработки, в которых не расматривается использование какого-то параметрического семейства, называют непараметрическими. Их применяют в том случае, когда приходится работать с обработкой данных, распределение которых не определено или не подчиняется какому-либо из известных законов распределения [2]. В случае, если заключение необходимо делать по малым выборкам, и закон распределения неизвестен, то невозможно применение критериев, связанных с параметрами распределения.
Непараметрические критерии имеют некоторые преимущества, такие как – более широкая сфера применения и меньшая чувствительность к «шуму» в статистических данных и к влиянию некоторых ошибок, попавших в экспериментальные данные. В свою очередь параметрические критерии обладают большей мощностью. И по данной причине, в случаях, когда выборки имеют нормальное распределение, необходимо отдавать предпочтение – параметрическим критериям.
3. Параметрические критерии
При решении задачи о наличии расхождений между определенными выборками – выполняют проверку статистических гипотез о принадлежности этих выборок – генеральной совокупности или о равенстве средних. Если вид или функция распределения известны, то задача оценки различий двух групп независимых наблюдений – решается с использованием параметрических критериев, таких как [11]:
- критерия Стьюдента (при сравнении средние значений выборок);
- критерия Фишера (при сравнении дисперсий).
Критерий Стьюдента. Известный математик Вильям Госсет под псевдонимом «Стьюдент», нашёл следующий закон распределения случайной величины [11]:
,
где основной параметр σ заменен на его выборочную оценку s, а –математическое ожидание. Этот закон, имеет непрерывную функцию распределения, и описывается следующей формулой [11]:
где C - константа, зависящая только от числа степеней свободы n -1.
Данный закон положил начало создания теории «Малой выборки». При большом объёме выборки особенность распределения в генеральной совокупности не имеет особого значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда является нормальным. При небольших объемах выборки (n≤30) на распределении ошибок – будет влиять характер распределения генеральной совокупности.
Это распределение Стьюдента зависит от двух значений: 1) - t и 2)- числа степеней свободы k = n -1. С увеличением числа наблюдений n – это распределение приближается к стандартному нормальному (с параметрами a = 0 и σ = 1). Так уже при n ≥ 30 распределение Стьюдента не отличается от стандартизированного нормального распределения. Для практического использования распределения Стьюдента имеются таблицы, в которых содержатся критические значения t для разных уровней значимости α и k - чисел степеней свободы [11].
Допустим, если необходимо сопоставить средние арифметические x и y двух разных выборок с объемами значений n1 и n2, взятые из нормально распределенных совокупностей с параметрами a1, σ1и a2, σ2.
Для этого выдвигается предположение, что σ1 и σ2 не известны и разница между средними d=x-y появилась случайно. В качестве нулевой гипотезы выдвигается следующее предположение H0: a1 = a2.
Для проверки основной гипотезы используется случайная величина
которая подчиняется распределению Стьюдента с числом степеней свободы k = n1 + n2 - 2. Здесь sd - ошибка разности между выборочными средними. Эта величина вычисляется по следующим формулам [11]:
- для выборок одинакового объёма (n1 = n2 = n):
- для неравновеликих выборок (n1 ≠ n2):
При a1 = a2 разность a1 - a2 = 0, поэтому критерий будет иметь вид:
При альтернативной гипотезе H1: a1≠a2 верхняя критическая точка находится по специальной таблице как квантиль уровня 1-α/2, а нижняя критическая точка расположена симметрично относительно верхней оси ординат: Tкр.н=-Tкр.в. Если Tэмп<Tкр.н или Tэмп>Tкр.в, то нулевая гипотеза отклоняется с вероятностью ошибки первого рода α .
В случае, если анализируемые выборки имеют попарно взаимосвязанные значениями варьирующего признака, то при оценке различий между ними используется метод парных сравнений сопряженных вариант. В данном случае оценкой разности между генеральными средними D=a1-a2 и дисперсией разности σD2 будет являться выборочная средняя из суммы разностей между попарно связанными вариантами сравниваемых групп x1,x2 , ...,xn и y1,y2 ,..., yn [11]:
где n - число парных значений.
Таким образом, выборочная дисперсия будет равна
а ошибка средней разности будет рассчитываться как:
В случае, если варианты генеральной совокупности распределены нормально, то разность между ними будет соответствовать нормальному закону распределения. тогда случайная величина
будет иметь распределение Стьюдента с k = n -1 степенями свободы.
Для нулевой гипотезы H0: D=0 и альтернативной H1: D > 0 статистика критерия [11]:
Если Tэмп = Tкр(α, n -1), то нулевая гипотеза отклоняется с вероятностью ошибки первого рода α.
Ну а если гипотеза о нормальности распределения попарных разностей окажется отвергнутой, то критерий Стьюдента не следует применять. В таких случаях необходимо оперировать непараметрическими критериями.
4. Непараметрические критерии
При исследовании статистических данных не во всех случаях изучаемый признак подчиняется нормальному закону распределения. Бывает, что информации о законе распределения сравниваемых выборок недостаточно. В таких случаях применяют непараметрические критерии [2].
Одно из существующих определений гипотезы об однородности выборок – это предположение о совпадении законов распределения, описывающих разные выборки.
При лимитированном объёме статистической информации одним из путей повышения достоверности – является объединение имеющихся выборок в одну совокупность. Однако для этого необходимо убедиться в правильности применения данных действий, т.е. доказать однородность этих выборок.
Виды непараметрических критериев для сравнения выборок приведены на рис.1 [2].
Рисунок 1 – Виды статистических непараметрических критериев
Рассмотрим алгоритмы применения некоторых непараметрических критериев для некоторых связанных выборок.
T -критерий Уайта. Данный критерий применяется с целью определения достоверности различий, наблюдаемых при сравнении двух независимых результатов, полученных по шкале порядка [2].
Порядок применения критерия:
1. Результаты опытной и контрольной групп объединяют в один общий вариационный ряд и ставят в порядке неубывания, затем устанавливают им ранги (порядковый номер места, которое варианта занимает в упорядоченном ряду);
2. Данные ранги складывают отдельно для каждой группы;
3. Если сопостовляемые результаты контрольной и опытной групп практически не отличаются друг от друга, то суммы их рангов должны быть равны между собой, и наоборот, чем значительнее расхождение между имеющимися результатами, тем больше разница между суммами их рангов;
4. Достоверность различий между суммами рангов оценивается T - критерием Уайта по специальным таблицам [1]: в качестве эмпирического значения берётся меньшая из сумм рангов и сравнивается с табличным значением критерия. Если Tэмп ≥ Tкр, то это указывает на недостоверность различий между группами.
Другой критерий – Критерий Ван-дер-Вардена, также, как и предыдущий относится к группе ранговых критериев и применяется для сравнения выборок равновеликого и неравновеликого объема
Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!
Нужна помощь по теме или написание схожей работы? Свяжись напрямую с автором и обсуди заказ.
В файле вы найдете полный фрагмент работы доступный на сайте, а также промокод referat200 на новый заказ в Автор24.