Статистические гипотезы и их проверка

Статистическая догадка (statistical hypothesys) — это определённое предположение о распределении возможностей, лежащем в базе замечаемой выборки данных.

Проверка статистической догадки (testing statistical hypotheses) — это процесс принятия ответа о том, противоречит ли разглядываемая статистическая догадка замечаемой выборке данных.

Статистический тест либо статистический критерий — строгое математическое правило, по которому принимается либо отвергается статистическая догадка.

Методика проверки статистических догадок

Пускай задана случайная выборка — последовательность объектов из множества . Предполагается, что на множестве существует некая малоизвестная вероятностная мера .

Методика пребывает в следующем.

1. Формулируется нулевая догадка о распределении возможностей на множестве . Догадка формулируется исходя из требований задачи. Значительно чаще рассматриваются две догадки —главная либо нулевая и другая . Время от времени альтернатива не формулируется в явном виде; тогда предполагается, что свидетельствует «не ». Время от времени рассматривается сходу пара альтернатив. В математической статистике отлично изучено пара десятков «чаще всего видящихся» типов догадок, и известны ещё много особых разновидностей и вариантов. Примеры приводятся ниже.

2. Задаётся некая статистика (функция выборки) , для которой в условиях справедливости догадки выводится функция распределения и/либо плотность распределения . Вопрос о том, какую статистику нужно забрать для проверки той либо другой догадки, довольно часто не имеет однозначного ответа. Имеется целый ряд условий, которым обязана удовлетворять «хорошая» статистика . Вывод функции распределения при заданных и есть строгой математической задачей, которая решается способами теории возможностей; в справочниках приводятся готовые формулы для ; в статистических пакетах имеются готовые вычислительные процедуры.

3. Фиксируется уровень значимости — допустимая для данной задачи возможность неточности первого рода, другими словами того, что догадка в действительности верна, но будет отвергнута процедурой проверки. Это должно быть малое число . На практике довольно часто полагают .

4. На множестве допустимых значений статистики выделяется критическое множество наименее возможных значений статистики , такое, что . Вычисление границ критического множества как функции от уровня значимости есть строгой математической задачей, которая в большинстве практических случаев имеет готовое простое ответ.

5. Фактически статистический тест (статистический критерий) содержится в проверке условия:

§ в случае, если , то делается вывод «эти противоречат нулевой догадке при уровне значимости ». Догадка отвергается.

§ в случае, если , то делается вывод «эти не противоречат нулевой догадке при уровне значимости ». Догадка принимается.

Итак, статистический критерий определяется критическим множеством и статистикой , которое зависит от уровня значимости .

Замечание. В случае, если эти не противоречат нулевой догадке, это ещё не означает, что догадка верна. Тому имеется две обстоятельства.

§ По мере повышения длины выборки нулевая догадка может сперва приниматься, но позже выявятся более узкие несоответствия данных догадке, и она будет отвергнута. Другими словами очень многое зависит от количества данных; в случае, если данных не достаточно, возможно принять кроме того самую неправдоподобную догадку.

§ Выбранная статистика может отражать не все данные, содержащуюся в догадке . При таких условиях возрастает возможность неточности второго рода — нулевая догадка возможно принята, не смотря на то, что в действительности она не верна. Допустим, к примеру, что = «распределение нормально»; = «коэффициент асимметрии»; тогда выборка с любым симметричным распределением будет признана обычной. Дабы избегать таких неточностей, направляться пользоваться более замечательными параметрами.

Лекция 5. Проверка статистических гипотез


Интересные записи:

Понравилась статья? Поделиться с друзьями: