Исключение грубых погрешностей

Последствия решений

Таблица 3.2

Решение¯	Гипотеза®	Объективно верна	Объективно неверна
Принять гипотезу	Ошибки нет	Ошибка 2-го рода; вероятность b
Отвергнуть гипотезу	Ошибка 1-го рода; вероятность a	Ошибки нет

Вероятность совершить ошибку 1-го рода a называется уровнем значимости, вероятность не совершить ошибку 2-го рода (1 - b) называется мощностью критерия.

Вероятности ошибок 1-го и 2-го рода зависят от выбора размеров области принятия гипотезы и критической области. При фиксированном объеме выборки N стремление уменьшить вероятность ошибки 1-го рода с необходимостью приводит к увеличению вероятности ошибки 2-го рода. Обычно, исходя из конкретной ситуации, задаются приемлемой вероятностью ошибки 1-го рода (уровнем значимости). Типичное значение выбираемого уровня значимости a = 0,05. Задание уровня значимости однозначно определяет критическую область, а следовательно и область принятия гипотезы.

Распишем по этапам процесс проверки статистической гипотезы.

1. Формулировка гипотезы Н₀. (Обычно гипотеза высказывается в форме, отрицающей наличие каких-либо видимых эффектов. Поэтому основная гипотеза Н₀ называется нулевой).

2. Формулировка альтернативной гипотезы Н₁ . (Нулевой гипотезе может противостоять много альтернатив. Нужно выбрать одну, которая для нас существенна).

3. Выбор критерия для проверки гипотезы Н₀.

4. Нахождение функции распределения критерия при условии, что нулевая гипотеза Н₀ справедлива.

5. Выбор уровня значимости a . (Выбор значения вероятности ошибки 1-го рода, которое представляется приемлемым).

6. Нахождение критической области. (При этом используются сведения о функции распределения критерия, альтернативной гипотезе Н₁ и уровне значимости a ).

7. Извлечение выборки (х₁, х₂, .... , х_N).

8. Вычисление по результатам выборки значения критерия.

9. Принятие решения. (Если вычисленное значение попадает в критическую область, то гипотеза Н₀ отвергается с вероятностью ошибки, равной a, если же оно попадает в область принятия гипотезы, то последняя считается допустимой, т.е. данные выборки не противоречат гипотезе Н₀).

С примерами использования приведенной процедуры проверки статистических гипотез мы встретимся в последующих разделах этой главы.

Как уже отмечалось, иногда среди результатов параллельных наблюдений, выполненных при одинаковых условиях, встречается результат, резко отличающийся от всех остальных. В этом случае есть основания предполагать наличие грубой погрешности. Она может возникнуть из-за резкого и кратковременного изменения некоторой величины, существенно влияющей на результат наблюдения. Другой причиной может явиться неправильное действие оператора, например, ошибка при считывании результата или описка при его записи, неверная позиция переключателя и т.д.

Иногда погрешность столь велика, что в ее грубости не приходится сомневаться. Это почти всегда бывает при ошибочных действиях оператора. Такую ошибку легко исключить ввиду ее очевидности. Если же погрешность вызвана техническими причинами, то ее отнесение к категории грубых может потребовать применения статистических методов. Дело в том, что не всегда легко отличить наблюдение, несколько отличающееся от остальных в силу случайных причин, от наблюдения, содержащего грубую погрешность.

Для обнаружения грубых погрешностей следует проверить нулевую гипотезу о том, что подозрительный результат наблюдения является одним из случайных значений измеряемой величины. Альтернативная гипотеза утверждает, что этот результат несовместим с ее предполагаемым распределением. Требуется задать уровень значимости и определить критическую область.

Если считать, что при вероятности, меньшей чем 0,003 появление некоторого значения практически исключено, то число 0,003 можно принять за уровень значимости. Критерием для проверки нашей гипотезы может служить функция

(3.30)

распределенная нормально. Значения этой функции, вероятность появления которых меньшей чем 0,003, , согласно таблицам нормального распределения превышают число 3. То есть критическая область критерия простирается от ±3-х до ± бесконечности. Значит,если результат наблюдения отличается от среднего значения по абсолютной величине больше, чем на 3 то нулевая гипотеза должна быть отвергнута, а х_iследует считать значением, содержащим грубую погрешность.Так формулируется правило трех сигм, также называемое критерием Райта. Его целесообразно применять при не очень большом числе измерений (6 - 20). Если число измерений 20 < N £ 100 , то рекомендуется вместо значения 3использовать значение 4.

Существуют и другие критерии, которые имеет смысл применять при определенных условиях. Например, критерий Романовского, критерий Шовенэ, критерий Диксона и др.