Алгоритм проверки статистических гипотез

Проверка гипотезы – это процедура сопоставления высказанной гипотезы с выборочными данными.

· Пусть высказана гипотеза о том, что неизвестная функция распределения исследуемой случайной величины x имеет определенную стандартную модель F(x)=Fтеорет(x). Эта гипотеза называется основной, или нулевой (H0). Конкурирующая с ней гипотеза называется альтернативной (H1).

· Выбор уровня значимости α. Он связан с ошибкой первого рода, когда H0 отвергается при верности этой гипотезы. Ошибкой второго рода считается принятие H0 при верности H1. α – это вероятность ошибки первого рода. Это вероятность принятия гипотезы H1, если на самом деле в генеральной совокупности верна гипотеза H0. α имеет стандартные табличные значения. При α=0,05 из ста выборок в среднем в 5 случаях будет совершена ошибка первого рода.

В таблице можно указать ошибки двух типов:

1.H0 верно α=pH0(H1) pH0(H0)=1-α
2.H1 верно β=pH1(H0) pH1(H1)=1-β

Выбор ошибки первого рода осуществляется при условии минимизации ошибки второго рода.

· Осуществляется расчет критерия φ.

· Анализируется критическая область, то есть подобласть таких значений критерия, которые свидетельствуют о значимом расхождении выборки с
H0 и о невозможности ее принятия. p(φ€W)=α, где W – критическая область. Существует три вида расположения W:

- Правосторонняя αкр, +∞)→p(φ>φαкр)=α, тогда φαкр является правосторонней критической точкой, соответствующей уровню значимости α.

- Левосторонняя -(-∞,φαкр)→p(φ<φαкр)=α.

- Двусторонняя – состоит из двух интервалов:

§

 

§

 

 

 

Наиболее распространенным критерием согласия является критерий Пирсона, или («хи-квадрат»):

 

 

, где nj – выборочные частоты, - выравнивающие частоты, полученные по модели. k – это количество событий в полной группе. При анализе критического значения следует указать число степеней свободы. Например, ν=k-q, где q – это количество линейных связей. Их расчет связан с условиями эксперимента: если накладывается только одно ограничение, а именно сумма частот:

 

При выборе биномиального распределения и распределения Пуассона кроме этого условия накладывается еще одна связь, а именно, выравнивающие частоты должны давать среднее значение, соответствующее статистике выборки. ν=k-2.

Ограничением в применении критерия Пирсонаявляется то, что nj≥5. χ2 – критерий обладает правосторонней W. Поэтому H0 принимается, если χ2-рассчетное меньше табличного. Кроме χ2-критерия можно реализовать критерий согласия Романовского. Он основан на применении критерия Пирсона и связан с расчетом новой статистики:

 

Если эта статистика ≥3, то расхождение можно считать существенным, иначе, случайным.