О законе распределения генеральной совокупности

Статистическая проверка гипотезы

 

Допустим, что для данного статистического распределения подобрана некоторая гипотетическая теоретическая кривая f (х). Как бы хорошо ни была подобрана теоретическая кривая, между нею и статистическим распределением неизбежны некоторые расхождения. Естественно, возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, что подобранная нами кривая плохо описывает данное статистическое распределение. Для ответа на такой вопрос служат так называемые «критерии согласия».

Статистической называют гипотезу о виде неизвестного распределения.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1,которая противоречит нулевой.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через α(наиболее часто уровень значимости принимают равным 0,05 или 0,01).

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через β.

Последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Разумеется, можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно.

Статистическим критерием (или просто критерием)называют случайную величину K, которая служит для проверки нулевой гипотезы. Наблюдаемым значением Kнабл называют то значение критерия, которое вычислено по выборкам.

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством ,где – положительное число.

Таким образом, для отыскания правосторонней критической области достаточно найти критическую точку. Чтобы ее найти, задаются достаточно малой вероятностью – уровнем значимости α. Затем ищут критическую точку , исходя из требования, чтобы, при условии справедливости нулевой гипотезы, вероятность того, что критерий K примет значение, большее , была равна принятому уровню значимости:

.

Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Было рассмотрено построение критической области, исходя из требования, чтобы вероятность попадания в нее критерия была равна α при условии, что нулевая гипотеза справедлива. Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что, то нулевую гипотезу отвергают; еслито нет оснований, чтобы отвергнуть нулевую гипотезу.

Рассмотрим критерий Пирсона проверки гипотезы о предполагаемом законе неизвестного распределения. С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении гипотетического распределения) частоты.

Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется малым числом наблюдений либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены, исходя из неверной гипотезы о предполагаемом распределении генеральной совокупности.

Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает, на принятом уровне значимости, ее согласие или несогласие с данными наблюдений.

В критерии Пирсона в качестве меры расхождения между теоретическим и статистическим распределениями берут сумму квадратов отклонений эмпирических () и теоретических () абсолютных частот с соответствующим коэффициентом пропорциональности. Эта величина обозначается , а сам критерий называется критерием согласия «хи квадрат». Этот параметр, вычисленный по статистическому материалу, обозначается , т. е. «наблюдаемое хи в квадрате».

.

Пирсон доказал, что независимо от гипотетического закона распределения при стремится к распределению в теории с r степенями свободы. Это теоретическое значение является критической точкой, которая отделяет критическую область от области принятия гипотезы и обозначается .

При уровне значимости и степени свободы , где k – число интервалов, q − число параметров распределения, можно найти по таблице распределения Пирсона (прил. 3).

Критическая область критерия Пирсона определяется неравенством . Поэтому, если мера расхождения попадает в критическую область, то гипотеза отклоняется; если же , то нет оснований отвергнуть проверяемую гипотезу.

Заметим, что наблюдаемое значение критерия может оказаться большим не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента).

Также заметим, что при пользовании критерием достаточно большим должен быть не только общий объем выборки (несколько сотен), но и абсолютная частота в отдельных интервалах должна быть не менее 5. Если это требование нарушается, то имеет смысл объединить некоторые интервалы в один.