Воспользуемся примером анализа, приведенном в учебнике В.Е. Гмурмана «Теория вероятностей и математическая статистика» (изд. «Высшая школа» М. 1977г. - с329-332).

Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи специально подобранной случайной величины — критерия согласия.

Критерием согласия называюткритерий проверки гипотезы в предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия: χ2 («кси квадрат»),Пирсона, Колмогорова, Смирнова и др. Ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство).

С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.

 

Обычно эмпирические и теоретические частоты различаются.

Например:

эмпирические частоты...... 6 13 38 74 106 85 30 10 4

теоретические частоты........3 14 42 82 99 76 37 11 2

 

Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется это либо малым числом наблюдений, либо способом их группировки, либо другими причинами.

Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.

Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает, на принятом уроне значимости ее согласие или несогласие с данными наблюдений.

Итак, пусть по выборке объема n получено эмпирическое распределение:

варианты............ хi х1 х2 ... хs

эмп. частоты....... ni п1 п2 ... пs

Допустим, что, в предположении нормального распределения генеральной совокупности, вычислены теоретические частоты ni .

При уровне значимости α требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.

В качестве критерия проверки нулевой гипотезы примем случайную величину χ2:

 

Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретическиё частоты, тем меньше величина критерия (*), и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.

Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. делением на пiдостигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда, когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением.

Доказано, что при п → со закон распределения случайной величины (*) независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения χ2 с k тепенями свободы. Поэтому случайная величина (*) обозначена через χ2, а сам критерий называют «критерием согласия χ2»

Число степеней свободы находят по равенству k= s—1—r, где s—число групп (частичных интервалов) выборки; r — число параметров предполагаемого распределения, которые оценены по данным выборки.

В частности, если предполагаемое распределение — нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому r=2 и число степеней свободы k = s-1- r = s12 = sЗ.

Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр λ, поэтому r= 1 и k=s—2. Поскольку односторонний критерий более «жёстко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы была равна принятому уровню значимости α :

Таким образом, правосторонняя критическая область определяется неравенством:

 

а область принятия нулевой гипотезы — неравенством:

 

 

Обозначим значение критерия, вычисленное по данным наблюдений, через χ2набл и сформулируем правило проверки нулевой гипотезы.

 

 

Далее проведём расчёт таблицы критических точек (табл. 14.2.1).
Таблица 14.2.1.