Воспользуемся примером анализа, приведенном в учебнике В.Е. Гмурмана «Теория вероятностей и математическая статистика» (изд. «Высшая школа» М. 1977г. - с329-332).
Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи специально подобранной случайной величины — критерия согласия.
Критерием согласия называюткритерий проверки гипотезы в предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия: χ2 («кси квадрат»),Пирсона, Колмогорова, Смирнова и др. Ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство).
С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Обычно эмпирические и теоретические частоты различаются.
Например:
эмпирические частоты...... 6 13 38 74 106 85 30 10 4
теоретические частоты........3 14 42 82 99 76 37 11 2
Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется это либо малым числом наблюдений, либо способом их группировки, либо другими причинами.
Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.
Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает, на принятом уроне значимости ее согласие или несогласие с данными наблюдений.
Итак, пусть по выборке объема n получено эмпирическое распределение:
варианты............ хi х1 х2 ... хs
эмп. частоты....... ni п1 п2 ... пs
Допустим, что, в предположении нормального распределения генеральной совокупности, вычислены теоретические частоты ni .
При уровне значимости α требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.
В качестве критерия проверки нулевой гипотезы примем случайную величину χ2:
Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретическиё частоты, тем меньше величина критерия (*), и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.
Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. делением на пiдостигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда, когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением.
Доказано, что при п → со закон распределения случайной величины (*) независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения χ2 с k тепенями свободы. Поэтому случайная величина (*) обозначена через χ2, а сам критерий называют «критерием согласия χ2»
Число степеней свободы находят по равенству k= s—1—r, где s—число групп (частичных интервалов) выборки; r — число параметров предполагаемого распределения, которые оценены по данным выборки.
В частности, если предполагаемое распределение — нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому r=2 и число степеней свободы k = s-1- r = s—1—2 = s—З.
Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр λ, поэтому r= 1 и k=s—2. Поскольку односторонний критерий более «жёстко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы была равна принятому уровню значимости α :
Таким образом, правосторонняя критическая область определяется неравенством:
а область принятия нулевой гипотезы — неравенством:
Обозначим значение критерия, вычисленное по данным наблюдений, через χ2набл и сформулируем правило проверки нулевой гипотезы.
Далее проведём расчёт таблицы критических точек (табл. 14.2.1).
Таблица 14.2.1.