Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона
Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А. Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи специально подобранной случайной величины — критерия согласия.
Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Имеется несколько критериев согласия: «хи квад- квадрат» (критерий Пирсона), Колмогорова, Смирнова и др. Ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство). С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Критерий Пирсона не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Итак, пусть по выборке объема n получено эмпирическое распределение:
варианты
частоты
Теоретическими называются частоты, вычисленные по формуле
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты. При уровне значимости требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы примем случайную величину
Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина данного критерия, и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.
Доказано, что при закон распределения случайной величины независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения с k степенями свободы.
Число степеней свободы находят по равенству
В частности, если предполагаемое распределение нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому r = и число степеней свободы
Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр , поэтому r = 1 и k=s - 2.
Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу H0: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия
и по таблице критических точек распределения по заданному уровню значимости и числу степеней свободы k = s-3 найти критическую точку .
Если нет оснований отвергнуть нулевую гипотезу.
Если нулевую гипотезу отвергают.
Замечание 1. Объем выборки должен быть достаточно велик, во всяком случае, не менее 50. Каждая группа должна содержать не менее 5-8 вариант; малочисленные группы следует объединять в одну, суммируя частоты.
Замечание 3. Для контроля вычислений формулу преобразуют к виду
Пример: Известны
16; 13; 11; 15; 18; 19; 21; 18; 17; 15; 14; 16; 18; 17; 19; 15; 13; 12; 14; 16; 17; 20; 17; 17; 20; 19; 18; 22; 24; 18; 15; 14; 10; 12; 16; 18; 18; 19; 21; 23; 20; 22; 24; 17; 16; 14; 15; 18; 15; 11; 16; 17; 15; 13; 16; 17; 18; 14; 15; 19; 17; 18; 16; 13; 15; 17; 21; 23; 26; 19; 22; 24; 25; 20; 21; 24; 19; 23; 22; 20; 25; 21; 20; 22; 26; 19; 22; 23; 25; 28; 20; 21; 27; 19;10;26;12;28;11;27 - результаты независимых наблюдений над случайной величиной Х.
1. Сгруппировать эти данные в интервальную таблицу, подобрав длину интервала.
2. Построить гистограмму, полигон частот и эмпирическую функцию распределения.
3. Найти несмещённые оценки для математического ожидания и дисперсии случайной величины Х. Указать моду М0.
4. По критерию χ2 (Пирсона) проверить гипотезу о том, что случайная величина Х имеет нормальный закон распределения.
5. Найти интервальные оценки математического ожидания и дисперсии случайной величины Х с уровнем доверия γ=0,9.