Проверка статистических гипотез
Нормальное распределение
Таблица 3.1
(значения za при различных a и Рд = 1 - a )
a | 1,00 | 0,50 | 0,30 | 0,10 | 0,05 | 0,01 | 0,001 |
1-a=Рд | 0,00 | 0,50 | 0,70 | 0,90 | 0,95 | 0,99 | 0,999 |
za | 0,00 | 0,6745 | 1,0364 | 1,6449 | 1,9600 | 2,5758 | 3,2905 |
При обработке результатов измерений часто нет предварительных сведений о дисперсии либо среднем квадратическом отклонении результатов наблюдений. Поэтому при построения доверительного интервала для М[Х] используется функция t, представленная соотношением (3.25) и таблицы распределения Стьюдента.
Ввиду того, что знание доверительного интервала при заданной доверительной вероятности дает наиболее полную информацию о значении измеренной величины, точности и достоверности измерения, ГОСТ 8.011 - 72 предписывает указывать его при представлении результатов измерения.
При обработке экспериментальных данных, имеющих статистическую природу (что, вообще говоря, свойственно любым экспериментальным данным), наряду с проведением точечного и интервального оценивания приходится проверять те или иные предположения, гипотезы.
Статистической гипотезой называется некоторое предположение о свойствах генеральной совокупности. Например, предположение, что некоторая случайная величина распределена нормально, является статистической гипотезой. Можно также высказывать гипотезы о значениях числовых характеристик, их соотношениях и т.д. Любая гипотеза формулируется до опыта, на основе априорных соображений, и проверяется на основе последующего эксперимента.
Процедура проверки статистической гипотезы производится при помощи критерия - функции результатов наблюдений, включающей в себя также величины или параметры, относительно которых высказаны предположения. Необходимо, чтобы в случае правильности предположения случайная функция-критерий имела известный закон распределения. Критерий имеет некоторую область возможных значений, которые он принимает в зависимости от конкретной выборки, В соответствии с характером распределения одни значения критерия являются более вероятными, другие - менее. При проверке статистических гипотез ситуацию огрубляют тем, что область маловероятных значений считают совсем запрещенной: если критерий принял столь маловероятное значение, то гипотеза считается неверной, отвергается. Если же критерий принял “достаточно вероятное” значение, то считается, что гипотеза не противоречит опыту и может быть принята. Граница, разделяющая маловероятные значения от вероятных, устанавливается экспериментатором на основании неформальных соображений, внешних по отношению к процедуре проверки гипотезы. Таким образом, область возможных значений делится на две части. Одна называется областью принятия гипотезы, другая (где гипотеза должна быть отвергнута) - критической областью. Чтобы проверить гипотезу, надо вычислить значение критерия и посмотреть, в какую область оно попадает.
Примерами критериев для проверки гипотез могут служить функции (3.23) - (3.25), которые раньше использовались для построения доверительных интервалов.
Поскольку вычисление критерия производится по случайной выборке, то и результат может быть различным. Всегда имеется некоторая вероятность получить как значение, отвергающее гипотезу, так и значение, требующее ее принятия. Иными словами, может быть совершена ошибка. Итак, высказана некоторая гипотеза, которая может быть объективно верна или объективно неверна. Затем извлекается выборка, вычисляется критерий и выносится решение принять гипотезу или ее отвергнуть. Возможные варианты приведены в в табл. 3.2.