Проверка статистической гипотезы о равенстве средних значений двух выборок.

Лекция 3. Проверка статистических гипотез.

 

Статистическая гипотеза - это утверждение относительной одной или более характеристик распределения (относительно среднего значения, дисперсии) или о самой форме распределения.

Исходя из определения для одномерной случайной величины рассматриваются следующие статистические гипотезы:

1. Гипотеза однородности совокупности - когда изменчивость случайной величины мала и по выборке из N - наблюдений делается вывод о нормальном распределении случайной величины; что позволяет охарактеризовать выборку через числовые характеристики: среднее значение, выборочную дисперсию, доверительные интервалы;

2. Гипотеза о равенстве средних значений для выборок случайных величин с нормальным распределением;

3. Гипотеза о равенстве дисперсий для выборок случайных величин с нормальным распределением.

Для процедуры проверки статистических гипотез вводится понятиенулевой гипотезы - Н0 - это гипотеза согласия, а гипотеза наличия отклонения от принятого нами предположения называется альтернативной гипотезой - Н1.

Проверка статистических гипотез - это процедура выяснения принять или отвергнуть нулевую гипотезу ( обычно говорят - 1 - р доверительная вероятность (например 95%) принятия нулевой гипотезы, соответственно нулевая гипотеза может быть отвергнута с уровнем значимости р=5%).

При проверке статистических гипотез допускаются ошибки двух типов:

1. Гипотеза верна, а мы ее отвергаем- эту ошибку называют - a.

2. Гипотеза ошибочна , а мы ее принимаем-эту ошибку называют - b.

Ошибка первого рода - a, определяется уровнем значимости - a = р/2.

Таким образом чем меньше задан уровень значимости тем меньше ошибка первого рода.

Ошибка второго рода может быть учтена через 1- b-мощность критерия, который задает область неприятия ошибочной гипотезы, отвечающая аномальным значениям.(чем меньше мощность критерия 1- b,тем больше a, но уменьшение мощности приводит одновременно к увеличению ошибки b .

Единственный способ одновременно уменьшить aиbсостоит в увеличении объема выборки N, используемой для вычисления оценки среднего значения.

Требуемый размер выборки находится из:N = [ s ( tр/2.+ tb )/D ]2

Приведенная формула является более корректной по сравнению с обычно употребляемой, для определения объема выборки по критерию Стьюдента, рассмотренной в предыдущем разделе, где учитывается только уровень значимости a.

Пусть Х1ср, S21 , n1 -параметры первой выборки; Х2ср, S22 , n2 -параметры второй выборки;

Сравнение двух средних значений для обоснования гипотезы независимости или объединения двух выборок может быть представлено в виде таблицы

Равенство Независимость выборок
дисперсий Да Нет
Да Двухвыборочный t -критерий Парный t-критерий
Нет t-критерий Уэлча Парный t-критерий

Парный t-критерий :

t =1ср - Х2ср) Ön / Sd,где n= n1 + n2 , S2d =(S1 -S2)2 = S21 + S22 - 2S12

для n= n - 1 степеней свободы

Двухвыборочный t-критерий:

t =[1ср - Х2ср)/Sp Ö(1/n1 +1/n2),

где S2p= [( n1- 1)S21+( n2- 1)S22] / (n1 + n2 -2),дляn=(n1 + n2 -2)степеней свободы

t-критерий Уэлча :

t =[1ср - Х2ср)/ Ö(S12/n1 +S22/n2),

дляn= (S12/n1 +S22/n2)2 / [ S14/n12 (n1 - 1) + S24/n22 (n2 - 1)]степеней свободы.