Проверка статистической гипотезы о равенстве средних значений двух выборок.
Лекция 3. Проверка статистических гипотез.
Статистическая гипотеза - это утверждение относительной одной или более характеристик распределения (относительно среднего значения, дисперсии) или о самой форме распределения.
Исходя из определения для одномерной случайной величины рассматриваются следующие статистические гипотезы:
1. Гипотеза однородности совокупности - когда изменчивость случайной величины мала и по выборке из N - наблюдений делается вывод о нормальном распределении случайной величины; что позволяет охарактеризовать выборку через числовые характеристики: среднее значение, выборочную дисперсию, доверительные интервалы;
2. Гипотеза о равенстве средних значений для выборок случайных величин с нормальным распределением;
3. Гипотеза о равенстве дисперсий для выборок случайных величин с нормальным распределением.
Для процедуры проверки статистических гипотез вводится понятиенулевой гипотезы - Н0 - это гипотеза согласия, а гипотеза наличия отклонения от принятого нами предположения называется альтернативной гипотезой - Н1.
Проверка статистических гипотез - это процедура выяснения принять или отвергнуть нулевую гипотезу ( обычно говорят - 1 - р доверительная вероятность (например 95%) принятия нулевой гипотезы, соответственно нулевая гипотеза может быть отвергнута с уровнем значимости р=5%).
При проверке статистических гипотез допускаются ошибки двух типов:
1. Гипотеза верна, а мы ее отвергаем- эту ошибку называют - a.
2. Гипотеза ошибочна , а мы ее принимаем-эту ошибку называют - b.
Ошибка первого рода - a, определяется уровнем значимости - a = р/2.
Таким образом чем меньше задан уровень значимости тем меньше ошибка первого рода.
Ошибка второго рода может быть учтена через 1- b-мощность критерия, который задает область неприятия ошибочной гипотезы, отвечающая аномальным значениям.(чем меньше мощность критерия 1- b,тем больше a, но уменьшение мощности приводит одновременно к увеличению ошибки b .
Единственный способ одновременно уменьшить aиbсостоит в увеличении объема выборки N, используемой для вычисления оценки среднего значения.
Требуемый размер выборки находится из:N = [ s ( tр/2.+ tb )/D ]2
Приведенная формула является более корректной по сравнению с обычно употребляемой, для определения объема выборки по критерию Стьюдента, рассмотренной в предыдущем разделе, где учитывается только уровень значимости a.
Пусть Х1ср, S21 , n1 -параметры первой выборки; Х2ср, S22 , n2 -параметры второй выборки;
Сравнение двух средних значений для обоснования гипотезы независимости или объединения двух выборок может быть представлено в виде таблицы
Равенство | Независимость выборок | |
дисперсий | Да | Нет |
Да | Двухвыборочный t -критерий | Парный t-критерий |
Нет | t-критерий Уэлча | Парный t-критерий |
Парный t-критерий :
t =(Х1ср - Х2ср) Ön / Sd,где n= n1 + n2 , S2d =(S1 -S2)2 = S21 + S22 - 2S12
для n= n - 1 степеней свободы
Двухвыборочный t-критерий:
t =[(Х1ср - Х2ср)/Sp Ö(1/n1 +1/n2),
где S2p= [( n1- 1)S21+( n2- 1)S22] / (n1 + n2 -2),дляn=(n1 + n2 -2)степеней свободы
t-критерий Уэлча :
t =[(Х1ср - Х2ср)/ Ö(S12/n1 +S22/n2),
дляn= (S12/n1 +S22/n2)2 / [ S14/n12 (n1 - 1) + S24/n22 (n2 - 1)]степеней свободы.