Проверка статистической гипотезы о равенстве средних значений двух выборок.

Лекция 3. Проверка статистических гипотез.

Статистическая гипотеза - это утверждение относительной одной или более характеристик распределения (относительно среднего значения, дисперсии) или о самой форме распределения.

Исходя из определения для одномерной случайной величины рассматриваются следующие статистические гипотезы:

1. Гипотеза однородности совокупности - когда изменчивость случайной величины мала и по выборке из N - наблюдений делается вывод о нормальном распределении случайной величины; что позволяет охарактеризовать выборку через числовые характеристики: среднее значение, выборочную дисперсию, доверительные интервалы;

2. Гипотеза о равенстве средних значений для выборок случайных величин с нормальным распределением;

3. Гипотеза о равенстве дисперсий для выборок случайных величин с нормальным распределением.

Для процедуры проверки статистических гипотез вводится понятиенулевой гипотезы - Н₀- это гипотеза согласия, а гипотеза наличия отклонения от принятого нами предположения называется альтернативной гипотезой - Н₁.

Проверка статистических гипотез - это процедура выяснения принять или отвергнуть нулевую гипотезу ( обычно говорят - 1 - р доверительная вероятность (например 95%) принятия нулевой гипотезы, соответственно нулевая гипотеза может быть отвергнута с уровнем значимости р=5%).

При проверке статистических гипотез допускаются ошибки двух типов:

1. Гипотеза верна, а мы ее отвергаем- эту ошибку называют - a.

2. Гипотеза ошибочна , а мы ее принимаем-эту ошибку называют - b.

Ошибка первого рода - a, определяется уровнем значимости - a = р/2.

Таким образом чем меньше задан уровень значимости тем меньше ошибка первого рода.

Ошибка второго рода может быть учтена через 1- b-мощность критерия, который задает область неприятия ошибочной гипотезы, отвечающая аномальным значениям.(чем меньше мощность критерия 1- b,тем больше a, но уменьшение мощности приводит одновременно к увеличению ошибки b .

Единственный способ одновременно уменьшить aиbсостоит в увеличении объема выборки N, используемой для вычисления оценки среднего значения.

Требуемый размер выборки находится из:N = [ s ( t_р/2.+t_b )/D ]²

Приведенная формула является более корректной по сравнению с обычно употребляемой, для определения объема выборки по критерию Стьюдента, рассмотренной в предыдущем разделе, где учитывается только уровень значимости a.

Пусть Х₁ср, S²₁, n₁ -параметры первой выборки; Х₂ср, S²₂, n₂-параметры второй выборки;

Сравнение двух средних значений для обоснования гипотезы независимости или объединения двух выборок может быть представлено в виде таблицы

Равенство	Независимость выборок
дисперсий	Да	Нет
Да	Двухвыборочный t -критерий	Парный t-критерий
Нет	t-критерий Уэлча	Парный t-критерий

Парный t-критерий :

t =(Х₁ср - Х₂ср) Ön / Sd,где n= n₁+ n_{2 ,}S²d =(S₁ -S₂)² = S²₁+ S²₂ - 2S₁₂

для n= n - 1 степеней свободы

Двухвыборочный t-критерий:

t =[(Х₁ср - Х₂ср)/Sp Ö(1/n₁ +1/n₂),

где S²p= [( n₁- 1)S²₁+( n₂- 1)S²₂] / (n₁+ n₂-2),дляn=(n₁+ n₂-2)степеней свободы

t-критерий Уэлча :

t =[(Х₁ср - Х₂ср)/ Ö(S₁²/n₁ +S₂²/n₂),

дляn= (S₁²/n₁ +S₂²/n₂)² / [ S₁⁴/n₁² (n₁- 1) + S₂⁴/n₂² (n₂- 1)]степеней свободы.