ДВУХВЫБОРОЧНЫЙ T-ТЕСТ С ОДИНАКОВЫМИ И РАЗЛИЧНЫМИ ДИСПЕРСИЯМИ.
На основе t-теста строится процедура проверки гипотез о равенстве средних (математических ожиданий) двух независимых нормальных распределений с неизвестными дисперсиями и .
Относительно дисперсий и можно выдвинуть следующие два предположения:
1) Обе дисперсии неизвестны, но предполагается, что они равны между собой, т.е. =.
2) Обе дисперсии неизвестны и предполагается, что они не равны между собой, т.е. ≠.
Ø В случае когда обе дисперсии неизвестны, но предполагается что они равны между собой, мы имеем дело с двумя оценками и одной и той же дисперсии =. в этом случае строится объединённая оценка :
,
S2- это объединённая оценка дисперсии ==.
В математической статистике доказывается, что если нулевая гипотеза о равенстве математических ожиданий H0: mx=my выполняется, то величина t вычисляется по формуле:
где и - средние арифметические величины,
n1 – число наблюдений в первой выборке,
n2- число наблюдений во второй выборке,
S – выборочное стандартное отклонение,
.
Статистика t имеет распределение Стьюдента. Число степеней свободы определяется по формуле:
Эту t-статистику и используют в качестве критерия при проверке нулевой гипотезы о равенстве математических ожиданий. Схема проверки аналогична проверке при использовании Z-теста.
Ø В случае, когда дисперсии неизвестны и предполагается, что они не равны, используется аналог Z-теста с заменой дисперсий их оценками.
- это распределение близко распределению Стьюдента. Число степеней свободы вычисляется по следующей формуле:
В данном случае t-статистику, используемую для проверки нулевой гипотезы о равенстве средних величин при различных неизвестных дисперсиях, называют критерием Фишера-Беренса.
Для проверки гипотезы используется следующие режимы пакета анализа:
~ Режим работы «двухвыборочный t-тест с одинаковыми дисперсиями».
~ Режим работы «двухвыборочный t-тест с различными дисперсиями».
Данные режимы применяются для проверки гипотез о различии между средними двух нормальных распределений соответственно с неизвестными, но равными дисперсиями, и с неизвестными, но различными дисперсиями.
В диалоговых окнах данных режимов задаются следующие параметры:
* Интервал переменной 1: задаем диапазон с данными выборки х;
* Интервал переменной 2: задаем диапазон с данными выборки у;
* Гипотетическая разность: задаём значение ноль;
* Метки;
* Уровень значимости : 0,05;
* Параметры вывода на экран.
Пример.
Рассмотрим выборочные данные о расходе сырья при производстве продукции по старой и новой технологии.
Старая технология | |||||||||||||
Новая технология |
Уровень значимости = 0,05
Требуется проверить гипотезу H0: mx=my , предположив, что соответствующие генеральные совокупности имеют нормальное распределение
1) с одинаковыми дисперсиями;
2) с различными дисперсиями.