ПАРНЫЙ ДВУХВЫБОРОЧНЫЙ T-ТЕСТ ДЛЯ СРЕДНИХ ЗНАЧЕНИЙ.

 

Рассмотренные нами процедуры использовались для сравнения средних величин для двух независимых генеральных совокупностей на основе извлеченных из них выборок. Парный двухвыборочный t-тест для средних значений позволяет оценить разность между математическими ожиданиями двух генеральных совокупностей, связанных между собой, когда показатели первой группы зависят от показателей другой. Использование этого теста часто применяются для того, чтобы обнаружить результат какого-либо воздействия или, наоборот, доказать отсутствие этого воздействия. Чем более однородными окажутся выбранные для эксперимента объекты, чем меньше их различия, тем точнее будет ответ на вопрос о том, имеет ли место какое либо воздействие на результат или нет.

Различия между объектами, выбранными для обнаружения воздействия некоторого фактора на результат, будет меньше, если для воздействия и контроля выступает один и тот же объект.

Например, необходимо проверить, влияет ли разность температур на величину растяжения металлической проволоки. Каждый из n образцов проволоки разламывается на два одинаковых куска, для одного измеряется нагрузка на растяжение при низкой температуре, а для другого при высокой температуре. Составляют группы экспериментальных объектов. Для каждого объекта измеряют два значения интересующей нас величины (при двух разных воздействиях), т.е.возникают пары наблюдения (парные длины).

 

Низкая температура 10,40 10,36 10,38 10,41 10,43 10,42 10,39 10,41 10,38 10,40
Высокая температура 10,41 10,38 10,38 10,43 10,44 10,42 10,40 10,42 10,38 10,41

 

Пусть хi и уi - результаты измерения для объекта i, где 1£ i£ n, тогда совокупность случайных величин: {(х11), …, (хn,yn)} образует парные данные. Все наблюдения считаются реализациями случайных величин X, Y. При этом предполагается, что для двух разных объектов они независимы. Однако наблюдения, входящие в одну пару нельзя считать независимыми, т.к. они относятся к одному объекту и, следовательно, они отражают свойства общего объекта и могут зависеть друг от друга. Поэтому, для того, чтобы характеризовать пару наблюдений (хi , уi )вводится новая случайная переменная . Эту переменную можно считать независимой и нормально распределённой случайной величиной.

Таким образом, задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии .

При неизвестной дисперсии гипотеза выглядит следующим образом:

Н0: md=a0 , где md = mx – my –это математическое ожидание случайной величины d, a0 –заранее заданное число - гипотетическая разность, равная в данном случае нулю.

Для проверки этой гипотезы используется t-критерий, который вычисляется по формуле:

,

где

.

t-критерий имеет распределение Стьюдента с числом степеней свободы df=n-1.

Для проверки гипотезы о различиях между средними используется инструмент анализа «Парный двухвыборочный t-тест для средних» на основе парных выборочных данных. При этом равенства дисперсий генеральных совокупностей не предполагается. В диалоговом окне задаются интервалы переменной 1 и переменной 2, гипотетическая разность, равная нулю.

Если дисперсия случайной величины D известна, то можно использовать аналог z – критерия

который имеет нормальное распределение.

Результат применения инструмента анализа «Парный двухвыборочный t-тест для средних» к данным испытания по растяжению проволоки приведены в таблице.

 

Парный двухвыборочный t-тест для средних  
     
Переменная 1 Переменная 2
Среднее 10,398 10,407
Дисперсия 0,00044 0,000467778
Наблюдения
Корреляция Пирсона 0,940464883  
Гипотетическая разность средних  
df  
t-статистика -3,857142857  
P(T<=t) одностороннее 0,001931949  
t критическое одностороннее 1,833113856  
P(T<=t) двухстороннее 0,003863898  
t критическое двухстороннее 2,262158887  

 

Поскольку альтернативная гипотеза состоит в том, что md ≠ a0, необходимо использовать двухсторонний критерий. Поскольку p – уровень имеет маленькое значение (0,003863898), то гипотезу о равенстве средних значений можно отвергнуть при уровне значимости α = 0,01. Следовательно можно утверждать, что температура влияет на величину растяжения проволоки.