ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ БЕЗ ПОВТОРЕНИЙ И С ПОВТОРЕНИЯМИ

Аналогично задаче однофакторного дисперсионного анализа можно рассмотреть задачу о действии на результативный признак Y двух факторов – A и B.

Логика однофакторного и двухфакторного дисперсионного анализа во многом схожа и состоит в следующем.

Пусть - математическое ожидание результативного призна­ка Y при уровне A(j) (j = 1, 2, … ca) ; - математическое ожидание результативного признака Y при уровне B(l) (l = 1, 2, … cb). Если при изменении уровня фактора A групповые математические ожидания не изменяются, то считаем, что результативный признак не зависит от фактора А, в противном случае такая зависимость имеется. Аналогично, если при измене­нии уровня фактора B сохраняется равенство групповых математических ожиданий, то считаем, что Y не зависит от фактора B. Но поскольку числовые значения математических ожиданий неизвестны, возникает задача проверки следующих гипотез:

Проверять эти гипотезы, так же как и в задаче однофакторно­го дисперсионного анализа, можно только при соблюдении сле­дующих требований:

1) при различных сочетаниях уровней факторов A и B наблю­дения независимы;

2) при каждом сочетании уровней факторов A и B результатив­ный признак Y имеет нормальный закон распределения с посто­янной для различных сочетаний генеральной дисперсией σ2.

Основой проведения двухфакторного дисперсионного анали­за служит комбинационная группировка по двум факторам с по­следующим разложением полной вариации результативного признака на сумму вариаций фактора A и фактора B, вариации взаимодействия и случайной ошибки по формуле

где:

- полная вариация. Определяется как полная сумма квадратов отклонения от общего среднего:

.

Общее среднее значение равно:

- вариация фактора A — показатель ва­риации, вызванной влиянием на Y фактора A;

где - среднее значение, соответствующее j – ому уровню фактора A

- вариация фактора В — показатель ва­риации, вызванной влиянием на Y фактора B;

где - среднее значение, соответствующее l – ому уровню фактора B

- вариация взаимодействия. Определяет эффект взаимодействия между факторами A и B.

где - среднее значение, соответствующее i –ому уровню фактора A и l – ому уровню фактора B

- случайная ошибка. Показатель вариации, вызванной влиянием на Y остаточных факторов.

Если каждую сумму квадратов отклонений разделить на соответствующее число степеней свободы, то получится четыре типа дисперсии , , ,

В двухфакторном дисперсионном анализе применяются три разных критерия.

Для проверки гипотезы об отсутствии эффекта фактора A и альтернативной гипотезы H1: не все mj равны используется F – критерий Фишера:

,

 

В математической статистике доказывается, что если гипотеза верна, то величина имеет F - распределение с числом степеней свободы df1 = (ka – 1) и df2 = (ka – 1) (kb – 1).

Для проверки гипотезы об отсутствии эффекта фактора B и альтернативной гипотезы H1: не все ml равны используется F – критерий Фишера:

,

 

В математической статистике доказывается, что если гипотеза верна, то величина имеет F - распределение с числом степеней свободы df1 = (cb – 1) и df2 = (ca – 1) (cb – 1).

Для проверки гипотезы об отсутствии эффекта взаимодействия факторов A и B

: взаимодействие факторов A и B равно нулю

и альтернативной гипотезы

H1: взаимодействие факторов A и B не равно нулю

используется F – критерий Фишера:

,

 

Проверка выдвинутых гипотез осуществляется так же, как и при однофакторном дисперсионном анализе, и состоит в нахожде­нии правосторонних критических интервалов с после­дующим контролем попадания (или непопадания) в данный интер­вал расчетных значений FA (или FB) Если расчетное значение по­падает в критический интервал, то гипотеза () отвергается, т.е. считается, что фактор A (B) влияет на результативный признак Y

Двухфакторный дисперсионный анализ может иметь две раз­новидности:: без повторений и с повторениями. В первом случае каждому уровню факторов соответствует только одна выборка данных, во втором — определенным уровням факторов может со­ответствовать более одной выборки данных.

Пример двухфакторного дисперсионного анализа с повторениями.

Исследуется зависимость продолжительности работы подшипников при автоколебании нагревании. Данные эксперимента приведены в таблице

  Слабое нагревание Сильное нагревание
Слабое автоколебание
 
Сильное автоколебание
 

 

Инструмент анализа Excel «Двухфакторный дисперсионный анализ с повто­рениями» служит для выяснения на основе выборочных данных факта влияния контролируемых факторов A и B на результатив­ный признак Y. В диалоговом окне зада­ются те же параметры, что и в диалоговом окне «Однофакторный дисперсионный анализ», только добавлено поле Число строк для выборки. B это поле вводится число наблюдений, приходящихся на каждый уровень одного из факторов. Каждый уровень фактора должен содержать одно и то же количество наблюдений (строк таблицы).

Результаты расчетов приведены в таблице

Двухфакторный дисперсионный анализ с повторениями  
             
ИТОГИ Слабое нагревание Сильное нагревание Итого      
Слабое автоколебание      
Счет      
Сумма      
Среднее 19,5      
Дисперсия 43,66667      
             
Сильное автоколебание      
Счет      
Сумма      
Среднее      
Дисперсия 2392,667      
             
Итого      
Счет        
Сумма        
Среднее 20,5        
Дисперсия        
             
             
Дисперсионный анализ        
Источник вариации SS df MS F P-Значение F критическое
Выборка 4140,5 4140,5 67,87705 0,001184 7,70865
Столбцы 3784,5 3784,5 62,04098 0,001404 7,70865
Взаимодействие 3280,5 3280,5 53,77869 0,00184 7,70865
Внутри      
             
Итого 11449,5        

 

Анализ полученных результатов позволяет сделать следующие выводы.

1. Гипотезу об отсутствие статистически значимого эффекта взаимодействия () следует отклонить поскольку больше критического значения 7,7 (соответственно p – значение меньше уровня значимости α = 0,05) ;

2. Гипотезу об отсутствие статистически значимого эффекта взаимодействия () следует отклонить поскольку больше критического значения 7,7 (соответственно p – значение меньше уровня значимости α = 0,05) ;

3. Гипотезу об отсутствие статистически значимого эффекта взаимодействия () следует отклонить поскольку больше критического значения 7,7 (соответственно p – значение меньше уровня значимости α = 0,05) ;

Двухфакторный дисперсионный анализ с повто­рениями

Дисперсионный анализ        
Источник вариации SS df MS F P-Значение F критическое
Выборка              
Столбцы              
Взаимодействие              
Внутри              
             
Итого