СПЕЦИФИЧЕСКОЕ РАСЩЕПЛЕНИЕ ДНК УЛЬТРАЗВУКОМ
Чтобы выяснить, влияет ли на относительную частоту расщепления не только тип динуклеотида (фактор A), но и какой вклад в общую изменчивость относительной частоты расщепления обусловлен последовательностью анализируемого участка рестриктного фрагмента ДНК (фактор B), будем использовать двухфакторный дисперсионный анализ. Уровни фактора A являются постоянными, а уровни фактора B естественно рассматривать как случайные. В этом случае для анализа результатов эксперимента используется смешанная двухфакторная модель. В качестве плана эксперимента рассмотрим двухфакторный план с группировкой (nested design) для смешанной модели. Это план, для которого уровни одного фактора A группируются по уровням другого фактора B. При этом каждый уровень фактора В группируется не более чем с одним уровнем фактора A, и фактор B называется сгруппированным фактором A, B(A). Такой план позволяет оценить и ошибки наблюдения, и вклад случайного фактора B(A) в общую изменчивость относительной частоты расщепления, и влияние постоянного фактора A на относительную частоту расщепления.
Для построения такого плана для каждого типа динуклеотида (постоянный фактор A с I уровнями) случайно выбирались «свои» J фрагментов ДНК (случайный фактор B с J уровнями). У каждого из J фрагментов для типа динуклеотида NN определяли значения частоты расщепления этого динуклеотида NN. В этом случае каждый уровень фактора B сочетался не более чем с одним уровнем фактора A.
Смешанная модель для двухфакторного плана с группировкой имеет вид
yijk = μ + αi + bj(i) + εijk, k=1,…, kij, i=1,…, I; j=1,…, J,
где μ – общее среднее, αi – эффект i-огоуровня постоянного фактора A, bj(i) – эффект j-огоуровня случайного фактора B, B(A), сгруппированного i-ым уровнем фактора A; – неизвестные параметры; εijk – ошибки наблюдений; bj(i) и εijk – независимые в совокупности случайные величины с нулевым средним и дисперсиями и , соответственно. Дисперсия наблюдения yijk будет равна . Компонента дисперсии обусловлена вкладом случайного фактора B(A), сгруппированного фактором A, в общую изменчивость зависимой переменной.
Было рассмотрено пять моделей такого типа, и построено пять планов с группировкой для каждой из них:
1. Для анализа частоты расщепления каждого из 16 динуклеотидов ДНК, NN; I=16; J=8.
2. Для анализа частоты расщепления каждого из динуклеотидов ДНК, AN; I=4; J=19.
3. Для анализа частоты расщепления каждого из динуклеотидов ДНК, СN; I=4; J=19.
4. Для анализа частоты расщепления каждого из динуклеотидов ДНК, GN; I=4; J=23.
5. Для анализа частоты расщепления каждого из динуклеотидов ДНК, TN; I=4; J=19.
Статистические задачи дисперсионного анализа для рассматриваемой модели состоят в том, чтобы найти оценки неизвестных параметров и проверить статистические гипотезы. Для такой модели проверяются две гипотезы:
Статистические задачи дисперсионного анализа для рассматриваемой модели состоят в том, чтобы найти оценки неизвестных параметров и проверить статистические гипотезы. Для такой модели проверяются две гипотезы:
1. H0: все αi=0, i=1,..., I, что означает – фактор A не влияет, при альтернативе, что, по крайней мере, αk ≠0, что означает – фактор A влияет.
2. H0: =0 о том, что фактор B(A) не вносит никакого вклада в дисперсию наблюдений, при альтернативе H1: ≠0.
Необходимо отметить, что все построенные планы являются планами с неравным числом наблюдений при разных комбинациях уровней факторов A и B(A). Поэтому при определении значений числа степеней свободы, ν*, которые в таблицах не приводятся, оценок компонент дисперсии, значений MS, и, следовательно, наблюденного значения статистики критерия, F-отношения, использовался метод Саттервейта. В табл. 7 приведены значения оценок компонент дисперсии и оценка доли дисперсии наблюдения, которая обусловлена фактором B(A) для каждой из пяти рассматриваемых моделей. Оценка дисперсии единичного наблюдения, , определялась как сумма оценок компонент дисперсии и .
Таблица 2. Результаты дисперсионного анализа
для динуклотидов NN.
Источник разброса | Число степеней свободы ν | Средний квадрат MS | F-отношение | p- Значение |
фактор A | 2,41 | 24,82 | 0,00 | |
фактор B(A) | 0,09 | 2,21 | 0,00 | |
Остаток | 0,04 |
Анализ табл. 2 показывает, что влияние типа динуклеотида NN и первичной структуры фрагмента ДНК на относительную частоту ультразвукового расщепления статистически значимо на уровне α=0,05
Таблица 7. Значения оценок компонент дисперсии. Обозначения: / – оценка доли общей дисперсии, обусловленной фактором B(A); / – оценка доли дисперсии ошибки наблюдения.
Модель | / *100% | / *100% | |||
0,0038 | 0,0357 | 0.0395 | 9,6% | 90,4 | |
0,0034 | 0,0256 | 0,0290 | 11,7% | 88,3 | |
0,0096 | 0,0976 | 0,1072 | 9,8% | 90,2 | |
0,0050 | 0,0379 | 0,0429 | 11,6% | 88,4 | |
0,0011 | 0,0208 | 0,0219 | 5,0% | 95,0 |
Статистический анализ экспериментальных данных расщепления ДНК ультразвуком выявил влияние на относительную частоту расщепления двух факторов, типа динуклеотида и нуклеотидной последовательности фрагмента ДНК, и позволил оценить долю дисперсии наблюдения, которая обусловлена случайным фактором – нуклеотидной последовательностью фрагмента ДНК. Результаты анализа показали, что вклад случайного фактора в общую изменчивость относительной частоты расщепления, много меньше, чем вклад фактора – тип динуклеотида.