Выборочные эпидемиологические исследования.
Выборочные эпидемиологические исследования (sample stady) предназначены для того, чтобы, основываясь на данных, полученных при изучении заболеваемости относительно небольшой, части населения – выборки (sample), сделать выводы об особенностях изучаемого явления во всей популяции (генеральной совокупности), из которой данная выборка была сформирована. Таким образом, цель выборочных исследований получит репрезентативную (от лат. represento – представляю) информацию, которую можно было бы экстраполировать на всю популяцию.
Репрезентативность данных определяется репрезентативностью выборки. Репрезентативность выборки, прежде всего, зависит от правильного выбора генеральной совокупности, из которой впоследствии будет выбрана часть единиц наблюдения. По желанию исследователя генеральная совокупность может быть ограничена различными признаками: временем, территорией, возрастом, профессией и другими социальными и биологическими признаками людей.
Кроме того, репрезентативность выборки обеспечивается:
· необходимой численностью (объемом, размером) выборки;
· соблюдением принципа рандомизации.
Численность выборки (sample size) зависит от многих составляющих и, прежде всего, от характера исследования. Если цель исследования – оценка заболеваемости среди населения, то необходимо:
· выбрать (задать) степень достоверности измерения заболеваемости, т.е. величину возможного отклонения выборочных данных от данных изучения популяции;
· приблизительно знать частоту заболеваний, которая может быть обнаружена.
Если численность популяции неизвестна, размер выборки рассчитывается по формуле:
При известной численности популяции размер выборки рассчитывается по формуле: где: (для обеих формул):
n- искомая численность выборки;
N- численность популяции;
t- критерий достоверности (чаще всего равен 1,96 » 2)
I- предполагаемая частота заболеваний
q = (R- I) где, R - используемая размерность показателя I
D - выбранная предельно допустимая ошибка показателя. Обычно максимально допустимая ошибка составляет не более 25% от величины показателя (I).
Допустим, что в г. Н предполагается провести одномоментное выборочное исследование с целью изучения частоты новых случаев артериальной гипертензии среди мужчин 20-29 лет. Численность этой группы населения в г.Н. составляет 15400. По данным проводимого несколько лет назад исследования, частота новых случаев артериальной гипертензии в этой группе мужчин в г. Н. составляла около 70,00/00. (I=70,00/00). Следовательно, D составит 25% от 70,0 т.е.: D=(25´70,0)/100=17,50/00, D2=306,20/00
n = (70,0´(1000-70,0)´22´15400)/(15400´306,2)+(70,0´(100000-70,0)´22)=806 человек. Таким образом, для получения выборочных данных, соответствующих необходимой достоверности из 15400 мужчин 20-29 лет следует обследовать 806 человек.
В экспериментальных исследованиях для определения объема выборки приходится учитывать гораздо большее количество составляющих, поэтому способы расчета являются отдельной темой, не предусмотренной данным изданием.
Второе условие достижения репрезентативности выборки – соблюдение принципарандомизации (от англ. random – случай). Рандомизация обеспечивает случайный отбор в выборку лиц, представляющих генеральную совокупность. Другими словами рандомизация дает равный шанс каждой единице наблюдения из генеральной совокупности попасть в выборку, что снижает опасность непреднамеренного искажения состава выборки, но не может полностью исключить недобросовестность исследователя при ее формировании.
Выполнение принципа рандомизации обеспечивается различными способами формирования выборки. Выбор способа зависит от дизайна исследования, предполагаемой точности результатов, объема генеральной совокупности, возможности использования самого точного метода (см. ниже) и других объективных и субъективных причин.
В настоящее время идеальным способом рандомизации считается использование для выборки единиц наблюдения таблиц случайных чисел, или аналогичные им компьютерные программы. Этот способ обеспечиваетслучайный бесповторный отбор, при котором единица наблюдения выбирается из генеральной совокупности только один раз. Такой способ рандомизации является обязательным для формирования опытной и контрольной группы при проведении большинства клинических рандомизированных испытаний различных средств и способов лечения больных. по оценке на этапе формирования, что способствует соблюдению принципа беспристрастности исследования и минимизации непреднамеренного искажения состава групп. Это в свою очередь в значительной степени, при соблюдении дизайна исследования, обеспечивает надежные выводы. Однако следует помнить, что никакой дизайн не может полностью исключить недобросовестность исследователя.
Следующие способы основаны на определенной плановости в отборе единиц наблюдения, что, естественно снижает соблюдение принципа рандомизации.
Механический отбор. Вначале единицы наблюдения располагаются по порядку по какому-либо случайному признаку: номеру истории болезни, амбулаторной карте, первой букве фамилии, и т.п. Затем необходимо определить интервал, через который из списка генеральной совокупности механически будут выбираться единицы наблюдения (например, каждая пятая). Для определения интервала численность генеральной совокупности следует разделить на численность необходимой выборки.
Например, из, генеральной совокупности, составляющей 2600 человек, необходимо отобрать всего 325. Следовательно, из составленного списка генеральной совокупности следует обирать каждую 8 единицу наблюдения (2600/325=8).
Типологическая (типическая) выборка. Вначале генеральная совокупность разбивается на группы по какому либо типичному признаку. В качестве типичных, чаще всего используют различные индивидуальные признаки людей: возраст, профессию, воздействие предполагаемых факторов риска, болезнь и т.п. Далее случайным или механическим способом из каждой группы отбирается необходимое число единиц наблюдения. Объем выборки из каждой группы должен быть также заранее определен, а соотношение объемов выборок (например, по возрасту) должно соответствовать структуре генеральной совокупности. Такую выборку нередко называют взвешенной типологической выборкой. Этот способ, чаще всего, используется в наблюдательных аналитических исследованиях.
Серийный (гнездовой) отбор похож на типический. Различие состоит в том, что при серийном отборе из генеральной совокупности случайным способом выбираются не отдельные единицы наблюдения, а целые их группы, которые называют «сериями, или гнездами». «Гнездами» могут быть отдельные учреждения, цеха, врачебные участки, отделения, палаты и т.д. Далее в каждом «гнезде» проводится сплошное изучение всех единиц наблюдения.
Например, для описания заболеваемости гнойно-септическими инфекциями новорожденных в Москве и выяснения причин их возникновения и распространения, может оказаться достаточным проведение сплошных исследований лишь в ряде случайно выбранных родильных отделениях.
Метод направленного отбора предполагает еще на этапе определения генеральной совокупности исключать из аналитического изучения некоторые факторы, влияние которых хорошо известно. Например, влияние курения на риск заболеть раком легких хорошо известно, однако этот фактор не является единственным. Поэтому исследователи, поставившие цель выявить другие дополнительные факторы риска рака легкого, не должны включать в генеральную совокупность, а, следовательно, и в выборку, курящих лиц.
В заключение отметим, что преимущество выборочного исследования над сплошным, состоит в том, что при правильной организации, достоверные данные, можно получить, затрачивая гораздо меньше сил, средств и времени. При проведении выборочных исследований за счет их меньшего объема, гораздо легче проконтролировать получение унифицированной информации и свести возможные ошибки к минимуму. Вместе с тем, по объективным причинам, во многих исследованиях изучаются, так называемые, смещенные выборки, обладающие недостаточной репрезентативностью по отношению ко всей популяции, что следует принимать во внимание при оценке выводов таких исследований.