Методы случайного (вероятностного) отбора

Случайная выборка — это выборка, для которой соблюдены два условия: во-первых, все элементы генеральной совокупности имеют определенную вероятность попасть в выборку; во-вторых, вероятность выбора каждого элемента может быть рассчитана. Такие выборки являются самыми надежными, поскольку не допускают предвзятости в отборе участников исследования.

Случайные методы отбора применяют, как правило, при небольшой численности генеральной совокупности при условии, что имеется полный список (или перечень) ее единиц. Такой список называют основой выборки. Основа выборки должна быть:

– полной (т. е. включать все единицы генеральной совокупности);

– точной (т. е., с одной стороны, не содержать не существующих единиц, и, с другой стороны позволять идентифицировать включенные в список единицы);

– без дублирования единиц генеральной совокупности;

– адекватной (т. е. соответствовать генеральной совокупности: в ней должны быть представлены единицы, относящиеся к объекту исследования)[2];

– удобной для использования (основа должна быть представлена единым списком, быть пронумерованной). От качества основы выборки во многом зависит качество выборочной совокупности.

Рассмотрим основные виды случайного отбора.

Простой случайный отбор по своей сути напоминает лотерею: выборочная совокупность формируется из случайны образом отобранных по основе выборки единиц. Возможны следующие способы случайного отбора:

1. «Лотерейный отбор». Номер каждого элемента генеральной совокупности наносится на карточку (всего нумеруют N карточек — по количеству единиц генеральной совокупности). Карточки с номерами тщательно перемешивают и затем наугад вытаскивают n карточек (n — количество единиц выборочной совокупности). По выпавшим номерам из пронумерованной основы выборки отбирают элементы генеральной совокупности, которые и будут составлять выборочную совокупность.

Вместо традиционного «лотерейного барабана» можно использовать компьютерную программу «генератор случайных чисел». С ее помощью случайным образом определяют совокупность чисел, по которым отбирают единицы выборочной совокупности.

2. Отбор по таблице случайных чисел. В этом случае определение номеров единиц, попадающих в выборку, происходит не через вытаскивание карточек, а с помощью таблицы случайных чисел. В таких таблицах представлена неупорядоченная совокупность чисел — случайных чисел. Числа могут быть двухзначные, трехзначные, четырехзначные и т. д. — вплоть до десятизначных. По специальному алгоритму выписывают необходимое количество чисел их таблицы, по которым и отбирают единицы выборочной совокупности.

Простой случайный отбор может быть организован как повторный (когда отобранная единица возвращается в генеральную совокупность и может вновь участвовать в отборе) бесповторный (когда отобранная единица не возвращается в генеральную совокупность и не может участвовать в отборе).

Систематический (или механический) отбор представляет собой модификацию простого случайного отбора. Отбор осуществляется из исходного списка (из основы выборки) через интервал: Интервал или шаг отбора (К) рассчитывается делением численности генеральной совокупности на величину выборки (N/n). Если частное будет дробным числом, его округляют.

Систематический отбор удобен, он более прост в организации. Однако требования к основе выборки ужесточаются. Необходимо следить, чтобы список, используемый в качестве основы выборки, не обладал периодичностью в изменении значений изучаемых характеристик. Можно упорядочить список по возрастанию или по убыванию значимых для исследования характеристик объектов (например, по уровню доходов), или использовать алфавитные списки.

В серийной (или гнездовой) выборке в качестве единиц отбора используют статистически значимые совокупности единиц (статистические серии или гнезда), например, семьи, бригады, населенные пункты и т. п. Серийный отбор может осуществляться по схеме простого случайного или систематического отбора. Отобранные в выборку серии могут быть подвергнуты сплошному или выборочному обследованию.

Гнездовая выборка дает значительные организационные преимущества при проведении исследования. Составить основу выборки при серийном отборе также легче: в ней надо отразить не перечень единиц генеральной совокупности, а именно перечень серий (гнезд).

Стратифицированный отбор. Вероятностная выборка с любой техникой отбора называется стратифицированной, если процедуре отбора предшествует выделение в генеральной совокупности качественно однородных частей (подсовокупностей), называемых стратами. Страты — это однородные части обширной разнородной генеральной совокупности. Отбор единиц выборочной совокупности в дальнейшем осуществляется из выделенных страт.

Дифференциация генеральной совокупности на страты связана с предметом исследования. Стратифицированный отбор необходим, когда генеральная совокупность неоднородна по значимым для исследования характеристикам.

Стратификация генеральной совокупности может осуществляться по одному или нескольким стратифицирующим признакам. Стратифицирующий признак — это признак, по значению которого производится стратификация Важно правильно определиться с выбором стратифицирующего признака (признаков). Неправильный выбор стратифицирующего признака не повышает репрезентативность выборки, а наоборот, понижает ее.

Организация стратифицированной выборки связана с проблемой распределения объема выборки между стратами. Поэтому для реализации стратифицированного отбора требуются сведения о характере распределения стратифицирующих признаков в генеральной совокупности. Наиболее правильный подход в формировании стратифицированной выборки (согласно требованиям математической статистики) предполагает, что размер выборки из каждой страты должен быть пропорционален дисперсиям изучаемого признака внутри страт. Но дисперсии обычно неизвестны. Поэтому чаще всего производят отбор пропорционально доле (объему) страты в генеральной совокупности. В случае, когда страты незначительно различаются по объему, может производиться равный отбор из всех страт.

В качестве страт могут быть использованы и естественные образования (регионы, города и др.), а также специально формируемые для определенного исследования статистические совокупности (например, демографические группы).

 

Можно сформулировать двенадцать выборочных процедур, которые не удовлетворяют условиям случайного отбора:

– любая выборка, в которой участники сами себя выбирают, например, отвечая на просьбу газеты или звоня по одному из телефонных номеров на телеэкране;

– любая выборка, в которой интервьюеру дается свобода выбора респондента;

– методы «снежного кома»;

– уличные экспресс-интервью;

– телефонные опросы в районах, где многие жители не имеют телефонов;

– выборки, исходящие из удобства исследователей, то есть такие, в которых компании, занимающиеся опросами общественного мнения, работают в городах, где у них есть хорошие друзья и связи, или там, куда относительно удобно добраться;

– выборки, основанные на типичных городах или домохозяйствах;

– выборки, в которых замена используется для «корректировки» выборки с тем, чтобы ответить за тех, кто не был опрошен или недостаточно представлен в выборке по тем или иным причинам;

– выборки, построенные на основе неправильных единиц отбора; предположим, что построена отличная выборка для домохозяйств, и каждое домохозяйство имеет равную вероятность быть выбранным если у исследовательской организации нет данных о том, сколько подходящих индивидов проживает в каждом домохозяйстве (или по данному номеру телефона, если проводится телефонный опрос), невозможно рассчитать с какой вероятностью был выбран респондент, то есть нарушено второе условие;

– выборки, основанные на устаревших списках;

– большинство выборок, основанных на маршрутных методах;

– квотные выборки, в которых интервьюерам нужно опросить определенное количество людей с определенным набором демографических характеристик.