Стратифицированный отбор
Понятие стратифицированной выборки. Вероятностная выборка с любой техникой отбора (простая случайная, систематическая, серийная или многоступенчатая) становится стратифицированной,
если процедурам отбора предшествует выделение в генеральной совокупности однородных частей, называемых стратами.
В статистическом, смысле стратификация соответствует выделению таких статистически однородных групп, колеблемость изучаемых признаков которых внутри меньше, чем между ними.
Эта дифференциация внутри генеральной совокупности на качественно более однородные группы содержательно связана с предметом исследования.
Стратификация совокупности оказывается необходимой во всех случаях, когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.
Так, исследуя профессиональную ориентацию школьников в пределах одного города, можно в одну страту отнести 16 школ, расположенных в районе старых застроек, во вторую — 20 школ, расположенных в районах новостроек. Для опроса можно отобрать выпускников из двух школ первой страты, а также из двух школ второй страты. Если такая группировка школ действительно отражает различия районов, которые существенно учитывать в исследовании профессиональной структуры, то колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами.
В качестве страт могут быть использованы как естественпыо образования, так и специально формируемые для определенного исследования. Например, такими стратами могут выступать экономико-географические регионы или области страны, города, классифицированные по их административному статусу и по численности населения. Стратами могут выступать и идеальные образования. Примером является выделение в генеральной совокупности при исследовании отношения молодежи к труду шести групп по содержанию трудаs.
Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или нескольким признакам.
Организация стратифицированной выборки. Организация стратифицированной выборки требует представления о характере распределения по всей совокупности тех признаков, которые должны быть положены в основу образования типических групп, или страт. Неправильный выбор признака для группировки элементов. генеральной совокупности может не увеличить репрезентативность выборочных данных по сравнению со случайной выборкой того жо объема.
Организация стратифицированной репрезентативной выборки связана на практике с известными трудностями, особенно если выделенные страты неравночисленны. Математическая статистика рекомендует в этих случаях, чтобы размеры выборки из каждой стра-
* Человек и его работа. М., 1967,
ты были пропорциональны средним квадратическим отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии, пак правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорционально их размеру (доле) в общей численности совокупности.
Еще один употребляемый в социологии вариант выбора — это> отбор одинакового количества единиц наблюдения из неравных типических групп.
Выборка организуется в зависимости от рассмотренных вариантов отбора с объемом, который рассчитывается по следующим формулам.
1. Пропорционально среднеквадратическому отклонению st в i-й
типической группе, найденному по результатам пробного исследо
вания. Размер (и,) выборки из г'-й типической группы равен
Щ = п—,—1—,
S "л
где n — объем всей выборки; Л', — объем i-й. группы в генеральной совокупности; / — количество групп. Весь объем выборки равен
П = 2 ni-t=l
2. Пропорционально размеру групп: nt — п -ту-? где N объем гене-
i
ральной совокупности. Весь объем выборки равен п = 2 ni-
j=i
3. Отбор равного числа единиц наблюдения nt = пг = ,.. = п, = с.
Вес* объем выборки определяется по формуле п = 1с.
Расчет характеристик стратифицированной выборки. Характеристики такой выборки рассчитываются как «взвешенные» величины: показатели по каждой страте комбинируются в общую среднюю; вклад групповых средних пропорционален «весу» каждой страты в выборочной или генеральной совокупности.
В стратифицированной выборке общая дисперсия выборки имеет как бы два источника: дисперсию групповых средних, которые характеризуют каждую страту s|, и среднюю дисперсию из дисперсий
впутри каждой из отих страт s\. Первую составляющую принято называть межгрупповой дисперсией, а вторую — внутригрупповой. дисперсией.
Это записывается следующим образом:
«■ = *! + «?. (7)
Расчет средней ошибки при отборе, пропорциональном численности единиц в стратах, производится по формуле
или, если пренебречь отношением n/N,
м = ]/-!-• (0)
В выражениях (8) и (9) «? вычисляется исходя из формулы (7), т. е. *'i = s2 — s|, где s2 — общая дисперсия выборки — подсчиты-вается каЪ для простой выборки, пе принимая во внимание стратификацию.
Таблица 19. Данные к примеру
Группа (i>
Семья I | II | Ш | IV | V
Расходы на подписку, руб.
1 3 10 15 17 14
2 2 6 12 1120
7- = 11Jj=2,5 х^=8 ^ = 13,5*"4=14 х^ == 17
Из соотношения для средней ошибки (7) следует, что ошибка стратифицированной выборки меньше средней ошибки чисто случайной выборки либо равна ей, когда межгрупповая дисперсия, равна нулю.
Пример. Предположим, что выборка содержит 5 страт (группы семей по среднему доходу"). Необходимо определить величину расходов на годовую подписку. Из каждой i-fi страты взяты по две семьи (объем выборки п = 10, см. табл. 19).
Расчет:
(Vs) (5i-;)a
2,5 —8,5 72,25
8,0 —3 9,00
132,5 л
13,5 2,5 6,25 Л=—§—=2С>5
14,0 3,0 9,00
17,0 0,0 36,00
г= 11 2 = 132,5
Найдем дисперсию, не учитывая расслоение семей на 5 групп:
Nn/n«, ('С') ('Г")*
1 3 —8 64
2 2 —9 81
3 10 —1 1
4 С -5 25
' Дружинин И. К. Указ. соч., с. 195.
314 5 15 4 1(5 «'=-^=31,4
0 12 11
7 It О О
8 17 (i 3(1
9 И З Я
10 20 U 81
x= 11 2 = 314
Отсюда внутригрушювая дисперсия sj = 31,4 — 26,5 = 4,9, ошибка для стратифицированной выборки М = |/ -ттр = 0,7.
Для случайной выборки М = у ,' = 1,77.
Таким образом, как впдпо из рассмотренного примера, стратифицированная выборка при прочих равных условиях дает более точные результаты.