Стратифицированный отбор

Понятие стратифицированной выборки. Вероятностная выборка с любой техникой отбора (простая случайная, систематическая, се­рийная или многоступенчатая) становится стратифицированной,

если процедурам отбора предшествует выделение в генеральной со­вокупности однородных частей, называемых стратами.

В статистическом, смысле стратификация соответствует выделе­нию таких статистически однородных групп, колеблемость изучае­мых признаков которых внутри меньше, чем между ними.

Эта дифференциация внутри генеральной совокупности на ка­чественно более однородные группы содержательно связана с пред­метом исследования.

Стратификация совокупности оказывается необходимой во всех случаях, когда совокупность является неоднородной по социальным, экономическим и другим характеристикам единиц наблюдения.

Так, исследуя профессиональную ориентацию школьников в пре­делах одного города, можно в одну страту отнести 16 школ, распо­ложенных в районе старых застроек, во вторую — 20 школ, распо­ложенных в районах новостроек. Для опроса можно отобрать вы­пускников из двух школ первой страты, а также из двух школ второй страты. Если такая группировка школ действительно отра­жает различия районов, которые существенно учитывать в исследо­вании профессиональной структуры, то колеблемость изучаемых признаков внутри каждой группы школ должна быть меньше, чем между группами.

В качестве страт могут быть использованы как естественпыо образования, так и специально формируемые для определенного исследования. Например, такими стратами могут выступать эконо­мико-географические регионы или области страны, города, класси­фицированные по их административному статусу и по численности населения. Стратами могут выступать и идеальные образования. Примером является выделение в генеральной совокупности при ис­следовании отношения молодежи к труду шести групп по содер­жанию трудаs.

Стратифицирующий признак. Признак, по значениям которого производится стратификация генеральной совокупности, называется признаком стратификации. Стратификация может проводиться по одному или нескольким признакам.

Организация стратифицированной выборки. Организация стра­тифицированной выборки требует представления о характере рас­пределения по всей совокупности тех признаков, которые должны быть положены в основу образования типических групп, или страт. Неправильный выбор признака для группировки элементов. ге­неральной совокупности может не увеличить репрезентативность выборочных данных по сравнению со случайной выборкой того жо объема.

Организация стратифицированной репрезентативной выборки связана на практике с известными трудностями, особенно если вы­деленные страты неравночисленны. Математическая статистика ре­комендует в этих случаях, чтобы размеры выборки из каждой стра-

* Человек и его работа. М., 1967,

ты были пропорциональны средним квадратическим отклонениям в соответствующих стратах генеральной совокупности. Но дисперсии, пак правило, неизвестны. Поэтому часто при организации отбора из страт генеральной совокупности производится отбор пропорциональ­но их размеру (доле) в общей численности совокупности.

Еще один употребляемый в социологии вариант выбора — это> отбор одинакового количества единиц наблюдения из неравных ти­пических групп.

Выборка организуется в зависимости от рассмотренных вариан­тов отбора с объемом, который рассчитывается по следующим формулам.

1. Пропорционально среднеквадратическому отклонению st в i-й
типической группе, найденному по результатам пробного исследо­
вания. Размер (и,) выборки из г'-й типической группы равен

Щ = п—,1,

S "л

где n — объем всей выборки; Л', — объем i-й. группы в генеральной совокупности; / — количество групп. Весь объем выборки равен

П = 2 ni-t=l

2. Пропорционально размеру групп: nt — п -ту-? где N объем гене-

i

ральной совокупности. Весь объем выборки равен п = 2 ni-

j=i

3. Отбор равного числа единиц наблюдения nt = пг = ,.. = п, = с.
Вес* объем выборки определяется по формуле п = 1с.

Расчет характеристик стратифицированной выборки. Характери­стики такой выборки рассчитываются как «взвешенные» величины: показатели по каждой страте комбинируются в общую среднюю; вклад групповых средних пропорционален «весу» каждой страты в выборочной или генеральной совокупности.

В стратифицированной выборке общая дисперсия выборки имеет как бы два источника: дисперсию групповых средних, которые ха­рактеризуют каждую страту s|, и среднюю дисперсию из дисперсий

впутри каждой из отих страт s\. Первую составляющую принято называть межгрупповой дисперсией, а вторую — внутригрупповой. дисперсией.

Это записывается следующим образом:

«■ = *! + «?. (7)

Расчет средней ошибки при отборе, пропорциональном числен­ности единиц в стратах, производится по формуле

или, если пренебречь отношением n/N,

м = ]/-!-• (0)

В выражениях (8) и (9) «? вычисляется исходя из формулы (7), т. е. *'i = s2 — s|, где s2 — общая дисперсия выборки — подсчиты-вается каЪ для простой выборки, пе принимая во внимание страти­фикацию.

Таблица 19. Данные к примеру

Группа (i>

Семья I | II | Ш | IV | V

Расходы на подписку, руб.

1 3 10 15 17 14

2 2 6 12 1120

7- = 11Jj=2,5 х^=8 ^ = 13,5*"4=14 х^ == 17

Из соотношения для средней ошибки (7) следует, что ошибка стратифицированной выборки меньше средней ошибки чисто слу­чайной выборки либо равна ей, когда межгрупповая дисперсия, равна нулю.

Пример. Предположим, что выборка содержит 5 страт (группы семей по среднему доходу"). Необходимо определить величину рас­ходов на годовую подписку. Из каждой i-fi страты взяты по две семьи (объем выборки п = 10, см. табл. 19).

Расчет:

(Vs) (5i-;)a

2,5 —8,5 72,25

8,0 —3 9,00

132,5 л
13,5 2,5 6,25 Л=—§—=>5

14,0 3,0 9,00

17,0 0,0 36,00

г= 11 2 = 132,5

Найдем дисперсию, не учитывая расслоение семей на 5 групп:

Nn/n«, ('С') ('Г")*

1 3 —8 64

2 2 —9 81

3 10 —1 1

4 С -5 25

' Дружинин И. К. Указ. соч., с. 195.

314 5 15 4 1(5 «'=-^=31,4

0 12 11

7 It О О

8 17 (i 3(1

9 И З Я
10 20 U 81

x= 11 2 = 314

Отсюда внутригрушювая дисперсия sj = 31,4 — 26,5 = 4,9, ошибка для стратифицированной выборки М = |/ -ттр = 0,7.

Для случайной выборки М = у ,' = 1,77.

Таким образом, как впдпо из рассмотренного примера, страти­фицированная выборка при прочих равных условиях дает более точные результаты.