Кластерная выборка.

Стратифицированная выборка.

Построение стратифицированной выборки представляет собой двустадийный процесс, в ходе которого множество элементов, образующих исследуемую совокупность, разделя­ется на подмножества или страты так, что каждый ее элемент входит в одну и только одну страту. Затем в каждой страте отбирается нужное число элементов.

Первое решение, которое принимает исследователь при использовании данного метода, касается параметров стратифи­кации, то есть переменных, на основе которых исследуемая совокупность делится на страты.

При отборе параметров стратификации исходят из следующих сообра­жений:

1) элементы, составляющие каждую страту, должны быть как можно более сходными между собой;

2) элементы, входящие в разные страты, должны быть как можно более разными;

3) параметры стратификации должны быть как можно теснее связаны с интересующими исследователя характеристиками: чем теснее эта связь, тем точнее получаемые оценки;

4) переменные стратификации должны быть такими, чтобы процесс стратифи­кации был простым и удобным в работе, и, следовательно — дешевым.

Обычно для стратификации, как и для квотирования, используют:

- демографические характеристики;

- тип потребите­ля;

- размер фирмы или отрасль.

Вообще, можно выбирать две и более перемен­ных стратификации одновременно, но более двух — крайне редко, так как это сложно и дорого. Хотя число страт уста­навливается по усмотрению исследователя, обычно их бывает не более шести. Если их больше, то выигрыш в точности оценок обычно оказывается меньше, чем рост затрат на стра­тификацию и построение выборки.

Преимущества - стратифициро­ванная выборка соединяет в себе простоту построения, свойственную простой случайной выборке, и потенциальный выигрыш в точности.

При использовании стратифицированной выборки можно быть уверенным, что все важные подгруппы респондентов присутствуют в выборке.

При использовании метода кластеризации множество элементов, об­разующих исследуемую совокупность, разделяется на опреде­ленное число непересекающихся подмножеств, называемых кластерами. При использовании метода производится случайный выбор кластеров, чьи элементы затем будут вклю­чаться в выборку. Если в выборку включаются все элементы отобранных кластеров, процедура называется одностадийной. Если из каждого кластера случайным образом извлекаются и включаются в выборку некоторые элементы, процедура назы­вается двустадийной. Если перед отбором отдельных элементов внутри выбранных на первой стадии кластеров сначала выде­ляются более мелкие кластеры, определенное число которых вновь отбирается случайными методами, процедура называется трех- или более стадийной.

Кластеры можно отбирать либо с равной вероятностью с помощью простого случайного отбора, либо с вероятностью, пропорциональной размеру кластеров.

Кластеризация направлена на экономию затрат без сущест­венного снижения точности.

Элементы внутри кластера должны быть как можно более разнообразными, гетерогенными, а сами кластеры — как можно более похожими между собой. В идеале каждый кластер — уменьшенная копия всей иссле­дуемой совокупности.

Преимуществом является то, что строить основу выборки необходимо не для всей исследуемой совокуп­ности, а только для отобранных путем случайной процедуры кластеров.

Кластеры чаще всего выделяются по территориальному при­знаку, то есть представляют собой районы, улицы, многоквар­тирные дома и т.д. Такой метод построения выборки естествен­но назвать территориальным.

Преимущества:

1 гиб­кость;

2 невысокая стоимость. Часто единственная доступная основа выборки — это перечень кластеров, а не элементов целевой совокупности. Например, нельзя за разумное время и в пределах имеющихся средств составить список всех квартир в городе. Считая же кластерами избирательные участки города и зная численность их населения, можно случайным образом отобрать несколько участков и составить список находящихся там квартир. Метод кластеризации — самый дешевый и пото­му — самый эффективный из всех вероятностных методов построения выборки.

Недостатки:

1 нередко выборка получается относительно неточ­ной, поскольку на практике очень сложно сформировать гетерогенные (разнообразные) кластеры. Например, люди, живущие в одном доме, скорее похожи, чем не похожи друг на друга;

2 при использовании метода кластеризации бывает затрудни­тельным построение статистик для оценки точности резуль­татов.

Другие вероятностные методы построения выборки -методы, большинство которых представляют собой модификации основных методов, разрабо­танные специально для решения каких-либо специфических проблем. Рассмотрим лишь две из этих модификаций.

1 Последовательное построение выборки: ее размер зара­нее не определяется. Определяется лишь правило, на основа­нии которого принимается решение о необходимом размере выборки. Данные собираются поэтапно. По окончании каждо­го этапа отбора данные анализируются, и принимается решение о необходимости продолжения отбора.

Такой метод построения выборки удобен, например, когда возникает альтернатива. На каждой стадии респондентов спра­шивают, какой из двух возможных товаров они бы предпочли. Когда их предпочтения становятся ясны с достаточно высокой степенью достоверности, процесс сбора новых данных прекра­щается.

2 Двойное или двустадийное построение выборки: на первой стадии строится большая по объему выборка и про­водится краткий опрос. На основе этой информации строит­ся небольшая выборка из элементов, охваченных первым опросом, и собирается дополнительная, углубленная инфор­мация.

Такой метод полезен, когда невозможно получить основу для построения требуемой выборки, но известно, что она составляет часть основы для более широкой выборки. Тогда на первой стадии выясняется, например, кто из респондентов пьет яблочный сок и в каком примерно объеме, а на второй стадии строится выборка, стратифицированная по объему потребле­ния сока, и собирается информация, например, о тонкостях выбора. Если стратификация не проводится, стадии могут проводиться одновременно.