Кластерная выборка.
Стратифицированная выборка.
Построение стратифицированной выборки представляет собой двустадийный процесс, в ходе которого множество элементов, образующих исследуемую совокупность, разделяется на подмножества или страты так, что каждый ее элемент входит в одну и только одну страту. Затем в каждой страте отбирается нужное число элементов.
Первое решение, которое принимает исследователь при использовании данного метода, касается параметров стратификации, то есть переменных, на основе которых исследуемая совокупность делится на страты.
При отборе параметров стратификации исходят из следующих соображений:
1) элементы, составляющие каждую страту, должны быть как можно более сходными между собой;
2) элементы, входящие в разные страты, должны быть как можно более разными;
3) параметры стратификации должны быть как можно теснее связаны с интересующими исследователя характеристиками: чем теснее эта связь, тем точнее получаемые оценки;
4) переменные стратификации должны быть такими, чтобы процесс стратификации был простым и удобным в работе, и, следовательно — дешевым.
Обычно для стратификации, как и для квотирования, используют:
- демографические характеристики;
- тип потребителя;
- размер фирмы или отрасль.
Вообще, можно выбирать две и более переменных стратификации одновременно, но более двух — крайне редко, так как это сложно и дорого. Хотя число страт устанавливается по усмотрению исследователя, обычно их бывает не более шести. Если их больше, то выигрыш в точности оценок обычно оказывается меньше, чем рост затрат на стратификацию и построение выборки.
Преимущества - стратифицированная выборка соединяет в себе простоту построения, свойственную простой случайной выборке, и потенциальный выигрыш в точности.
При использовании стратифицированной выборки можно быть уверенным, что все важные подгруппы респондентов присутствуют в выборке.
При использовании метода кластеризации множество элементов, образующих исследуемую совокупность, разделяется на определенное число непересекающихся подмножеств, называемых кластерами. При использовании метода производится случайный выбор кластеров, чьи элементы затем будут включаться в выборку. Если в выборку включаются все элементы отобранных кластеров, процедура называется одностадийной. Если из каждого кластера случайным образом извлекаются и включаются в выборку некоторые элементы, процедура называется двустадийной. Если перед отбором отдельных элементов внутри выбранных на первой стадии кластеров сначала выделяются более мелкие кластеры, определенное число которых вновь отбирается случайными методами, процедура называется трех- или более стадийной.
Кластеры можно отбирать либо с равной вероятностью с помощью простого случайного отбора, либо с вероятностью, пропорциональной размеру кластеров.
Кластеризация направлена на экономию затрат без существенного снижения точности.
Элементы внутри кластера должны быть как можно более разнообразными, гетерогенными, а сами кластеры — как можно более похожими между собой. В идеале каждый кластер — уменьшенная копия всей исследуемой совокупности.
Преимуществом является то, что строить основу выборки необходимо не для всей исследуемой совокупности, а только для отобранных путем случайной процедуры кластеров.
Кластеры чаще всего выделяются по территориальному признаку, то есть представляют собой районы, улицы, многоквартирные дома и т.д. Такой метод построения выборки естественно назвать территориальным.
Преимущества:
1 гибкость;
2 невысокая стоимость. Часто единственная доступная основа выборки — это перечень кластеров, а не элементов целевой совокупности. Например, нельзя за разумное время и в пределах имеющихся средств составить список всех квартир в городе. Считая же кластерами избирательные участки города и зная численность их населения, можно случайным образом отобрать несколько участков и составить список находящихся там квартир. Метод кластеризации — самый дешевый и потому — самый эффективный из всех вероятностных методов построения выборки.
Недостатки:
1 нередко выборка получается относительно неточной, поскольку на практике очень сложно сформировать гетерогенные (разнообразные) кластеры. Например, люди, живущие в одном доме, скорее похожи, чем не похожи друг на друга;
2 при использовании метода кластеризации бывает затруднительным построение статистик для оценки точности результатов.
Другие вероятностные методы построения выборки -методы, большинство которых представляют собой модификации основных методов, разработанные специально для решения каких-либо специфических проблем. Рассмотрим лишь две из этих модификаций.
1 Последовательное построение выборки: ее размер заранее не определяется. Определяется лишь правило, на основании которого принимается решение о необходимом размере выборки. Данные собираются поэтапно. По окончании каждого этапа отбора данные анализируются, и принимается решение о необходимости продолжения отбора.
Такой метод построения выборки удобен, например, когда возникает альтернатива. На каждой стадии респондентов спрашивают, какой из двух возможных товаров они бы предпочли. Когда их предпочтения становятся ясны с достаточно высокой степенью достоверности, процесс сбора новых данных прекращается.
2 Двойное или двустадийное построение выборки: на первой стадии строится большая по объему выборка и проводится краткий опрос. На основе этой информации строится небольшая выборка из элементов, охваченных первым опросом, и собирается дополнительная, углубленная информация.
Такой метод полезен, когда невозможно получить основу для построения требуемой выборки, но известно, что она составляет часть основы для более широкой выборки. Тогда на первой стадии выясняется, например, кто из респондентов пьет яблочный сок и в каком примерно объеме, а на второй стадии строится выборка, стратифицированная по объему потребления сока, и собирается информация, например, о тонкостях выбора. Если стратификация не проводится, стадии могут проводиться одновременно.