Квотная выборка

Случайная или вероятностная выборка

Основные понятия выборочного метода

ВЫБОРКА В МАРКЕТИНГОВОМ ИССЛЕДОВАНИИ

Более 90% людей впервые знакомясь с социологическими исследованиями обязательно с большим недоверием спрашивают, - а кого вы опрашивали? Друзей, знакомых? Где вы их столько набрали? Вопросы правомерны, но давно и классически решенные социологами совместно с математиками. Невозможно переоценить значение правильного выбора людей для опроса. Наряду с вопросом: "Что спросить?", - следующие по важности вопросы для исследователя, -"Кого опрашивать?" "Сколько человек опрашивать?", "Где опрашивать?", "Как проводить отбор единиц наблюдения?"

Для решения этих задач служит выборка, в которую из общего множества людей отбирают по определенным правилам для опроса определенное количество людей соответствующих определенным заранее социально-демографическим характеристикам. Для человека со стороны выборка представляется предметом малопонятным. На бытовом уровне не укладывается в голове - Как может небольшая группа людей отражать мнение, например, всего населения? На этот вопрос удачно ответил Джорж Гэллапп: "Если хорошо перемешать суп, повар возьмет на пробу лишь одну ложку этого супа и по ней будет судить, какой вкус у всего супа в горшке!" Примерно тоже происходит при формировании выборки.

Существует довольно простое представление - чем больше опросим людей, тем точнее будет получен результат. Однако, практика социологических исследований свидетельствует о том, что это бывает не всегда так. Просто большой массив опрошенных не дает точного результата, если в нем не нашли отражения количественно все значимые структуры изучаемой совокупности. И, наоборот, если выборочная совокупность опрошенных моделирует в себе все основные особенности общей совокупности, представляет ее как бы в меньшем масштабе, то можно обойтись значительно меньшим числом опрошенных. В этом и состоит смысл выборки.

Преимущество выборочного подхода Гэллапа к изучению общественного мнения стало очевидным на президентских выборах 1936 года. До этого времени в сфере опросов американцев лидировал журнал "Литерари дайжест". С его точки зрения, широта охвата населения уж наверняка обеспечивала им достоверность результатов опроса. Разослав 10 миллионов писем с анкетами избирателям, журнал на основе полученных ответов предсказал уверенную победу республиканскому кандидату А.Лендону над лидером демократической партии Ф.Рузвельтом в соотношении соответственно 57% против 43%.

Тогда еще никому неизвестный Дж.Гэллап , опросив во всей стране не 10 миллионов, а всего лишь несколько сот избирателей предсказал уверенную победу Ф.Рузвельту, который действительно набрал 62% голосов против обещанных журналом 43% голосов. За один день Гэллап стал знаменитостью, а институт, который он организовал и сейчас является одним из наиболее известных и ведущих в мире по изучению общественного мнения.

Ошибка журнала "Литерари Дайджест" состояла в том, что не была учтена неоднородность американского общества. Для опросов были взяты только адреса из телефонной книги и адреса списков владельцев автомашин, т.е. людей с достатком средним и выше. Между тем в 30-годы эта группа населения ( в отличии от 90-годов ) не являлась репрезентативной по отношению ко всей массе американских избирателей. Они достаточно точно предсказали как будут голосовать лишь те, кого они опросили. Но этого оказалось недостаточно. Конечный результат выборов определили те неучтенные журналом слои общества, которые были представлены и учтены в выборочной совокупности исследования Гэллопа и простой количественный подход не помог правильно решить стоящую проблему.

И еще один момент, который необходимо знать о выборках. В большинстве случаев выборка создается под исследуемую проблему. Если вы исследуете проблемы города или района, то она и делается на основе статистики изучаемых регионов. Если вы проводите исследование по проблемам женщин или подростков, то для создания выборок берется и соответствующая статистика и т.п.

Однако, часто бывают случаи, когда уже готовые выборки , сделанные под другие исследовательские проблемы могут быть использованы и для решения ваших задач. Наиболее типична такая ситуация для омнибусных исследований. Характерными признаками подобной выборки является достаточно большой объем выборки, широкая география, использование анкетной методики опроса и достаточно дифференцированный набор социально-профессиональных признаков рецепиентов. Это все позволяет осуществлять достаточно глубокий анализ собранной информации.

Основными понятиями выборочного отбора являются:

Генеральная совокупность-совокупность всех единиц, входящих в объект статистического наблюдения. (Например, все население страны или отдельного города).

Выборочная совокупность -часть генеральной совокупности. (та часть населения, которая будет опрошена)., непосредственно изучаемая в исследовании, основные характеристики которой соответствуют всей генеральной совокупности.

Репрезентативность ( представительность) выборки -свойство выборочной совокупности воспроизводить, представлять существенные для исследования характеристики генеральной совокупности.

Единицы отбора - составные элементы ( генеральной совокупности ), последовательным отбором, которых формируется выборочная совокупность.

При формировании выборки всегда необходимо учитывать структуру генеральной совокупности по изучаемым признакам. Она может быть гомогенной т.е. однородной и гетерогенной(неоднородной). Например, нам нужно узнать какое количество пива потребляется, и мы обнаруживаем, что внутри нашей генеральной совокупности нормы потребления значительно отличаются ( гетерогенная среда ). В ином случае мы будем изучать потребление хлеба и установим, что у разных людей оно отличается незначительно (гомогенная генеральная совокупность).

Объем выборки - общее число единиц исследования, включенных в выборочную совокупность(сколько будет опрошено). Он зависит от числа признаков, от степени однородности генеральной совокупности выборки ( чем она однороднее, тем меньше объем выборки), от требуемой точности результата. Объем выборки рассчитывается по специальным формулам. Обычно, чем меньше генеральная совокупность, тем больше объем выборки, другими словами между ними существует обратно пропорциональная зависимость, что видно из следующей таблицы.

Зависимость объема выборки от объема генеральной совокупности.

V ген.совокупн.500 1000 2000 3000 4000 5000 10000 100000

V мин.выборки 222 286 333 350 360 370 385 398 400

В практике таких известных социологических служб за рубежом как службы Гэллапа, Янкеловича, Харриса, да и у нас в стране (ВЦИОМ. Фонд “Общественное мнение”, РАМИР и т.п.) - принято опрашивать не более 1000 - 1500 человек, и лишь в отдельных случаях - больше. Секрет подобных достижений - выявление основных типологических групп и построение выборки в соответствии с ними. Применяя определенные процедуры при формировании подобных выборок удается добиться при таком количестве респондентов достаточно высокого класса точности полученной информации. Считается, в большинстве случаев, вполне достаточным класс точности основной информации исследования - 3%-5%. Для того, чтобы понять - много это или мало скажем - таков класс точности весов, на которых вам обычно взвешивают в магазине масло.

В ходе исследования мы должны решить интересоваться всем взрослым населением или какой - либо специфической группой: владельцами садов, обладателями банковских счетов, подростками, покупающими шоколад в плитках, домохозяйками, которые пользуются стиральными машинами-автоматами или пользователями персональных компьютеров.

Например, если исследователь заинтересован в персональных компьютерах, он должен прийти к выводу ( на основе вторичной информации - данных о продажах, что его основная целевая группа состоит из мужчин в возрасте 25-45 лет, у которых за спиной колледж и которые живут в средних и крупных городах. Таким образом, эта группа и составит генеральную совокупность, из которой будет произведена выборка для исследования. Можно также уточнить и эту генеральную совокупность и опрашивать только тех мужчин указанного возраста, которые за прошлый год использовали компьютер для деловых целей.

Величина целевой группы или определенной части населения, из которой будет производиться выборка, зависит от конкретных целей исследования. Для маркетинговых целей весьма типично опрашивать несколько сотен человек иногда чуть более тысячи. Лишь весьма редко, главным образом лишь в исследовании товаров производственного потребления имеет смысл опрашивать всю генеральную совокупность, например всех заведующих отделами снабжения всех автомобильных фирм в стране.

Все выборки содержат некоторый элемент ошибки, поэтому всем оценкам, получаемым путем опроса по выборкам присуща некоторая степень вероятности просто уже потому, что мы опрашиваем не всех. Но это не так страшно, потому что аккуратным планированием можно свести неточности к минимуму. Кроме того нет нужды в стопроцентной точности. Большинство маркетинговых решений принимается на основании информации, характеризующей тенденцию, направленность процесса и фактически может быть сведено к альтернативе "да" или "нет", начинать выпуск продукции или не начинать. Например, если пивовару необходимо узнать какая часть потребителей предпочитает его сорт пива, а не конкурента, то на его планы ни как не повлияет разница 59%, 62% или 64%.

Опрос по слишком большой выборке обрекает заказчика на слишком большие расходы. Маркетинговое исследование должно обеспечить компромисс между размером выборки с одной стороны, репрезентативностью и надежностью, с другой, чем больше величина выборки, тем меньше возможная ошибка. Но если заказчик желает увеличить точность в два раза, то придется увеличивать выборку не в два, а в четыре раза.

Важно заметить, что ошибки выборки не являются единственно возможным источником ошибок в маркетинговом исследовании. Они могут быть также связаны с нарушением правил реализации выборки, правил составления анкет или с недостаточной обученностью интервьюеров или большим количеством невозвращенных анкет. Причем значимость таких ошибок увеличивается по мере увеличения выборки. Хотя существуют стандартные формулы для расчета выборки, окончательная величина выборки определяется исходя из целей и задач исследования. Обычно это определяется необходимостью иметь адекватный размер в самой маленькой из исследуемых подгрупп. ( например, не менее 100 едениц наблюдений). Или, если мы планируем провести исследование среди владельцев автомашин, то прежде чем определить размер выборки, мы определяем разделение генеральной совокупности по типам автомашин. Если наименьшая подгруппа, которую мы хотим рассмотреть - владельцы спортивных автомобилей составляет 10%, от общего числа владельцев, то общий размер выборки должен быть не менее 1 тысячи владельцев автомобилей.

Возможны два принципиально отличных подхода в формировании выборок. "вероятностная" и "невероятностная". В первом случае - мы предварительно выбираем адреса из списка, который является основой выборки, например из списка избирателей, списка почтовых адресов, или телефонного справочника. Предварительная выборка производиться на основе статистической случайности и интервьюеры получают таким образом точнейшие указания, кого им опрашивать, конкретные имена и адреса людей для интервью. Таким образом, это подход при котором, каждый из списка имеет равные возможности попасть в число опрашиваемых называется методом "случайной" или "вероятностной"выборкой.

Заметим, что термин “случайность” не адекватен бытовому понятию чистая случайность. Случайность в статистическом понимании состоит именно в том, что только “случайность” или “случай” определяют выбор. Точное соблюдение правила, что каждый из списка должен иметь равные шансы попасть в выборку, помогают создать выборку непревзойденную по точности и объективности.

Существуют несколько методов случайного отбора. Самый распространенный метод создания случайных выборок - воспользоваться таблицей случайных чисел. Например, если мы намереваемся провести исследование среди владельцев банковских счетов в определенном банке мы должны произвести случайную выборку 200 из 5 тысяч человек, которые составляют генеральную совокупность. В этом случае можно поступить следующим образом, присвоить номера каждому из 5 тысяч человек, причем каждый номер будет состоять из одинакового количества цифр (в нашем случае из четырех - 0001, 0002 и т.д.). После этого возьмем таблицу случайных чисел ( а она сконструирована так, что любая цифра от 0 до 9 имеет равный шанс появиться в любой позиции на данной таблице ), выберем любую точку на ней и будем последовательно читать номера либо по горизонтали, либо по вертикали. Прочитанные таким образом цифры укажут нам, кого из пронумерованных владельцев счетов мы включим в выборку, и мы будем продолжать составлять из прочитанных цифр 4-х значные номера, пока не наберем достаточное их количество для завершения выборки из 200 человек.

Общепринятой разновидностью метода вероятностной выборки является"метод равного интервала", при котором вы отбираете каждый номер из пронумерованного списка людей, составляющих генеральную совокупность, начиная с наугад выбранного номера, который должен быть меньше, чем размер нашей выборки, т.е. в нашем случае 200). Величина интервала определяется делением числа, определяющего генеральную совокупность на требуемый размер выборки. В нашем случае 5000 : 200 = 25. Скажем мы выбрали случайный номер 0097. Он станет первым в нашем списке, затем прибавляя каждый раз по 25 мы последовательно получим 0097, 0122, 0147, и т.д. Примерно так компьютер автоматического телефонного опроса выбирает из электронного файла, содержащего все домашние телефоны города, номера телефонов, которые включаются в телефонную выборку, а, затем, автоматически набираются и соединяются с операторами телефонного опроса.

Случайная или вероятностная выборка является фактически единственным способом получить объективны данные, которые имели бы точность годную для измерений. Поскольку каждый член данной совокупности имеет равную или известную вероятность быть выбранным, это дает возможность оценить вероятность того, что соотношения, полученные на основе конкретной выборки находятся в тех же пределах, которые характерны для всей генеральной совокупности или для населения, из которого получена выборка.

Если вы нуждаетесь в высоком уровне объективности и максимальной безошибочности исследования, то такой тип выборки вам как раз и подходит. В равной мере это предпочтительный метод выборки, если вы намерены делать проекции и экстраполяции результатов на всю генеральную совокупность. Случайная выборка имеет еще и то преимущество, что не требуется детальное знание той совокупности, которая изучается в отличии от других невероятностных выборок, когда вам нужна исходная информация о характере данной совокупности.

Однако этот метод является сравнительно сложным и требует много времени и средств. К этому методу необходимо иметь не только современный инструментарий, но и более значительные ресурсы, чем при других видах выборки. Необходимо иметь основу выборки: какой - либо список членов генеральной совокупности.

Репрезентативность выборки существующей в проекте, это лишь половина пути к репрезентативности непосредственно обследуемого объекта. Вероятностные выборки достаточно трудоемки и сложны в исполнении. На практике, оказывается, очень трудно выдержать все заданные параметры выборки. Уровень их реализации, как правило, менее 100% и бывает чрезвычайно низким. Существует мнение, что при отклонениях в реализации выборки ниже 75% , мы лишаемся возможности утверждать, что воспроизвели изучаемый объект методом вероятностного отбора. Кроме того, по ошибке интервьюера, зачастую бывают опрошены люди не принадлежащие к выборке. Все это в значительной степени снижает достоинства вероятностной выборки.

В итоге при проведении большинства коммерческих исследований, вследствие ограниченного бюджета и сроков выполнения как правило используются методы формирования невероятностной, обычно квотной выборки. Невероятностный отбор - это отбор, при котором единицы выборочной совокупности отобраны целенаправленно.

Основные его виды:стихийный отбор и квотный отбор.

Стихийный отбор - отбор, при котором в выборку включаются максимально доступные для интервьюера единицы наблюдения. Стихийный отбор представлен в основном отбором "первого встречного" и прессовыми опросами. Отбирая первого встречного на улице предприятии и т.д., интервьюер руководствуется при выборке респондентов личными симпатиями, предпочтениями т.е. опрос осуществляется субъективно. В случае прессовых опросов решение о включении в выборку принимает сам респондент, отвечая или не отвечая на вопросы. При использовании стихийного отбора невозможно определить, какую генеральную совокупность представляет выборка, нельзя рассчитать ее статистические параметры. Поэтому данный вид отбора применяется социологами достаточно редко, в основном на этапе зондажного, разведывательного исследования.

Но поскольку массовые опросы общественного мнения стали в стране своеобразной модой, многие журналисты, печатные издания стремятся по настроениям своих подписчиков или опрошенных по телефонным звонкам в редакцию людей делать выводы об общественных настроениях в целом. Кроме того, часто такие опросы проводятся в пропагандистских целях, а их расхождение с действительностью бывает столь очевидным, что приводит к дискредитации социологических исследований как таковых. Но даже если исследования проводились с сами лучшими намерениями, существует по меньшей мере три причины не доверять в полной мере результатам таких исследований.

Во-первых, подписчики и читатели любых самых массовых изданий не представляют собой репрезентативную группу по отношению ко всему населению. Среди них, как правило, преобладают жители городов, люди с более высоким уровнем образования и высокой информационной активностью.

Во-вторых, на просьбы и обращения редакций участвовать в опросе откликаются, как правило, наиболее заинтересованные люди, люди с наиболее подвижной психикой, в том числе и те, кто располагает для этого временем.

В-третьих, процент возврата анкет или количество телефонных звонков в редакцию не бывает очень высоким. Поэтому, люди принявшие участие в опросе не могут даже репрезентативно представлять всех читателей газеты или аудиторию телерадиопрограмм.

Квотный отбор -строиться на основе информации о ряде характеристик генеральной совокупности. В соответствии с ее составом устанавливаются квоты (пропорции) для ряда признаков, существенных для исследования, например, доля лиц с высшим образованием, доля женщин, доля людей с определенным уровнем дохода. В соответствии с полученной численностью респондентов даются задания интервьюерам - люде с какими признаками необходимо опросить.

В результате опроса, осуществленного по квотной выборке, целенаправленно формируется выборочная совокупность, которая

по ряду признаков воспроизводит пропорции генеральной совокупности. Например, предположим, что мы проводим исследование о меблировке домов и знаем из предыдущего опыта, что важными детерминантами в покупке этого товара являются возраст и социально-экономический статус, к которому принадлежит семья.

Вместо того, чтобы предлагать интервьюеру готовый список фамилий адресов и людей, которых ему следует опросить ( как при случайной выборке), мы даем ему так называемые “карты репрезентации” в которых указано в определенных пропорциях количество людей по полу, возрасту, уровню дохода. Для того чтобы отбор респондентов носил по возможности более случайный характер, им обычно предписывают целый ряд правил поведения. Например, не рекомендуют опрашивать более одного человека на конкретной улице, на одном и том же этаже дома и т.д.

Для большей эффективности процедуры, связанной с моделированием исследуемого объекта по социально-демографических признакам, выдвигаются и другие требования: наличие надежных статистических данных для расчета квот,, Одно из главных условий подобного опроса - задание должно выводить интервьюера за пределы собственного окружения и т.д. Некоторые ученые считают, что квотирование способствует репрезентации изучаемого объекта, приводя в действие не столько социально-статистические закономерности, сколько закон больших чисел.

ТЕМА