Объем случайной выборки

Доверительный интервал – это числовой интервал, который между верхней и нижней границами содержит с известной вероятностью значение параметра в генеральной совокупности.

Доверительный уровень – это математическое выражение нашей уверенности в том, что параметр генеральной совокупности находится в пределах доверительного интервала.

ДУ 95 % - существует 95% вероятность того, что интересующий нас параметр генеральной совокупности находится в пределах установленного в исследовании доверительного интервала.

Объем выборки определяется, исходя из доверительных интервалов и уровней.

Объем выборки при оценке долей.Если результаты опроса представляются в виде долей (процентов), для определения соответствующего объема выборки можно вос­пользоваться таблицей 3. Вся информация, содержащаяся в дан­ной таблице, составлена на основе 95%-ного доверительного уровня. Для пользования этой таблицей нужно иметь некоторую оценку изучаемой доли. Для проведения исследований были разработаны три альтернативных вопроса, требующих ответа "согласен—не согласен". На первый из вопросов вы надеетесь полу­чить утвердительный ответ 10% выборки, на второй — 20%, на третий — 85%. К тому же предположим, что требуется обеспечить узкий доверительный интервал, состав­ляющий не более чем ±3% для каждого из трех вопросов в отдельности.

Таблица

Доверительные интервалы для различных объемов выборки и ожидаемой 1 доли (доверительный уровень равен 95%)

Объем выборки, чел. Ожидаемая доля
5% или 95% 10% или 90% 15% или 85% 20% или 80% 25% или 75% 30% или 70% 35% или 65% 40% или 60% 45% или 55% 50%
4,4 6,0 7,1 8,0 8,7 9,2 9,2 9,5 9,8 10,0
3,1 4,7 5,0 5,7 6,1 6,5 6,7 6,9 7,0 7,2
2,5 3,5 4,2 4,6 5,0 5,3 5,5 5,7 5,7 5,8
2,2 3,0 3,6 4,0 4,3 4,6 4,8 4,9 5,0 5,0
1,9 3,0 3,2 3,6 3,9 4,1 4,3 4,4 4,5 4,5
1,8 2,5 2,9 3,3 3,5 3,7 3,9 4,0 4,0 4,1
1,6 2,3 2,7 3,0 3,3 3,5 3,6, 3,7 3,8 3,8
1,5 2,2 2,5 2,8 3,1 3,2 3,4 3,5 3,5 3,5
1,4 2,0 2,4 2,7 2,9 3,1 3,2 3,3 3,3 3,3
1,4 1,9 2,3 2,5 2,7 2,9 3,0 3,1 3,1 3,2
1,1 1,5 1,8 2,0 2,2 2,4 2,5 2,5 2,6 2,6
1,0 1,3 1,6 1,8 1,9 2,0 2,1 2,2 2,2 2,2
0,8 1,1 1,3 1,5 1,6 1,7 1,7 1,8 1,8 1,8
0,6 0,8 1,0 1,1 1,2 1,3 1,3 1,4 1,4 1,4

Из табл. 8.3 видно, что при доверительном интервале со значением не более чем ±3% при ожидаемой доле утвердительных ответов:

• 10% — объем выборки должен составлять 400;

• 20% — объем выборки должен составлять 700;

• 85% — объем выборки должен составлять около 600.

Таким образом, окончательный объем выборки при данных значениях должен составлять 700 человек (наибольший из трех требуемых объемов выборки).

Бывают случаи, когда необходимо задать другой доверительный уровень. Следо­вательно, примером, приведенным в табл. 8.3, руководствоваться нельзя. В этом случае объем выборки можно определить по формуле:

где z — z -балл, соответствующий требуемому доверительному уровню, а е — желае­мый доверительный интервал. Z-баллы для различных доверительных уровней при­ведены в таблице.

Таблица

Доверительный уровень, % Z-балл
2,57
1,96
1,64

 

Рассмотрим другую ситуацию, когда от группы респондентов необходимо получить ответ на вопрос: "Знакомы ли вы с рекламой тортов производства ОАО «Фабрика-кухня «Журавли»?, ожидая получить утвердительный ответ от 35% опрашиваемых. Кроме того, вам необходимо на 99% быть уверенными в том, что действительная до­ля положительных ответов будет находиться в пределах ±2%. Требуемый объем вы­борки при заданном доверительном уровне получается следующим образом:

Объем выборки велик, так как доверительный уровень и доверительный интервал за­дают высокий уровень точности. Однако объем выборки будет гораздо меньшим, если доверительный интервал возрастет до ±4%, а доверительный уровень снизится до 95%:

Рис. 8.2. Зависимость между объемом выборки и доверительным уровнем для трех значений ожидаемой ответной реакции при 95%-ном доверительном уровне

Табл. 8.3 также демонстрирует зависимость между доверительными интервалами и объемом выборки. Если полагать, что доверительный уровень имеет постоянную величину, то чтобы уменьшить доверительный интервал вдвое, объем выборки сле­дует увеличить вчетверо. Например, при ожидаемой доле в 20% выборка из 100 уча­стников обеспечивает доверительный интервал ±8%, выборка из 400 — ±4%, а вы­борка из 1600 участников — ±2%. Зависимость между точностью (выражающейся в меньших доверительных интервалах) и объемом выборки показана на рис. 8.2. Как видим, точность значительно увеличивается при небольшом увеличении объема вы­борки (приблизительно до 1000 участников), однако увеличение точности сущест­венно замедляется, если объем выборки превышает 1000 участников. Вот почему при проведении большей части потребительских, маркетинговых и рекламных ис­следовательских работ выборка редко превышает 1000 участников.

 

Вычисление объема выборки в случае, когда оценивается среднее значение.Можно так­же определить объем выборки, если требуется оценить среднее значение в генеральной совокупности. В этих случаях, кроме указания доверительного уровня и доверительного интервала, необходимо располагать оценкой изменчивости изучаемого признака. (Мерой изменчивости переменной является среднеквадратическое (стандартное) откло­нение. В главе 15 подробно рассматривается вычисление и интерпретация этой меры.) Поскольку значение среднеквадратического отклонения в генеральной совокупности редко бывает известно, его можно оценить одним из следующих трех способов.

1. Воспользуйтесь оценкой среднеквадратического отклонения на основании предыдущих аналогичных исследований, проведенных на той же генеральной совокупности.

2. Проведите небольшое пилотажное исследование; используйте среднеквадра­тическое отклонение, полученное в пилотажных исследованиях, в качестве оценки среднеквадратического отклонения в генеральной совокупности.

3. Вычислите сумму максимального и минимального значений изучаемой пере­менной и разделите ее на четыре.

Оценив среднеквадратическое отклонение и определив доверительный интервал и доверительный уровень, оценку объема Выборга можно получить по следующей формуле:

где так же, как и в предыдущей формуле, z представляет z-балл, соответствующий конкретному доверительному уровню (взят из приведенной ранее таблицы), а е — желаемый доверительный интервал. Новый член этой формулы, s, является оценкой среднеквадратического отклонения в генеральной совокупности.

Приводим пример, подобный только что рассмотренному. Представьте следующую ситуацию. Вы обратились к группе респондентов с просьбой: "Дайте, пожалуйста, оценку правдоподобия рекламы офисного оборудования фирмы Lanier по шкале от одного до пяти". Вы хотите на 95% быть уверенными в том, что истинное значение среднего рейтинга в генеральной совокупности будет находиться в пределах ±0,2 от среднего значения в выборке. Оценка среднеквадратического отклонения получена путем суммирования экстремальных значений шкалы и деления суммы на четыре, и равна 1,5 (т.е. 5 + 1 : 4 = 1,5). Необходимый объем выборки для заданного желаемого доверительного уровня будет равен 216. Рассчитывается он с помощью формулы:


ГЛАВА 8. Выборка 249

Однако, несмотря на все преимущества, не всегда при проведении исследований в области рекламы используют случайную выборку. Для удовлетворения одних ин­формационных потребностей не нужна точность и обобщаемость случайной выбор­ки, а для удовлетворения других время и средства, затраченные на проведение слу­чайной выборки, являются неоправданными. В этих случаях используется иная форма отбора — так называемая неслучайная выборка, при которой элементы выби­раются некоторым неслучайным образом. Основными формами неслучайной вы­борки являются выборка первого встречного, выборка на основе экспертного суж­дения, квотная выборка и целенаправленная выборка.

Формы неслучайного отбора

Выборка первого встречного.Выборка первого встречного проводится именно так, как указано в ее названии: участники исследований отбираются в силу своей дос­тупности и соображений удобства сбора данных. Опрос друзей, коллег по работе, просто случайных прохожих на улице — вот типичные примеры такой схемы отбора, так же, как и выбор последних тридцати сделок, которые находятся под рукой. Фор­мирование выборки первого встречного, как и следовало ожидать, — несложный, недорогостоящий и быстро осуществимый процесс.

При формировании выборки первого встречного существует серьезная вероят­ность, что полученная информация будет совершенно ненадежной. Следовательно, использовать ее можно только в том случае, если нет абсолютно никакой необходи­мости обобщать отношение и поведение участников выборки первого встречного на более широкую генеральную совокупность. Поскольку нет никакой уверенности в том, что отличительные особенности участников выборки первого встречного ре­презентативны для более широкой генеральной совокупности, использовать выбор­ку первого встречного можно лишь при проведении предварительных пилотажных исследований или для получения быстрой информации необобщающего характера, отвечающей отдельным потребностям исследований, например предварительного тестирования анкеты.

Выборка на основе экспертного суждения.При проведении выборки на основе экс­пертного суждения участники выбираются из состава целевой совокупности, исходя из суждений эксперта о характерных особенностях репрезентативной выборки. В роли эксперта могут выступать сам исследователь, сотрудники рекламного агентства, кли­ент, специалист в конкретной предметной области. Например, владелец магазина мо­жет отобрать на основании собственных суждений "типичных" заказчиков.

Уверенность в результатах исследований, проводимых на основе экспертных су­ждений, прямо пропорционально зависит от опыта эксперта, на основании которого определяется и извлекается выборка. Чем больше опыт, тем выше вероятность полу­чения достоверных результатов. Например, выбор городов для маркетингового тес­тирования нового товара почти всегда осуществляется на основе экспертных сужде­ний. Лица, хорошо знающие товар и различные города Соединенных Штатов Аме­рики, скорее всего, остановят свой выбор на более подходящих городах, в отличие от случайного выбора. С другой стороны, эксперт может полагать, что наиболее подхо­дящей целевой аудиторией программы сбережений для поступления в колледж яв­ляются родители, имеющие детей от 10 до 17 лет. Если это суждение неверно, иссле-
Задания

1. Для каждой из следующих ситуаций определите соответствующую изучаемую совокупность и основу выборочного наблюдения.

a) Производитель нового вида сухих завтраков хочет провести домашнее тестирование продукта в Чикаго.

b) Национальная сеть магазинов хочет определить потребительские предпочтения покупа­телей, имеющих платежную карточку этой сети.

c) -Местная телевизионная станция хочет определить, какие передачи пользуются попу-

лярностью в семьях и каким именно программам зрители отдают предпочтение.

d) Местное отделение Американской ассоциации маркетинга хочет оценить эффектив­ность работы своего нового представительства в Атланте.

2. Производитель хочет провести опрос потребителей, чтобы определить потенциальный спрос на новый пресс с механическим приводом. Новый пресс имеет мощность, равную 500 тонн и стоит 225 тысяч долларов. Он применяется для формовки изделий из легкой и тяже­лой стали и полезен производителям автомобилей, строительного оборудования и крупных механических конструкций.

a) Определите генеральную совокупность и основу выборки, которые могут использовать­ся в данном случае.

b) Опишите, как получить простую случайную выборку, используя установленную вами основу выборки.

c) Можно ли провести стратифицированную выборку? Если да, то каким образом?

d) Можно ли применить кластерную выборку? Если да, то каким образом?

e) Какой из методов выборочного наблюдения вы порекомендуете? Почему?