Пример 5.3. Пример нерепрезентативной выборки

Пример 5.2

Пример 5.1

Репрезентативная выборка

Выборка должна отражать целевой рынок, т. е. представлять его характеристики или быть репрезентативной.

Репрезентативная выборка — выборка, представляющая основные характеристики генеральной совокупности.

Если в городе проживает 100000 человек, 60% из которых мужчины и 40% — женщины, то выборка 1000 человек, из которых 10 мужчин и 990 женщин, не будет репрезентативной. Построенный на ее основе опрос общественного мнения будет содержать смещение оценок и приведет к фальсификации результатов. Репрезентативная выборка — это 600 мужчин и 400 женщин, т.е. такое процентное соотношение, которое отражает основную характеристику генеральной совокупности — процентное соотношение мужчин и женщин в городе.

Если размер генеральной совокупности превышает 100000 объектов, то, как правило, по количеству репрезентативная выборка составляет 1000 и более объектов. Если размер генеральной совокупности менее 100000 объектов, то выборка при устремлении количества объектов к единице должна стремиться к 100% генеральной совокупности.

Если мы рассматриваем потребителей мороженого в мегаполисе, то репрезентативная выборка будет составлять 1000 человек и более. Если мы рассматриваем поставщиков, которых всего 15, то репрезентативная выборка будет составлять 15 поставщиков.

В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 г. Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, людям, выбранным по телефонным книгам всей страны, и людям из регистрационных списков автомобилей. В 25% вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом: 57% отдавали предпочтение кандидату-республиканцу Альфу Лэндону, 40% выбрали действующего в то время президента-демократа Франклина Рузвельта.

На действительных же выборах, как известно, победил Рузвельт, набрав более 60% голосов. Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, — так как им было известно, что большинство их подписчиков считают себя республиканцами, — они расширили выборку за счет людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали еще больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и верхнего класса (то есть большинство республиканцев, а не демократов).