Стратегия последовательного расчета объема выборки.

Наиболее обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в: основе которого лежит ряд базовых понятий математической ста­тистики (вариация, среднее квадратическое отклонение, довери-тельный интервал, средняя квадратическая ошибка).

Для расчета необходимого размера выборки в количественном исследовании чаще всего используют два статистических поня-тия — доверительный интервал и доверительную вероятность. Доверительный интервал представляет собой заранее задаваемую вами погрешность выборки. Например, если вы задаете доверительный интервал в 3% и конкретный ответ на конкретный воп-рос исследования составит 48%, это значит, что даже при прове- дении опроса всей генеральной совокупности реальное значение попадет в интервал между 45 (48-3) и 51% (48 + 3). Доверительная вероятность показывает, насколько вы можете быть уверены в полученных результатах, в том, что характеристики выборки со-ответствуют характеристикам всей генеральной совокупности -иными словами, с какой вероятностью случайный ответ попадет в доверительный интервал. Обычно используют доверительную вероятность 95 и 99%. Чаще всего используется 95% — этого впол-не достаточно в подавляющем большинстве исследований. Если объединить доверительную вероятность и доверительный интер-вал, то можно сказать, что ответы на вопрос с 95%-ной вероятно-стью попадут в интервал между 45 и 51%.

Весьма полезна следующая приблизительная оценка надеж-ности результатов выборочного обследования. Повышенная на-дежность допускает ошибку выборки до 3%, обыкновенная — от 3 до 10% (доверительный интервал распределений на уровне 0,03-0,1), приближенная — от 10 до 20%, ориентировочная — от 20 до 40%, а прикидочная — более 40%33.

На основе этих понятий с учетом ряда предположений выво­дятся формулы расчета объема выборки, которые предполагают, что репрезентативность гарантируется путем использования кор­ректных вероятностных процедур формирования выборки.

Теоретические расчеты и практика дока­зывают, что для получения достоверных данных о мнении и предпочтениях населения такого крупного города, как Санкт-Петербург, достаточно опросить 700—800 человек. Однако боль­шинство опросов населения здесь проходят на выборках объемом до 1,5 тыс. человек.

Ошибка выборки

Как мы уже знаем, репрезентативность — свойство выборочной совокупности представлять характеристику генеральной. Если со­впадения нет, говорят об ошибке репрезентативности — мере от­клонения статистической структуры выборки от структуры соот­ветствующей генеральной совокупности. Предположим, что сред­ний ежемесячный семейный доход пенсионеров в генеральной совокупности составляет 2 тыс. руб., а в выборочной — 6 тыс. руб. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, а в его исследование вкралась ошибка репрезента­тивности. Иными словами, ошибкой репрезентативности называ­ется расхождение между двумя совокупностями — генеральной, на которую направлен теоретический интерес социолога и представ­ление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес со­циолога, которая выступает одновременно как объект обследова­ния и средство получения информации о генеральной совокупно­сти.

Наряду с термином «ошибка репрезентативности» в отечествен­ной литературе можно встретить другой — «ошибка выборки». Иногда они употребляются как синонимы, а иногда «ошибка вы­борки» используется вместо «ошибки репрезентативности» как количественно более точное понятие.

Ошибка выборки — отклонение средних характеристик выбо­рочной совокупности от средних характеристик генеральной со­вокупности.

Сравнение средних гене­ральной и выборочной совокупностей, на основе этого опреде­ление ошибки выборки иее уменьшение называется контроли­рованием репрезентативности. Поскольку сравнение своих и чужих данных можно сделать по завершении исследования, та­кой способ контроля называется апостериорным, т.е. осуществ­ляемым после опыта.

Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки.

Ошибки выборки подразделяются на два типа — случайные и систематические. Случайная ошибка — это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погреш­ности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности (табл. 2.8).

Таблица 2.8

Зависимость объема выборки от ее ошибки36 (размер генеральной совокупности составляет 20 тыс. ед.)

Ошибка выборки,%
Объем выборки, ед.

Второй тип ошибок выборки — систематические ошибки. Если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил толь­ко тех, у кого есть телефон, то возникает предумышленное смеще­ние выборки в пользу зажиточных слоев, т.е. систематическая ошибка.

Таким образом, систематические ошибки — результат деятель­ности самого исследователя. Они наиболее опасны, поскольку приводят к довольно значительным смещениям результатов ис­следования. Систематические ошибки считаются страшнее слу­чайных еще и потому, что они не поддаются контролю и изме­рению.

Они возникают, когда, например: 1) выборка не соответствует задачам исследования (социолог решил изучить только работаю­щих пенсионеров, а опросил всех подряд); 2) налицо незнание характера генеральной совокупности (социолог думал, что 70% всех пенсионеров не работает, а оказалось, что не работает толь­ко 10%); 3) отбираются только «выигрышные» элементы генераль­ной совокупности (например, только обеспеченные пенсионеры).

Внимание! В отличие от случайных ошибок систематические ошибки при возрастании объема выборки не уменьшаются.

Обобщив все случаи, когда происходят систематические ошиб­ки, методисты составили их реестр. Они полагают, что источни­ком неконтролируемых перекосов в распределении выборочных наблюдений могут быть следующие факторы:

♦ нарушены методические и методологические правила про­ведения социологического исследования;

♦ выбраны неадекватные способы формирования выборочной совокупности, методы сбора и расчета данных;

♦ произошла замена требуемых единиц наблюдения другими, более доступными;

♦ отмечен неполный охват выборочной совокупности (недо­получение анкет, неполное их заполнение, труднодоступность единиц наблюдения).

Намеренные ошибки социолог допускает редко. Чаще ошибки возникают из-за того, что социологу плохо известна структура генеральной совокупности: распределение людей по возрасту, профессии, доходам и т.д.

Систематические ошибки легче предупредить (по сравнению со случайными), но их очень трудно устранить. Предупреждать сис­тематические ошибки, точно предвидя их источники, лучше все­го заранее — в самом начале исследования.

Вот некоторые способы избежать ошибок:

каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;

♦ отбор желательно производить из однородных совокупностей;

♦ надо знать характеристики генеральной совокупности;

♦ при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Особенно важной проблема ошибок становится в маркетинго­вых исследованиях, где используются не очень большие выбор­ки. Обычно они составляют несколько сотен, реже — тысячу рес­пондентов.

Итак, чем больше величина выборки, тем меньше возможная ошибка.

Определение объема выборки зависит также от уровня довери­тельного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые свя­заны с природой любых статистических погрешностей.

расчеты репрезентативной выборки с допущением 5%-ной ошибки (табл. 2.9):