Виды и схемы отбора.

Формирование выборочной совокупности из генеральной может осуществляться по-разному: в зависимости от вида и схемы отбора, и т.д. От их особенностей зависит размер ошибки и методы определения. Различаются 4 вида отбора:

1. собственно-случайный

2. механический

3. типический

4. серийный (гнездовой)

Собственно-случайный отбор  включение единиц совокупности осуществляется наудачу. Наиболее распространенным способом отбора в случайной выборке является жеребьевка, при которой на каждую единицу заготавливают билет с порядковым номером. Затем в случайном порядке отбирают необходимое количество единиц совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку.

Механический отбор  вся совокупность разбивается на равные по объему группы по случайному признаку. Затем из каждой группы случайно отбирается одна единица.

Типичный отбор  совокупность расчленяется по существенному, типическому признаку на качественно однородные, однотипные группы. Затем из каждой группы случайным или механическим способом отбирается количество единиц, пропорциональное удельному весу группы во всей совокупности.

Типический отбор дает более точные результаты чем случайный или механический, потому что при нем в выборку в такой же пропорции как и в генеральной совокупности, попадают представители всех типических групп.

Серийный отбор (гнездовой)  отбору подлежат не отдельные единицы совокупности, а целые группы, серии, гнезда, отобранные случайным или механическим способом. В каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Точность выборки зависит и от схемы отбора. Выборка м.б. проведена по схеме повторного или бесповторного отбора.

Повторный отбор  каждая отобранная единица или серия возвращается во всю совокупность и может вновь попасть в выборку.

Бесповторный отбор  каждая обследованная единица не возвращается в совокупность и не м.б. подвергнута повторному обследованию. Бесповторный отбор дает более точные результаты, т.к. при одном и том же объеме выборки наблюдение охватывает большее количество единиц изучаемой совокупности.

Обе схемы отбора могут применяться в сочетании с разными видами отбора, за исключением механического, который всегда бывает бесповторным.

 

3. Ошибки выборки, определение объема выборочной совокупности

Для суждения о праве распространения данных выборочного наблюдения на генеральную совокупность определяют величину ошибок между сводимыми показателями выборочной и генеральной совокупностей.

Обычно сопоставляют такие показатели:

1. Среднюю выборочной совокупности со средней генеральной совокупности, в результате чего получаем ошибку средней.

2. Частость выборочной совокупности с долей генеральной совокупности, что дает возможность определить ошибку частостей:

Разность между показателями выборочной и генеральной совокупностей называется ошибкой репрезентативности. Если эти показатели достаточно близки, то выборка считается репрезентативной.

Выборочная средняя и частость являются переменными величинами, т.е. могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются переменными величинами и также могут принимать различные значения в зависимости от единиц совокупности, попавшие в выборку. Вот почему определяется средняя из возможных ошибок, которая обозначается буквой . Величина зависит от степени колеблемости значений признака в генеральной совокупности и от численности выборки n. Степень колеблемости в генеральной совокупности определяется средним квадратом отклонений или дисперсией . Из математических теорем и закона больших чисел следует, что при случайном отборе, проведенном по системе повторной выборки, между и п существует следующая зависимость:

Ошибка выборочного наблюдения  это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения

Чебышев доказал, что при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице утверждать, что отклонение выборочной средней от генеральной будет сколь угодно малым.

, величину  называют средней ошибкой выборки.

Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой

Если выборочное наблюдение применяется для определения доли признака, то средняя ошибка доли исчисляется по формуле

, т.к. дисперсия альтернативного признака , где p  доля единиц совокупности, обладающих данным признаком, а q  не обладающим данным признаком.

В этих формулах и pq  характеристики генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характеристиками выборочной совокупности, что вполне правомерно, т.к. основано на законе больших чисел, по которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

При бесповторном отборе средняя ошибка выборки равна

, а ошибка доли , где N  численность единиц генеральной совокупности.

Множитель  всегда меньше единицы, т.к. n < N. Поэтому величина средней ошибки выборки при бесповторном отборе меньше чем при повторном.

Для решения практических задач выборочного обследования средней ошибки выборки недостаточно, потому что при исчислении ошибки конкретной выборки фактическая ошибка м.б. больше или меньше средней ошибки выборки . Поэтому пользуются не средней, а предельной ошибкой выборки, т.е. пределами, за которые не выйдет фактическая ошибка выборки.

Предельная ошибка выборки зависит от того, с какой вероятностью должна гарантироваться ошибка выборки. Уровень вероятности определяется на основе теорем Чебышева и Ляпунова при помощи специального коэффициента t.

Если предельную ошибку выборки обозначить буквой , то , где t  коэффициент, зависящий от вероятности, с которой гарантируется ошибка выборки. Он называется еще коэффициентом доверия. Чтобы определить величину вероятности для различных значений t на практике пользуются готовой таблицей .

 

Систематизируем формулы для определения предельной ошибки средней и доли

Схема отбора Предельная ошибка выборки  
  Для средней Для доли
Повторный отбор     Бесповторный отбор    

 

Из формул видно, что предельная ошибка выборки прямо пропорциональна коэффициенту t, дисперсии и обратно пропорциональна корню квадратному из численности выборки.

Дисперсия  величина конкретная, свойственная данной совокупности. Обычно она неизвестна, а известна *, которой и заменяют величину , потому что в силу действия закона больших чисел при достаточно большом объеме выборки n распределение признака x в выборочной совокупности близко воспроизводит распределение этого признака в генеральной совокупности.

Ошибка выборки зависит и от ее объема n. Чем больше объем выборки, тем меньше предельная ошибка (при данных и t)

Рассмотренные формулы средней и предельной ошибки и доли применяются при случайном и механическом видах отбора.

При типическом отборе предельная ошибка выборки и доли определяется по формулам:

 

Схема отбора Предельная ошибка выборки  
  Для средней Для доли
Повторный отбор     Бесповторный отбор    

т.е. при типичном отборе надо брать средние из внутригрупповых дисперсий и доли, полученные по каждой типической группе.

Из этих формул видно, что при типическом отборе в отличие от случайного исключается влияние межгрупповой вариации на точность выборки, т.к. в выборку обязательно попадают представители всех групп в тех же пропорциях, что и в генеральной совокупности. Ошибка выборки при типичном отборе зависит только от средней из внутригрупповых дисперсий, а не от общей дисперсии, как при случайном отборе т.к.

, откуда

Следовательно ошибка выборки при типическом отборе всегда меньше ошибки выборки, проведенной случайным отбором.

При серийном отборе каждая серия рассматривается как единица совокупности, и мерой колеблемости будет межсерийная выборочная дисперсия, т.е. средний квадрат отклонений серийных средних от общей выборочной средней:

, где  средняя по каждой серии, x*  общая выборочная средняя, s  число отобранных серий.

Предельная ошибка выборки и доли при серийном отборе с равновеликими сериями определяется по формулам, где S  общее число серий в генеральной совокупности.

Схема отбора Предельная ошибка выборки  
  Для средней Для доли
Повторный отбор     Бесповторный отбор    

Выборочное наблюдение, объем которого превышает 20 единиц, называется малой выборкой. Для определения средней и предельной ошибок при малой выборке пользуются теми же формулами, что и при большой, но только с некоторыми особенностями, так , а .

Кроме того, в случае малой выборки действует особый закон распределения величин t, и при определении вероятности учитывается не только коэффициент t, но и объем выборки n.

Необходимая численность выборки (n) определяется на основе формул предельной ошибки выборки.

Если выборка повторная, то при случайном и механическом отборах определяется по формуле

, при бесповторном отборе

 

4. Способы распространения выборочных характеристик.

 

Есть два способа распространения выборочных характеристик на всю совокупность  прямой пересчет и способ коэффициентов

Способ прямого пересчета заключается в том, что средние или частости выборочной совокупности умножаются на числа единиц генеральной совокупности.

Когда выборочное обследование проводится в целях уточнения данных сплошного наблюдения, применяется способ коэффициентов. В этом случае данные сплошного наблюдения сопоставляют с данными выборочного наблюдения и устанавливают процент расхождения между ними, т.е. процент надоучета или переучета. Коэффициенты, полученные в результате такого сопоставления, используются для внесения поправок в данные сплошного учета.