Способы отбора единиц из генеральной совокупности.

 

 

По охвату исследуемых единиц различают сплошное и не сплошное наблюдение. Из всех видов не сплошного наблюдения наиболее часто используется выборочное. Это связано с тем, что теория выборочного наблюдения разработана более досконально, что дает возможность количественно измерить ошибки, которые присущи не сплошному наблюдению.

Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой их части, отобранной в случайном порядке. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности – обычно 5-10%.

В проведении ряда исследований выборочный метод является единственно возможным (проверка качества продукции).

Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

Подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностьюиливыборкой.

Задача выборочного наблюдения – получить правильной представление о показателях всей генеральной совокупности на основе изучения выборочной совокупности.

При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей:

- Относительные величины применяют для сводной характеристики совокупностей по альтернативному признаку; такая характеристика дается в виде доли (удельного веса) тех единиц совокупности, которые обладают интересующим признаком. Следовательно, задача выборочного наблюдения в данном случае – дать на основе выборочной доли правильное представление о доле в генеральной совокупности.

- Кроме измерения доли, перед выборочным наблюдением может стоять задача измерения среднего значения варьирующего признака во всей совокупности. В этом случае имеют дело с признаками, вариация которых проявляется в разных количественных значениях у отдельных единиц совокупности. Обобщающими характеристиками совокупностей по количественно варьирующим признакам являются средние величины. Среднее значение варьирующего признака во всей совокупности называется генеральной средней, а среднее значение признака у единиц, которые подверглись выборочному наблюдению – выборочной средней. Следовательно, задача выборочного наблюдения в данном случае заключается в том, чтобы на основе выборочной средней дать правильное представление о средней генеральной.

Разница между генеральными и выборочными параметрами называется ошибкой выборки или ошибкой репрезентативности, которая непосредственно зависит от видов и способов отбора выборочной совокупности.

Различают два вида отбора:

- повторный – после отбора какой-либо единицы она возвращается в генеральную совокупность и снова может быть выбранной;

- бесповторный – в этом случае отобранная единицы не возвращается в генеральную совокупность.

В социально-экономических исследованиях применяют, как правило, бесповторный отбор.

Условные обозначения статистических характеристик генеральной и выборочной совокупностей.

Характеристика Совокупность
Генеральная Выборочная
Объем, численность совокупности
Среднее значение признака
Общая дисперсия в
Среднее квадратическое отклонение в
Численность единиц совокупности, которые имеют определенные значения признака М
Доля единиц совокупности, которые имеют определенные значения признака
Доля единиц совокупности, у которых отсутствуют определенные значения признака (1-w)
Дисперсия альтернативного признака в

 

 

Поскольку выборочная совокупность не точно отображает состав генеральной совокупности, то выборочные оценки не совпадают с соответствующими характеристиками генеральной совокупности. Различия между ними называют ошибкой (выборки) репрезентативности. Так для средней величины они представляют собой разницу между генеральной и выборочной средней; для доли – между генеральной и выборочной долями.

Ошибки выборки носят случайный характер вследствие случайности отбора элементов для исследования изучаемых признаков и связанных с этими отличиями структур выборочной и генеральной совокупностей. Систематические ошибки возникают тогда, когда при формировании выборочной совокупности нарушен принцип случайности. Для всех единиц совокупности они имеют одностороннее направление, поэтому их называют ошибками смещения.

Присущие выборочному наблюдению ошибки исключить невозможно, однако теория выборочного метода дает математическую основу для расчета размера и определения направлений их уменьшения.

Чем больше величина ошибки выборки, тем в большей степени сводные показатели выборочного наблюдения отличаются от сводных показателей, свойственных всей совокупности. Исходя их вышесказанного, можно утверждать, что , а так как им присущи ошибки для средней и доли.

При соблюдении принципа случайного отбора ошибка выборки определяется прежде всего численностью выборки. Чем больше численность выборки при прочих равных условиях, тем меньше величина ошибки выборки. Ошибка выборки так же определяется степенью варьирования изучаемого признака: при одинаковой численности выборочных совокупностей ошибка выборки будет меньше в той совокупности, в которой изучаемый признак варьируется в меньшей степени, то есть совокупность более однородна.

Ошибки выборки рассчитывают по разному для повторного и бесповторного методов отбора единиц при формировании выборочной совокупности.

Для расчета средней ошибки выборки для средней ( ) и для доли ( ) используют следующие формулы:

 

  Повторный отбор Бесповторный отбор
Средняя ошибка выборки для средней
Средняя ошибка выборки для доли

 

На практике величина дисперсии признака в генеральной совокупности () как правило, не известна, поэтому ее заменяют выборочной дисперсией.

Величина всегда меньше единицы, поэтому сопоставление приведенных формул свидетельствует о том, что применение бесповторного отбора обеспечивает меньшую ошибку выборки.

Необходимо добавить, что ошибка выборки зависит главным образом от абсолютной численности выборки и в меньшей степени от ее относительной доли (процента выборки).

Кроме средней ошибки рассчитывают предельную ошибку для средней ( ) и доли ( ). Общий вид формулы предельной ошибки выборки следующий: . Следовательно, предельная ошибка выборки это увеличенная в t раз средняя ошибка.

t- коэффициент кратности ошибок (коэффициент доверия), зависящий от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t–кратную среднюю ошибку.

Вопрос о границах возможной ошибки решается на основе теории Чебышева-Ляпунова, которые определяют вероятность того, что ошибка репрезентативности не превышает кратную среднюю ошибка. На основе теории Чебышева в изложении Ляпунова установлено, что для

t=1 Соответствует вероятность p=0,683
t=2 Соответствует вероятность p=0,954
t=3 Соответствует вероятность p=0,997
t=4 Соответствует вероятность p=0,999

Для расчета предельной ошибки выборки используют следующие формулы:

  Повторный отбор Бесповторный отбор
Предельная ошибка выборки для средней
Предельная ошибка выборки для доли

Когда рассчитаны ошибки выборки, тогда можно установить границы, в которых находятся обобщающие характеристики генеральной совокупности, выявленные на основе выборочного исследования.

Границы, в которых находится значение генеральной средней:

откуда

 

То что генеральная средняя не выйдет за установленные пределы можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности.

Границы, в которых находится значение генеральной доли:

откуда

Пример: При бесповторной проверке веса 30 буханок хлеба из партии в 600 буханок было установлено, что средний вес хлеба «Формовой» составляет 1,47 кг. при среднем квадратическом отклонении 0,10 кг. Определить с вероятностью 0,997 среднюю и предельную ошибку выборки, границы в которых находится генеральная средняя.

Средняя ошибка выборки для средней: кг.

Предельная ошибка выборки для средней:

кг.

Границы генеральной средней:

, следовательно

(1,47-0,17)≤ средний вес ≤(1,47+0,17) от 1,3 кг. до 1,64 кг.

 

При контроле качества товаров в экономических исследованиях эксперимент может проводиться на основе малой выборки. Под малой выборкой понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности. Объем малой выборки обычно не превышает 30 единиц и может доходить до 4-5 единиц.

В торговле к минимальному объему выборки прибегают, когда большая выборка или невозможна, или нецелесообразна – проведение исследования связано с порчей или уничтожением исследуемых образцов.

Величина ошибки малой выборки определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n>100).

Средняя ошибка малой выборки исчисляется по формуле:

Предельная ошибка малой выборки определяется по формуле:

Посредством малой выборки в торговле решается ряд практических задач, прежде всего установление предела, в котором находится генеральная средняя изучаемого признака.

Поскольку при проведении малой выборки в качестве доверительной вероятности практически принимается значение 0,95 или 0,99, то для определения предельной ошибки выборки используются следующие показания распределения Стьюдента – коэффициента доверия:

 

t
0,95 0,99
3,183 5,841
2,777 4,604
2,571 4,032
2,447 3,707
2,364 3,500
2,307 3,356
2,263 3,250
2,119 2,921
2,078 2,832

Пример: При оценке пробега автомобильных шин, установленных на легковые автомобили были зафиксированы следующие результаты:

Автомобиль 1 2 3 4 5 6 7 8
Пробег, тыс. км. 29,7 31,2 28,7 31,9 27,4 29,3 30,6 31,2

Установить с вероятностью 0,95 предел в котором находится средний пробег шин для легковых автомобилей.

1. Определяем средний пробег малой выборки: тыс. км.

2. Рассчитаем дисперсию малой выборки: тыс. км.

3. Определим среднюю ошибку малой выборки: тыс. км.

4. Исходя из численности выборки и заданной вероятности, устанавливаем по распределению Стьюдента значение коэффициента доверия t=2,364. Предельная ошибка малой выборки составит: тыс. км. Следовательно, с вероятностью 0,95 можно утверждать что пробег автошин для легковых автомобилей колеблется от 28,75 тыс. км. до 31,25 тыс. км. ( ).

 

 

Перед организацией выборочного наблюдения большое значение уделяется установлению необходимого количества выборки. Во время планирования выборки возникает вопрос в необходимости определения минимального достаточного объема выборочной совокупности, при котором выборочные оценки отражали бы основные особенности генеральной совокупности. Излишне большой объем выборочной совокупности требует излишних затрат, а чересчур маленький приводит к увеличению ошибок репрезентативности. Теория выборочного метода дает возможность научно обосновать оптимальный объем выборочной совокупности.

Для определения численности выборочной совокупности исходят из формул предельной ошибки выборки:

 

  Повторная выборка Бесповторная выборка
Численность выборки при определении среднего значения
Численность выборки при определении доли

 

Некоторые трудности на практике возникают в отношении показателей вариации, которые получены на основе предыдущих исследований, или на основе специально проведенного исследования. Если ничего не известно при установлении доли данного признака в совокупности, тогда ориентируются на w=0,5 следовательно =w(1-w) = 0,25

Пример: определить оптимальную численность выборки, состоящей из 1000 человек в ходе проведения бесповторной выборки статистической оценки продолжительности жизни. Чтобы с вероятностью 0,997 предельная ошибка не превышала 0,5 года:

 

Выборочный метод чаще всего применяется для получения характеристик генеральной совокупности по соответствующим показателям выборки. В зависимости от цели исследования это осуществляется двумя способами:

1. Способ прямого пересчета состоит в том, что показатели выборочной доли или средней распространяются на генеральную совокупность с учетом ошибки выборки. Так например определяется количество поступившего нестандартного товара. Для этого с учетом принятой степени вероятности показатели доли нестандартных изделий в выборке умножаются на численность изделий во всей партии товаров.

Пример: при выборочном обследовании партии электрических лампочек в 5000 шт. доля нестандартных изделий составила 9% при установленной вероятности 0,954 и предельной ошибки выборки равной = 0,03. На основе указанных данных доля нестандартных изделий во всей партии составляет: или от 0,06 до 0,12. Способом прямого пересчета можно определить пределы абсолютного количества нестандартных изделий во всей партии:

- минимальное количество – 5000х0,06=300 штук;

- максимальное количество – 5000х0,12=600 штук.

2. Способ поправочных коэффициентов применяется в случаях, когда целью выборочного метода является уточнение результатов сплошного учета. Для этого после обобщения данных сплошного учета практикуется 10%-ное выборочное обследование с определением так называемого «процента недоучета» . С учетом полученного коэффициента вносятся поправки в общую численность генеральной совокупности.

Пример: по результатам сплошного статистического обследования 10000 человек населения установлено, что в частной собственности у них находится 980 автомобилей. В составе указанной совокупности по результатам сплошного наблюдения 10% было установлено наличие 100 автомобилей, а по результатам выборочного наблюдения - 103, следовательно, коэффициент недоучета составляет: . С учетом полученного коэффициента вносится поправка в общую численность совокупности: автомобилей. Таким образом, было не учтено 29 автомобилей и общая численность рассматриваемой совокупности составляет 980+20=1009 автомобилей.

 

 

В статистике используются различные способы формирования выборочных совокупностей, что обуславливается задачами исследования и зависит от специфики объекта изучения.

Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности.

Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов отбора единиц из генеральной совокупности:

1 – индивидуальный отбор – в выборку отбираются отдельные единицы;

2 – групповой отбор – в выборку попадают качественно однородные группы или серии изучаемых единиц;

3 – комбинированный отбор – как комбинация индивидуального и группового отбора.

В статистике различают так же одноступенчатый и многоступенчатый способы отбора единиц в выборочную совокупность:

- при одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. (собственно-случайная и серийная выборки)

- при многоступенчатой выборке производят отбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. (типическая выборка с механическим способом отбора единиц в выборочную совокупность)

Способы отбора определяются правилами формирования выборочной совокупности. Выборка может быть:

1. Собственно случайная. Состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных единиц обычно определяется исходя из принятой доли выборки (К):

Важным условием репрезентативности собственно-случайной выборки является то, что каждой единице генеральной совокупности предоставляется равная возможность попасть в выборочную совокупность. (проведение тиражей выигрышей денежно-вещевой лотереи)

2. Механическая. Заключается в том, сто отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы. При этом размер интервала в генеральной совокупности равен обратной величине доли выборки. Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке.

3. Типическая. При подобной выборке генеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность. Репрезентативность типической выборки обеспечивается расчленением генеральной совокупности, что обуславливает представительство в выборке каждой типологической группы.

4. Серийная (гнездовая). Заключается в том, что из генеральной совокупности отбираются не отдельные единицы, а целые их серии (гнезда). Внутри же каждой из попавшей в выборку серии исследуются все без исключения единицы, то есть применяется сплошное наблюдение. Отбор отдельный серий в выборочную совокупность осуществляется либо собственно-случайной выборкой или механическим отбором.

5. Комбинированная. Может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы, затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц. Может быть многоступенчатой.

Таким образом, способы формирования выборочной совокупности выступают в качестве важнейшего фактора, который определяет репрезентативность выборочного обследования.

 

Тема Статистическое изучение взаимосвязи показателей