II. Определение ошибки выборки

В связи с тем, что изучаемые признаки, полученные в результате обследования, варьируют, то возникают различные ошибки.

Отклонения выборочной доли и выборочной средней от доли и средней в генеральной совокупности называются ошибкой выборки или ошибкой репрезентативности.

По своей природе ошибки выборки могут быть тенденциозными (систематическими) и случайными.

Тенденциозные ошибки – возникают, когда преднамеренно были отобраны лучшие или худшие единицы для выборочного обследования. На основе такого выборочного наблюдения нельзя правильно судить о показателях всей совокупности.

Поэтому основной принцип выборочного наблюдения состоит в том, чтобы не допустить тенденциозного подбора выборочной совокупности, т.е. обеспечить строгое соблюдение принципа случайного отбора. Случайный отбор гарантирует независимость результата выборки от воли наблюдателя.

Ошибки выборки при соблюдении принципа случайного отбора носят случайный характер. Закономерности появления случайных ошибок выборки изучает теория Закона больших чисел, которая доказывает, что с увеличением численности выборки размеры случайных ошибок сокращаются.

Расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки (m ), которая вычисляется по формуле:

где : - дисперсия в выборочной совокупности;

n - выборочная совокупность.

 

Применяется при повторном отборе, который состоит в том, что попавшая в выборку единица после ее обследования возвращается в генеральную совокупность, где ей представляется равная возможность снова попасть в выборку. Однако повторный отбор не дает точного представления о допущенной ошибке.

Обычно выборочное обследование проводится по схеме бесповторного отбора, при котором обследованные единицы в генеральную совокупность не возвращаются.

Поскольку при бесповторном отборе объем генеральной совокупности (N) в ходе выборки сокращается, то в формулу расчета средней ошибки выборки включается дополнительный множитель (бесповторный отбор)

 

Дисперсия выборочной совокупности определяется:

1) как дисперсия альтернативного признака:

где:

2) как дисперсия количественного признака :

где:

В результате расчет средней ошибки доли альтернативного признака имеет вид:

а) для повторного отбора:

б) для бесповторного отбора:

 

Средняя ошибка средней определяется по формулам:

а) для повторного отбора:

б) для бесповторного отбора:

 

Если отбирается 5% и более единиц из генеральной совокупности, то используется бесповторный отбор.

Если отбирается до 5% - осуществляется повторный отбор.

 

Пример 1. Определить долю стандартной продукции. При 5% отборе в выборку попало

n = 100 единиц; доля стандартной продукции составила w - 80%.

Дано:

 

 

При расчете средней ошибки выборки для среднего веса изделия берут значение дисперсии количественного признака.

 

Распишем пределы доли стандартной продукции во всей партии, которые определяются по формуле:

Доля стандартной продукции во всей партии находится в пределах от 76,1% до 83,9%.

Аналогично определяется возможное значение среднего веса изделия во всей партии продукции:

Следовательно, средний вес одного изделия во всей партии колеблется от 500,3 до 502,7г.

В математической статистике доказано, что отклонение характеристик генеральной и выборочной совокупности на величину средней ошибки выборки всегда соответствует вероятности равной 0,683. Применительно к выборочным обследованиям это понимается так, что значение пределов, исчисляемых по формулам (поправки на генеральную среднюю) можно гарантировать лишь в 683 случаях из 1000. В остальных же 317 случаях значения этих пределов будут иными.

Вероятность суждения можно повысить, если расширить пределы отклонений между изучаемыми показателями, приняв в качестве меры отклонений среднюю ошибку выборки, увеличенную в раз.

Например, при удвоенном значении , т.е. при , вероятность повысится до 0,954. Это понимается так, что только в 46 случаях из 1000 отклонения характеристик генеральной и выборочной совокупности могут выйти за пределы . При этом расширяются и границы изучаемых показателей.

Это можно проследить на данных примера. Определим характеристики доли стандартных изделий для всей партии кондитерских изделий при удвоенном значении средней ошибки выборки:

Это означает, что с вероятностью 0,954 можно утверждать, что удельный вес стандартных изделий во всей партии находится в пределах от 72,2% до 87,8 %.

Аналогично рассчитывается средний вес изделия в генеральной совокупности.

Следовательно, характеристики генеральной совокупности определяются при изучении:

а) доли альтернативного признака:

б) средней величины количественного признака:

Множитель tназывается коэффициентом доверия. Его величина зависит от того, с какой вероятностью гарантируются результаты выборочного обследования.

В практике выборочного наблюдения пользуются готовыми таблицами значений этой Интегральной функции Лапласа.

На практике обычно ограничиваются значениями t не превышающими 1-3 единицы. При этом выбор вероятности зависит от того, с какой степенью достоверности гарантируются результаты обследования.