Тема 5. Выборочное наблюдение

Под выборочным наблюдением понимается метод исследования, связанный с установлением обобщающих показателей совокупности по некоторой ее части на основе метода случайного отбора. При выборочном наблюдении обследованию подвергается сравнительно небольшая часть всей совокупности (10 – 15%). Вся совокупность, подлежащая обследованию, называется генеральной совокупностью. Отобранная из генеральной совокупности часть единиц, непосредственно подвергающаяся обследованию, называется выборочной совокупностью или выборкой

В связи с тем, что исследуемая совокупность состоит из единиц с варьирующими признаками, состав выборки может отличаться от состава генеральной совокупности, вызывая расхождение между генеральными и выборочными характеристиками. Такие расхождения называются ошибками репрезентативности или ошибками выборки.

При использовании выборочного наблюдения можно установить две характеристики выборочной совокупности: среднее значение признака и долю единиц совокупности, обладающих альтернативным признаком.

Доля единиц, обладающих альтернативным признаком, в генеральной совокупности определяется следующим образом:

(83)

где Р – доля альтернативного признака в генеральной совокупности;

Naчисленность единиц, обладающих альтернативным признаком, в генеральной совокупности;

N – общая численность единиц в генеральной совокупности.

 

В выборочной совокупности доля единиц, обладающих альтернативным признаком, определяется аналогично:

(84)

Так, если в ходе выборочного наблюдения качества рыбных консервов было установлено, что из 5000 обследованных банок 22 были признаны бракованными. В этом случае доля бракованной продукции (доля единиц, обладающих альтернативным признаком) в выборочной совокупности составит:

или 2,44%

Характеристики, полученные при выборочном обследовании, будут отличаться от характеристик генеральной совокупности на величину ошибки выборочной средней и ошибки доли альтернативного признака.

Величина ошибки репрезентативности и методика ее расчета зависит от используемого вида выборочного наблюдения, от способа формирования выборочной совокупности (повторный или бесповторный отбор), а также от объема выборки. Различают два вида ошибок – среднюю и предельную.

В статистике используется понятие малой выборки, которое не связано с особенностями формирования выборочной совокупности, а только с тем, что ее численность не превышает 30 единиц. Ошибка выборки в этом случае будет заведомо больше и для ее расчета используются специальные формулы.

В таблице 4 приведены основные виды формул, используемых для расчета средней ошибки выборки и средней ошибки доли альтернативного признака.

Таблица 4. - Формулы для расчета средней ошибки репрезентативности

Вид отбора и объем выборочной совокупности Средняя ошибка выборочной средней Средняя ошибка доли альтернативного признака
Формула Номер формулы Формула Номер формулы
Повторный отбор (бесповторный объемом до 5%) (85) (86)
Бесповторный отбор объемом свыше 5% (87) (88)
Малая выборка (89) (90)

 

где N - объем генеральной совокупности.

 

На основе средней ошибки выборки можно определить пределы среднего значения признака и пределы доли альтернативного признака в генеральной совокупности.

Пределы генеральной средней находятся по формуле:

(91)

где - генеральная средняя;

- выборочная средняя.

Пределы доли альтернативного признака в генеральной совокупности:

(92)

где Р – генеральная доля альтернативного признака.

 

Однако, средняя ошибка выборки совпадает с реальной только в 683 случаях из 1000. Если хотят получить результат с большей надежностью, используют предельную ошибку репрезентативности. Для ее определения среднюю ошибку увеличивают в t раз, где t - коэффициент доверия.

 

(93)

где Δ - предельная ошибка репрезентативности;

t - коэффициент доверия;

μ - средняя ошибка репрезентативности.

Подставляя в выражение (93) значение средней ошибки выборочной средней из таблицы 4, можно получить формулы предельной ошибки для каждого вида отбора. Например, для повторного отбора предельная ошибка выборочной средней примет вид:

(94)

Остальные виды предельных ошибок получают аналогично.

 

Предельная ошибка позволяет определить границы среднего значения признака в генеральной совокупности с заданной степенью вероятности. Например, если вероятность (надежность) ошибки репрезентативности должна быть 954 случая из 1000, значение коэффициента доверия t составит 2, т.е. предельная ошибка репрезентативности должна быть выше средней в 2 раза. Определить значение коэффициента доверия при любой степени вероятности можно на основе таблицы функции Лапласа. Выписка из таблицы функции Лапласа приведена в таблице 5.

 

Таблица 5- Выписка из таблицы функции Лапласа

F(t) t F(t) t F(t) t F(t) t
0,663 0,96 0,911 1,70 0,932 1,83 0,947 1,94
0,676 0,99 0,920 1,75 0,937 1,86 0,954 2,00
0,854 1,46 0,929 1,81 0,942 1,92 0,997 3,00

 

При использовании предельной ошибки репрезентативности пределы генеральной средней и генеральной доли альтернативного признака определяются следующим образом:

или (95)

или (96)

 

В ходе выборочного наблюдения одним из вопросов является определение объема выборочной совокупности. Определить оптимальную численность можно, используя формулу предельной ошибки репрезентативности, следовательно, выбор формулы зависит от способа формирования выборочной совокупности. В таблице 6 приведены формулы для определения оптимальной численности выборки при каждом способе отбора для расчета выборочной средней и выборочной доли альтернативного признака.

Следует помнить, что расчет оптимальной численности возможен только в том случае, когда изначально известны величины дисперсии и предельной ошибки репрезентативности. Поэтому определять оптимальную численность рекомендуется только при проведении повторных выборочных наблюдений.

 

Таблица 6 - Формулы для расчета численности выборки

 

Вид отбора и объем выборочной совокупности Для выборочной средней Для доли альтернативного признака
Формула Номер формулы Формула Номер формулы
Повторный отбор (97) (98)
Бесповторный отбор (99) (100)

 

где nx, nw - оптимальная численность выборки;

t - коэффициент доверия;

- дисперсия;

- предельная ошибка выборки;

- предельная ошибка доли альтернативного признака;

N – объем генеральной совокупности;

w - доля альтернативного признака в выборочной совокупности.