Выборочное наблюдение

1.Понятие о выборочном наблюдении. Виды выборки.

2.Расчет ошибки выборки и распространение ее на генеральную совокупность.

3.Определение необходимой численности выборки.

 

j. Выборочное наблюдение получило в настоящее время достаточно широкое распространение не только в экономических исследованиях. Оно является основным в социологических исследованиях, доминирующим в различных областях знаний: медицине, юриспруденции, метрологии и многих других. Причин его применения несколько:

1. Как это ни странно звучит, но применение выборочного метода способствует повышению точности данных. Происходит это за счет того, что с уменьшением числа единиц наблюдения –резко снижаются ошибки регистрации.

2. Применение выборок обеспечивает экономию материальных, трудовых, финансовых ресурсов и времени.

3. Без выборки не обойтись, когда наблюдение связано с порчей объектов, например, при изучении качества продукции на испытаниях.

Методы описательной статистики включают сбор данных их обработку и анализ по всем единицам изучаемой совокупности, которая в случае отбора из нее части единиц называется генеральной совокупностью. Генеральная совокупность может быть реальной, а может быть и гипотетической, т.е. включающей несуществующие случаи или возможные результаты эксперимента. Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.

Для того чтобы по выборке можно было судить о свойствах генеральной совокупности, выборка должна быть репрезентативной (представительной), т.е. она должна полно и адекватно представлять свойства генеральной совокупности. Репрезентативность данных может быть обеспечена только при объективности отбора данных.

Выделяют следующие виды отбора: случайный, отбор единиц по определенной схеме, сочетание первого и второго способа.

В математической статистике обязательно водят деление выборки на повторную и бесповторную. Первая соответствует схеме возвратного шара, вторая – безвозвратного. В социально-экономических исследованиях нет смысла применять повторную выборку, поэтому как правило имеется в виду бесповторный отбор. При любом виде выборки отбор производится тремя отмеченными способами отбора.

При случайном отборе прежде всего составляется список единиц совокупности, в которой каждой единице присваивается цифровой код (номер). Затем производится жеребьевка. Выпавшие номера соответствуют единицам, попавшим в выборку (число номеров заранее запланировано). Но жеребьевка с использованием технических средств не совсем надежна, а считается более надежным отбор по таблице случайных чисел. Такие таблицы есть в любом учебнике математической статистики, некоторых учебниках по общей теории статистики, математических справочниках.

Отбор единиц в соответствии с принятой схемой может быть типическим, серийным (гнездовым), механическим.

При типическом отборе вся генеральная совокупность разбивается на группы (типы, районы) однородные в качественном отношении, а затем внутри каждой такой группы производится случайный отбор подлежащих наблюдению единиц.

При серийном отборе в качестве единицы отбора представлена серия единиц («гнездо»), выбранных случайно, внутри которой проводится сплошное наблюдение.

При механическом отборе (очень распространенный способ) отбираются единицы с установленным шагом отбора, например, каждый пятый, десятый, сотый.

 

k. После проведения отбора выборочной совокупности, необходимо рассчитать его обобщающие характеристики (среднюю или долю), затем рассчитать ошибку выборки, скорректировать ее в зависимости от требуемой или желаемой вероятности и распространить на всю генеральную совокупность.

Для удобства введем условные обозначения, которые являются общепринятыми в общей теории статистики и математической статистике:

N – объем генеральной совокупности (число входящих в нее единиц).

n – объем выборочной совокупности (число единиц, пропавших в выборку.

- генеральная средняя ( среднее значение признака в генеральной совокупности).

- выборочная средняя (среднее значение признака в выборочной совокупности)

р – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности).

w – выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности).

(1-w) – доля единиц не обладающая признаком в выборке

w(1-w) – дисперсия доли в выборке.

- генеральная дисперсия (дисперсия признака в генеральной совокупности).

- выборочная дисперсия (дисперсия признака в выборочной совокупности)

- среднее квадратическое отклонение признака в генеральной совокупности.

- среднее квадратическое отклонение признака в выборочной совокупности.

Расчет обобщающих характеристик в выборке: , ,w производится по уже известным вам формулам из предыдущих тем.

Ошибка выборки для средней находится:

 

при повторном отборе:

 

при бесповторном отборе:

 

Ошибка выборки для доли находится:

при повторном отборе:

 

при бесповторном отборе:

 

Величина ошибки выборки зависит от вариации признака в выборке и объема выборки. Для того чтобы определить предельную ошибку выборки ( )необходимо увеличить ошибку выборку в зависимости от требуемой доверительной вероятности. Чем с большей вероятностью мы хотим узнать наступление события тем больше будет величина предельной ошибки выборки. Предельная ошибка выборки находится по формуле:

 

где t – коэффициент доверия, который можно определить по следующей таблице:

 

Коэффициент доверия,t 1,00 1,96 2,00 2,58 3,00
Вероятность, Ф(t) 0,683 0,950 0,954 0,990 0,997

 

Необходимо заметить, что в экономических исследованиях коэффициент доверия больше 2,00, как правило, не используется.

Данная формула предельной ошибки выборки используется как для повторного так и для бесповторного отбора, как для увеличения ошибки выборки для средней так и для доли.

После нахождения предельной ошибки выборки ее необходимо распространить на всю генеральную совокупность. Для этого определяются пределы генеральных характеристик:

для генеральной средней:

=

 

для генеральной доли:

р = w

 

 

l.Уже на стадии организации выборочного наблюдения приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений. Для того чтобы его рассчитать необходимо иметь следующие данные:

1. Размер доверительной вероятности (Р), по которому мы определим коэффициент доверия (t).

2. Дисперсию признака ( )или доли (w(1-w)) в выборке .

3. Величину максимально допустимой ошибки (предельной ошибки выборки).

4. Объем генеральной совокупности (N).

Если 1 и 3 показатели задаются исследователем, а 4 как правило известен, дисперсия признака и доли в выборке неизвестна.

Для нахождений дисперсий используют приближенные способы оценки:

1. Можно провести «пробное» обследование (обычно небольшого объема), на базе которого определяется величина дисперсии. Если проведено несколько пробных обследований, то выбирается наибольшая величина.

2. Можно использовать данные прошлых выборочных обследований, проводившихся в аналогичных целях.

3. Если распределение признака в генеральной совокупности может быть отнесено к нормальному закону распределения, то размах вариации (R = X max – X min) для количественного признака) примерно равен R =6 , отсюда = 1/6 R.

При проведении социально-экономических исследований, как правило, можно с достаточной точностью указать максимально и минимально возможные значения.

Приведем формулы, используемые для определения численности выборки (n):

При повторном отборе для средней:

 

При бесповторном отборе для средней:

 

Для доли при повторном отборе:

 

Для доли при бесповторном отборе:

 

В случаях когда частость w даже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0,25 (то еcть , при равенстве w и (1-w)).

Литература:

Основная:1.2.3,5,7,

Дополнительная: 11.12.14

Задания для СРС:

1.В чем преимущества выборочного метода в сравнении с другими видами статистических наблюдений?

2. Что такое ошибка выборки (репрезентативности)? Какие факторы определяют ее величину?

3. Чем отличается величина ошибки выборки при повторном и бесповторном отборе? Какая из этих ошибок больше?