Примеры выборки
Пример 6.
В микрорайоне проживает 2500 семей. Для установления среднего числа детей в семье была проведена 2%-ная случайная бесповторная выборка семей. В результате обследования были получены следующие данные:
число детей в семье | ||||||
число семей |
С вероятностью 0,997 требуется определить границы, в которых будет находиться среднее число детей в семье в генеральной совокупности (в микрорайоне).
Решение.
Чтобы определить границы генеральной средней, необходимо рассчитать выборочную среднюю и ошибку выборочной средней. Рассчитаем среднее число детей в семье в выборочной совокупности и дисперсию выборочной совокупности:
Число детей в семье | Количество семей | ||||
-1,4 | 1,96 | 19,6 | |||
-0,4 | 0,16 | 3,36 | |||
0,6 | 0,36 | 4,32 | |||
1,6 | 2,56 | 10,24 | |||
2,6 | 6,76 | 13,52 | |||
3,6 | 12,96 | 12,96 | |||
Итого |
чел., .
Предельная ошибка выборочной средней при бесповторном отборе с вероятностью 0,997 равна:
чел.
Определим пределы, в которых находится среднее число детей в семье в микрорайоне:
С вероятностью 0,997 можно утверждать, что среднее число детей в семье в микрорайоне находится в пределах .
Выборочная доля равна гдечисло единиц в выборке, обладающих изучаемым признаком, объем выборки.
Средняя стандартная ошибка выборочной доли при повторном отборе равна
так как, генеральная доля неизвестна, то при достаточно большом объеме выборки заменяем ее выборочной долей . Предельная ошибка доли .
Средняя ошибка выборочной доли при бесповторном отборе равна
где - объем генеральной совокупности,- объем выборки.
Доверительный интервал для генеральной доли можно записать как:
Пример 7.
По данным примера 6, определить с вероятностью 0,954 границы, в которых будет находиться доля семей число детей, в которых в генеральной совокупности (в микрорайоне) больше трех.
Решение:
Выборочная доля семей число детей в которых больше трех равна
.
Предельная ошибка выборочной доли при бесповторном отборе с вероятностью 0,954 равна:
Определим пределы, в которых будет находиться доля семей число детей, в которых в генеральной совокупности (в микрорайоне) больше трех. Получили, , так как доля не может отрицательной, то полагаем, что . Тогда,
С вероятностью 0,954 можно утверждать, что среднее число детей в семье в микрорайоне находится в пределах .
Типическая выборка
При типическом (районированном) отборе генеральная совокупность разбивается на однородные типические группы, районы. Отбор единиц наблюдения в выборочную совокупность производится различными методами. Рассмотрим типическую выборку с пропорциональным отбором внутри типических групп. Объем выборки из типической группы при отборе, пропорциональном численности типических групп, определяется по формуле:
где объем выборки из типической группы;
общий объем выборки,
объем типической группы,
объем генеральной совокупности.
Предельная ошибка выборочной средней и доли при бесповторном случайном и механическом отборе внутри типических групп рассчитывается по формулам
При бесповторном отборе
При этом общая выборочная средняя рассчитывается из групповых выборочных средних по формуле: .
Средняя выборочная из внутригрупповых дисперсий:
Средняя выборочная доля рассчитывается по формуле:
Средняя из внутригрупповых дисперсий доли определяется по формуле:
Серийная выборка
При серийном способе отбора генеральную совокупность делят на одинаковые по объему группы- серии. В выборочную совокупность отбираются серии. Внутри серий производится сплошное наблюдение единиц, попавших в серию.
При бесповторном отборе серий средняя ошибка выборочной средней и средняя ошибка выборки для доли определяются по формуле:
где - межсерийная дисперсия средних или межсерийная дисперсия доли,
- число серий в генеральной совокупности,
- число отобранных серий.
Пример 8.
В цехе предприятия 10 бригад рабочих. С целью изучения производительности их труда была произведена 20%-я серийная выборка, в которую попали две бригады. В результате обследования установлено, что средняя выработка рабочих в бригадах составила 4,4 т и 3,0 т. С вероятностью 0,997 определить пределы, в которых будет находиться средняя выработка рабочих цеха.
Решение:
Выборочная средняя серийной выборки равна
Дисперсия серийной выборки равна
где - выборочная средняя серии, - выборочная средняя серийной выборки. Рассчитаем предельную ошибку выборки для средней:
С вероятностью 0,997 можно утверждать, что средняя выработка рабочих цеха находится в пределах
Определение необходимой численности выборки
Средняя квадратическая (стандартная) ошибка выборки зависит от объема выборки и степени вариации признака в генеральной совокупности. Уменьшение стандартной ошибки выборки, а следовательно, увеличение точности оценки, всегда связано с увеличением объема выборки. В этой связи уже на стадии организации выборочного наблюдения приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений. Предельная ошибка выборки, вероятность ее появления и вариация признака предварительно известны. Приведем наиболее часто применяемые на практике выражения необходимого объема выборки:
n случайная и механическая выборка:
(повторный отбор)
(бесповторный отбор)
n типическая выборка
(повторный отбор)
(бесповторный отбор)
n серийная выборка
(повторный отбор)
(бесповторный отбор)
Величина характеризующая дисперсию признака в генеральной совокупности, зачастую бывает неизвестна. Поэтому используют приближенные способы оценки генеральной дисперсии.
1. Можно провести «пробное» обследование (обычно небольшого объема), на базе которого определяется величина дисперсии признака, используемая в качестве оценки генеральной дисперсии.
2. Можно использовать данные прошлых выборочных обследований, проводившихся в аналогичных целях, т.е. дисперсия, полученная по их результатам используется в качестве оценки генеральной дисперсии.
3. Если распределение признака в генеральной совокупности может быть отнесено к нормальному закону распределения, то размах вариации примерно равен откуда .
При проведении социально-экономических исследований, как правило, можно с достаточной точностью указать максимально и минимально возможные значения признака в исследуемой совокупности.
При определении по материалам выборки доли признака, а не средней его величины, объем выборочной совокупности при случайном отборе определяется по формулам:
(повторный отбор)
(бесповторный отбор)
При других видах отбора легко получаются аналогичные формулы. Если частость даже приблизительно неизвестна, то дисперсию доли полагают равной максимальному значению .