Выборки 5 10 20 30 50 100
п
V 2,3 3,1 3,7 4,1 4,5 5,0
табл. 17), получим приближенное значение среднеквадратичного отклонения о = -^- = 8,8.
Пользуясь выражением для средней ошибки простого случайного повторного отбора (см. табл. 16) М= у —^-, получим М = 8,8/У900 =
■= 0,29. Предельная ошибка рассчитывается по формуле Д = ZM (см. табл. 16).
Величина Z находится по табл. А приложения при а/2. Таким образом, если 1 — a — 0,9, то Z = 1,64.
Подставляя найденные значения М и Z в формулу предельной ошибки, получаем Д == ZM — 1,64 • 0,29 = 0,48.
Таким образом, округляя значение ошибки до половины года (0,5), можно утверждать, что с вероятностью 0,9 генеральное среднее не выйдет за пределы интервала х — 0,5 < М < х + 0,5, т. в. точность выборочной оценки среднего, рассчитанной по нашей выборке (если она организована методом простого случайного повторного отбора), оказывается равной половине года. Утверждать это мы можем с вероятностью 0,9. Интервал (х — 0,5, х + 0,5) и задает доверительный интервал, рассчитанный по доверительной вероятности, равной 0,9.
Теперь рассмотрим методику нахождения доверительного интервала по заданной доверительной вероятности для качественного признака.
Пример. Выборочное обследование 900 человек, организованное по способу простого случайного повторного, отбора, показало, что 18 человек не информированы о крупном событии в стране. Для доверительной вероятности 0,95 нужно найти доверительный интервал.
Пользуясь выражением для формулы средней ошибки (см.
табл. 16) М = Ъ -F2-, получаем
/ 18 / 18 \ ____________
М - 1/ 900 \1- 900 ) _ Г 18-882 __ „ т, М ~~ Г 900 У 900-900-900 ~ u>UUl*'»
Далее по табл. Л приложения, как уже описывалось выше, для а/2 находим Z = 1,96.
Теперь можно определить величину предельной ошибки (см. табл. 16):
Д = 1,96-0,0047 м 0,009, или 0,9%.
Таким образом, доверительные границы для доли неинформированных в генеральной совокупности равны 0,02 ± 0,009, или от U до 2,9%.
Приведем иллюстративный пример определения объема простой повторной случайной выборки. Как видно из формул, чтобы определить объем (см. табл. 16), для его оценки необходимо знать дисперсии генеральной средней или хотя бы ее оценки.
Для применения соответствующей формулы необходимо оценить значение дисперсии, что можно сделать, (при отсутствии информации о пей и о размахе значений признака в генеральной совокупности) путем проведения одной-двух пилотажных (пробных) выборок.
Допустим, что в результате пилотажа выборочная оценка дисперсии равна 12,24. Определим, каким должен быть объем выборки, чтобы с вероятностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпляра газет. При отих условиях получаем численность планируемой выборки
Таким образом, объем выборки должен составлять 24 человека,