Ошибки выборочного наблюдения
Блок 10. Содержание выборочного наблюдения, ошибки выборочного наблюдения
Модуль 4 . Выборочное наблюдение
Мы уже знаем, что если возникает необходимость проведения наблюдения, то оно может проводиться как сплошное наблюдение, когда обследуются все без исключения единицы наблюдения и как несплошное наблюдение, когда обследуется только определенная часть общей совокупности.
Выборочное наблюдение – основной вид из ряда способов несплошного наблюдения. Выборочным называется наблюдение заранее определенного числа единиц совокупности, отобранных в особом порядке. Выборочный метод исследования предполагает получение обобщающих показателей изучаемой совокупности по обследованной ее части. При этом подлежащая исследованию совокупность называется генеральной совокупностью, а отобранная из генеральной совокупности ее часть называется выборочной совокупностью.
Выборочный метод позволяет при минимальной численности обследуемых единиц получить объективные характеристики всей изучаемой совокупности. Это особенно актуально в современных условиях, когда сплошные наблюдения дороги и не всегда эффективны. Теория и опыт показали, что при правильной организации выборочного наблюдения можно получить достоверные данные о изучаемой совокупности. Эти данные (абсолютные и относительные) достаточно точно воспроизводят – репрезентируют всю совокупность. Выборочные наблюдения практикуются во всех видах социальной и экономической деятельности.
Для более глубокого изучения выборочного метода введем некоторые условные обозначения:
N – объем генеральной совокупности – число входящих в нее единиц;
n - объем выборочной совокупности – число единиц, попавших в выборку;
генеральная средняя – среднее значение изучаемого признака в генеральной совокупности;
выборочная средняя – среднее значение изучаемого признака в выборочной совокупности;
р - генеральная доля – доля единиц, обладающих данным признаком в генеральной совокупности;
w - выборочная доля – доля единиц, обладающих данным признаком в выборочной совокупности; где m- число единиц, обладающих изучаемым признаком, n – объем выборочной совокупности;
генеральная дисперсия - дисперсия изучаемого признака в генеральной совокупности;
выборочная дисперсия – дисперсия изучаемого признака в выборочной совокупности;
среднее квадратическое отклонение изучаемого признака в генеральной совокупности;
среднее квадратическое отклонение изучаемого признака в выборочной совокупности.
При любом наблюдении (сплошном и несплошном) возникают ошибки при регистрации единиц наблюдения. Такие ошибки называются ошибками регистрации. Они могут быть случайными и систематическими, это связано в значительной степени с субъективным фактором, который всегда присутствует при организации и проведении наблюдения.
При проведении выборочных наблюдений, помимо ошибок регистрации, возникают случайные ошибки репрезентативности (представительности), которые возникают в связи с тем, что отобранная для наблюдения часть общей совокупности имеет отличную от генеральной n
Научным обоснованием случайных ошибок выборки являются теория вероятностей и ее предельные теоремы. Используются теоремы русских математиков П.Л. Чебышева и А.М. Ляпунова. В соответствии с этими теоремами, с увеличением численности выборки размеры случайных ошибок сокращаются, что при достаточно большом объеме выборки случайная ошибка будет сколь угодно мала и что характеристики выборочного наблюдения будут надлежащим образом представлять генеральную совокупность.
Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки . Под средней ошибкой выборки понимают расхождение между средними выборочной и генеральной совокупности (, которое не превышает . В математической статистике доказано, что значение средней ошибки выборки определяются по формуле:
где дисперсия изучаемого признака х в выборочной совокупности, а n – численность выборочной совокупности.
Соответственно для расчета средней ошибки доли изучаемого признака используется формула:
где pq – где дисперсия доли изучаемого признака, а n – численность выборочной совокупности. Следовательно, для уменьшения средней ошибки выборки в 3 раза необходимо увеличить объем выборки в 9 раз.
Рассмотрим условный пример. Генеральная совокупность – число сделок N =1000
Доходность сделок (тыс. руб.) Число сделок
12 200
14 500
15 300
Всего: 1000
Средня доходность:
тыс. руб.
Дисперсия:
Доля сделок с доходностью 14 и более тыс. рублей р=или 80%
Предположим, что случайным образом отобрана информация о 200 сделках и получены данные о средних и относительных показателях:
Доходность сделок (тыс. руб.) Число сделок
12 34
14 100
15 66
Всего: 200
Средняя доходность тыс. руб.
Дисперсия
Доля сделок с доходностью 14 и более тыс. рублей w=или 83%.
Сведем полученные показатели в таблицу:
|
Теперь можно определить среднюю ошибку выборки:
Для средней доходности ;
Для доли 14 и более т. руб..