Выборки и их виды

Основные понятия математической статистики

Математическая статистика

Математическая статистика занимается установлением закономерностей, которым подчинены массовые случайные явления, на основе обработки статистических данных, полученных в результате наблюдений. Двумя основными задачами математической статистики являются:

1. определение способов сбора и группировки этих статистических данных;

2. разработка методов анализа полученных данных в зависимости от целей исследования, к которым относятся:

а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин и т.д.;

б) проверка статистических гипотез о виде неизвестного распределения или о значениях параметров известного распределения.

Для решения этих задач необходимо выбрать из большой совокупности однородных объектов ограниченное количество объектов, по результатам изучения которых можно сделать прогноз относительно исследуемого признака этих объектов.

Генеральная совокупность – все множество имеющихся объектов.

Выборка – набор объектов, случайно отобранных из генеральной совокупности.

Объем генеральной совокупности N и объем выборки n – число объектов в рассматриваемой совокупности.

Выборка из генеральной совокупности должна обладать свойствами:

1) каждый элемент выбран случайно;

2) все имеют одинаковую вероятность попасть в выборку;

3) n должно быть настолько велико, насколько позволяет решать задачу с требуемым качеством, т.е. выборка должна быть репрезентативной.

Принято считать, что при п > 60 выборка большая, или репре­зентативная, а при п < 60 - малая. Такое деление выборки на боль­шую и малую условно. Разные авторы используют разное пограничное л, делящее выборки на малые и большие, которое к тому же зависит от решаемой статистической задачи.

Понятие репрезентативная выборкане всегда можно связать с ее объемом п. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, трудоемкости и стоимости получения наблюдений или измерений для формирова­ния выборки..

Возможны ситуации, когда генеральная совокупность мала. Например, исследуется время наработки до отказа уникального оборудования, когда в эксплуатации находится заведомо малое ко­личество его экземпляров. Доступного для исследования обо­рудования может быть еще меньше. Поэтому выборка объемом n, близким к объему генеральной совокупности N, может считаться репрезентативной и одновременно малой (п < 60).

Пример. Количество зарегистрированных малых предпри­ятий торговли продуктами питания в городе Новосибирске равно 2436. Для исследования предприятий по объему товарооборота взято 136 предприятий. В данном случае N =2436 - объем генеральной совокупности (все мыслимые предприятия данной катего­рии), п=136 - объем выборки из генеральной совокупности.

Виды выборки:

Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность;

Бесповторная – отобранный объект в генеральную совокупность не возвращается.

Пусть интересующая нас случайная величина Х принимает в выборке значение х1 п1 раз, х2п2 раз, …, хк – пк раз, причем , где п – объем выборки. Тогда наблюдаемые значения случайной величины х1, х2,…, хк называют вариантами, а п1, п2,…, пкчастотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты (частости)

Очевидно, что сумма частот равна объему выборки (выборочной совокупности) n , а сумма относительных частот (частостей) равна единице:

.

Последовательность вариант, записанных в порядке возрастания, называют вариационнымрядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом: