Основные понятия математической статистики

Выборочный метод. Статистические оценки параметров распределения.

План.

1. Генеральная совокупность и выборка.

2. Сущность выборочного метода.

3. Дискретные и интервальные вариационные ряды. Полигон и гистограмма.

4. Числовые характеристики выборки.

1.Df: Математическая статистика – раздел математики, который имеет своим предметом изучение методов сбора, систематизации, обработки и использования статистических данных для получения научно-обоснованных данных и принятия решений.

Df: Статистические данные – совокупность чисел, которые представляют количественные характеристики интересующих нас признаков изучаемых объектов.

Статистические данные получаются в результате специально поставленных опытов, наблюдений.

Exp: Последовательность чисел, которые получаются в результате неоднократного измерения некоторой величины, например, взвешивание некоторого тела на аналитических весах.

Результаты проводимых исследований методами математической статистики применяются к принятию решения , в частности, при планировании и организации производства, при анализе технологических процессов, при предупредительном и приёмочном контроле качества продукции, при выборе оптимального времени настройки или замены действующей аппаратуры.

Математическая статистика возникла в XVIII веке в работах Бернулли и Лапласа. Большой вклад внесли русские учёные Буняковский, Чебышёв, Марков, Колмогоров, Гнеденко и другие.

Основные понятия математической статистики

Пусть требуется изучить данную совокупность объектов относительно некоторого признака. Например, требуется определить, в какой степени параметры выпускаемых изделий соответствуют стандартным нормативам. Если число элементов в совокупности не очень большое и обследование объектов не связано с его уничтожением и не требует больших затрат, то можно исследовать каждый элемент по отдельности, фиксировать значения исследуемого признаки соответствующей обработкой результатов, сделать тот или иной вывод об изучаемом признаке. В противном случае исследования не целесообразны. Бессмысленно например, исследовать на срок горения все лампочки данной партии, т.к. в результате вся партия уничтожается. В таком случае выводы делаются на основании изучения ограниченного числа объектов, должным отобранных из общей совокупности.

Df: Генеральной совокупностью называется множество числовых значений некоторого признака всех объектов, рассматриваемой совокупности, т.е. генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Df: Выборочной совокупностью называют совокупность объектов, отобранных случайным образом.

Или просто выборкой множества числовых значений некоторого признака всех объектов, случайным образом отобранных из всей совокупности рассматриваемых объектов.

Exp: генеральной совокупностью является совокупность чисел, соответствующих сроком службы всех лампочек выпущенной партии, а выборочной – совокупность чисел соответствующая сроком службы отобранных, для испытания лампочек.

Для простоты, если это не приводит к противоречиям, т.е. недвусмысленного известно, о каком признаке идёт речь, под «генеральной совокупностью» и под «выборкой» будем понимать саму «совокупность» изучаемых объектов.

Exp: партия всех лампочек, выпущенная заводом – есть генеральная совокупность, а множество лампочек, взятых для обследования – выборочная.

Основная задача математической статистики – получение обоснованных выводов о неизвестных свойствах генеральной совокупности по известным свойствам, извлечённой из неё выборки.

Df: Число объектов совокупности (генеральной или выборочной) называется объёмом данной совокупности.

Exp: Если цех выпустил 2000 деталей, а для обследования отобрано 150 деталей, то объёмом генеральной совокупности равен 2000 (N=2000), а объём выборки равен 150 (n=150).

2.Виды выборок.

Различают выборки с возвращением и без возвращения. Если после фиксирования значения параметра объект возвращается в генеральную совокупность и, таким образом, он может многократно повторяться в выборке, то говорят о выборке с возвращением. В противном случае речь идёт о выборке без возвращения.

Df:Говорят, что выборка репрезентативна (представительна), если она достаточно полно представляет изучаемые признаки генеральной совокупности.

Способы отбора.

Df:Простым называется отбор, при котором из генеральной совокупности случайным образом извлекается по одному элементу с возвращением или без возвращения.

Exp: Для изучения белых медведей экспедиция ловит случайным образом попавшихся ей белых медведей, измеряет исследуемые параметры и отпускает животных на волю или сдаёт в зоопарк, в зависимости от целей.

Df:Типическим называется отбор, при которым объекты случайным образом отбираться из каждой «типической» части генеральной совокупности.

Exp: Если детали изготавливаются разными цехами, то для обеспечения репрезентативности выборки отбор производиться случайным образом с соблюдением пропорций их продукции каждого цеха.

Df:Механическим называется отбор, при котором объекты отбираются через определённый интервал, скажем каждый пятый.

Df:Серийным называется отбор, при котором выборка состоит из целой серии объектов. Этим способом пользуются в тех случаях, когда исследуемый признак в генеральной совокупности колеблется незначительно.

Exp: Если квалификация всех рабочих цеха, качество технических средств и сырья существенно не изменяются в течении недели, то для проверки недельной продукции данного цеха можно провести сплошную проверку продукции одного дня.

3. Группировка статистических данных.

Изучение статистических данных обычно начинается с их группировки в порядке возрастания значения признака.

Df: Наблюдаемые значения рассматриваемого признака называются вариантами, а последовательность вариант, записанных в возрастающем порядке, называется выборочным или вариационном рядом.

Условимся обозначать через х1,х2,…,хk значения вариант в данной выборке.

х1, х2, х3,…хk – вариационный ряд.

х1<x2<x3<…<xk.

х1 – наименьшее значение признака

xk – наибольшее значение признака

xk - х1 – размах выборки.

Пусть из генеральной совокупности отобрана выборка, в которой значения х1 признака х наблюдалось n1 раз, значение х2 - n2 раз,…., значения хn - nk раз. Если объём выборки равен n, то .

Df: Числа n1, ...........nk – называются частотами, а их отношения к объёму выборки, т.е.

- относительными частотам соответствующих вариант.

Df: Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

В теории вероятности изучается аналогичное понятие, а именно закон распределения случайной величины, который записывается в виде таблицы.

Аналогичным образом, статистическое распределение выборки можно записать в виде таблицы.

- значения случайной величины - соответствующие вероятности

Х Х1 Х2 Хk
р P1 P2 Pk

- значения вариант выборки - значения частот

Хi Х1 Х2 Хk
ni n1 n2 nk
i 1 2 k


- значения частот - значения относительных частот

Exp: Дано статистическое распределение выборки. Найти относительные частоты.

 

Хi
ni

 

 

 
Вычислим объём выборки n=3+10+7=20

Exp: Найти вариационный ряд, частоты, относительные частоты для выборки, полученной при измерении электрической ёмкости двадцати пластин в электродах по следующим результатам

9,9; 11,0; 9,2;12,0;8,0;8,7;7,0;11,8;11,7;10,3;11,2;8,1;9,5;11,5;11,6;9,7;10,2;11,4;8,6;10,0.

Вариационный ряд для данной выборки будет:

х1=7,0 х6=9,2 х11=10,2 х16=11,5

х2=8,0 х7=9,5 х12=10,3 х17=11,6

х3=8,1 х8=9,7 х13=11,0 х18=11,7

х4=8,6 х9=9,9 х14=11,2 х19=11,8

х5=8,7 х10=10,0 х15=11,4 х20=12,0

Здесь каждая варианта встречается по одному разу, поэтому ni=1 для всех i=1,2….,20.

Равными будут также и относительные частоты

Df: Выборка является репрезентативной (редставительной), если относительные частоты вариант выборки близки к соответствующим относительным частотам вариант генеральной совокупности (по всем вариантам генеральной совокупности).

Exp: Исследовать репрезентативность выборки

Хi

 

 

 
Вычислим объём выборки n=3+10+7=20

Exp: Найти вариационный ряд, частоты, относительные частоты для выборки, полученной при измерении электрической ёмкости двадцати пластин в электродах по следующим результатам

9,9; 11,0; 9,2;12,0;8,0;8,7;7,0;11,8;11,7;10,3;11,2;8,1;9,5;11,5;11,6;9,7;10,2;11,4;8,6;10,0.

Вариационный ряд для данной выборки будет:

х1=7,0 х6=9,2 х11=10,2 х16=11,5

х2=8,0 х7=9,5 х12=10,3 х17=11,6

х3=8,1 х8=9,7 х13=11,0 х18=11,7

х4=8,6 х9=9,9 х14=11,2 х19=11,8

х5=8,7 х10=10,0 х15=11,4 х20=12,0

Здесь каждая варианта встречается по одному разу, поэтому ni=1 для всех i=1,2….,20.

Равными будут также и относительные частоты

Df: Выборка является репрезентативной (редставительной), если относительные частоты вариант выборки близки к соответствующим относительным частотам вариант генеральной совокупности (по всем вариантам генеральной совокупности).

Exp: Исследовать репрезентативность выборки

Хi
ni

для генеральной совокупности, заданной таблицей

х1
(*)
6

ni
i 0,04 0,06 0,12 0,16 0,44 0,18

Вычислим относительные частоты для нашей выборки и обозначим их i' =25

Вывод: выборка репрезентативна.