ЭЛЕКТРОННО – БИБЛИОТЕЧНАЯ СИСТЕМА

СПИСОК ЛИТЕРАТУРЫ

Табл.1

       
       

II. Задание статистического распределения полигоном частот. Для построения полигона частот на оси Ох откладываются значения вариант, на оси Oy - частоты вариант (или относительные частоты). Полученные точки плоскости (или ) соединяются отрезками, полученная ломаная линия – это полигон частот (рис. 1).

 

 

Рис. 1

Если в исследовании признак принимает значения из некоторого числового интервала (признак непрерывный), то строится интервальныйвариационный ряд. Непрерывной случайной величиной, которая может принимать любые значения из соответствующего интервала является, например, величина роста комнатного растения. Пусть значения непрерывной случайной величины Х принадлежат некоторому промежутку [a;b]. Для построения интервального вариационного ряда, в котором значение признака меняется непрерывно, необходимо: 1) Заданный промежуток [a;b] разбить на «к» элементарных частичных интервалов , (i=1;2;…к), ( ), концы интервалов можно выбрать следующим образом: (а) для вычисления числа интервалов «k» на промежутке используется формула Стэрджеса (Стюргеса): k=1+3,322lgn, n – выборка; (б) длина частичного интервала вычисляется по формуле: ; (в) при разбиении промежутка [a;b] на интервалы начало промежутка – это число ; начало промежутка совпадает с концом : , , аналогичным способом получаем полуинтервалы: и т. д.; (г) построение полуинтервалов ведется до тех пор, пока начало следующего по порядку полуинтервала не превысит значение правого конца интервала «b». Построенный интервальный вариационный ряд иллюстрируется геометрической фигурой – гистограммой. При построении гистограммы используется приведенный выше алгоритм: (а) промежуток [a;b] разбивается на « частичных полуинтервалов; (b) для каждого полуинтервала вычисляется сумма частот вариант, попавших в этот полуинтервал; (с) в полуинтервал включаются варианты такие, для которых (либо ); (d) на ОХ откладываем интервалы варьирования, на этих интервалах, как на основаниях, строим прямоугольники с высотами, равными частотам соответствующего полуинтервала, получим гистограмму. Например, проведен эксперимент по оценке высоты взошедших ростков пшеницы, надо построить гистограмму распределения их высот (n=75) по данным таблицы 2:

Табл.2

 
 

 

(1). Варианты распределены в промежутке [a;b]=[3;24]; (2) число «к» интервалов по формуле Стюргеса (Стэрджеса) равно: так как число полуинтервалов не может быть дробным числом, то положим k=8 (частичные промежутки перекрывают заданный промежуток); (3) длина полуинтервалов:: (4) концы полуинтервалов: (а) первый левый конец - , певый правый - , ; (б) второй левый конец - второй правый - , и т.д., составляем таблицу для вычисления частот вариант (табл.3):

Табл.3

Полуинтервалы Сумма частот Частоты
  2+4
 
  5 +5+7
  6+7
  8+10
  8+4
  2+2
 

(в) гистограмма: на оси Ох откладывают полуинтервалы, на Oy – частоты: (рис.2). Гистограмма показывает, что рассмотренное распределение близко к нормальному (см. кривую Гаусса).

 

 

 

Рис. 2.

4.Простейшие характеристики дискретного вариационного ряда, не требующие вычислений – это мода и медиана. Мода – это значение варианты, наиболее часто встречающееся в вариационном ряду: Мо. Например, в распределении (1, табл.4) чаще всего встречается варианта , Мо=7;

 

Табл.4

 

 
 

 

в распределении (2, табл.5) все значения в выборке встречаются одинаковое число раз, моды нет;

Табл.5

 

 
   
           

в распределении (3, табл.6) частоты расположенных рядом значений вариант ( ) одинаковы и больше частот остальных значений, Мо= , Мо=8;

Табл.6

 
 

 

в распределении (4,табл.7) два несмежных значения в выборке ) имеют одинаковые частоты, которые больше частот всех остальных вариант; имеются две моды: , выборка бимодальная.

Табл.7

 
 

Медиана – это значение варианты, которое приходится на середину вариационного ряда: Мd. (а) Если выборка нечетная (n=2q-1), то в середине вариационного ряда находится варианта и Мd=. Пусть n=7, - середина выборки, Мd==4, например, в выборке

3,4,6,7,9,10,11 (n=7) середина =7,Мd=7. (b) Если выборка четная (n=2q), тогда на середину вариационного ряда приходится два значения и,тогда Md= , например, в выборке 3,4,6,7,9,10,11,12 (n=8): n=2q=8, q=4, Md= 8, Md=8. Иначе: медиана - это то значение варианты, котрое делит вариационный ряд пополам.

6. Пусть генеральная совокупность объектов обладает признаком Х, из совокупности случайно извлекается -ый объект, которому сопоставляется значение признака Х. Как в теории вероятностей: (а) испытание –извлечение объекта из совокупности; (б) случайная величина –признак величины Х; (в) числовое i-ое значение признака Х– это варианта . Если установили, по какому закону распределяется признак Х, то встает задача оценки параметров, характеризующих это распределение, в частности, при нормальном законе распределения оцениваются параметры М(Х) и . В исследовании всегда имеется выборка, значения признака , полученные в результате « наблюдений, через них выражается оцениваемый параметр. С другой стороны, экспериментальные значения признака Х можно рассматривать и как значения разных случайных величин с тем же распределением, что и величина Х, (с теми же числовыми характеристиками М(Х), D(X) и ): (3), значения - это реализации случайных величин . Статистическая оценка неизвестного параметра теоретического распределения - -это функция от наблюдаемых случайных величин. Чтобы не исследовать каждый параметр отдельно, обозначим неизвестный параметр символом « », (для неизвестных параметров нормального распределения: = М(Х), = ). Параметр неизвестен, обозначим его статистическую оценку через . При серии опытов на выборке « имеем серию статистических оценок: (а), поэтому оценку можно считать случайной величиной, а (а) – возможными значениями этой случайной величины. Оценка дает приближенное значение параметра с избытком (если каждое больше истинного значения параметра, тогда среднее значение параметра (или математическое ожидание параметра М( )) тоже больше истинного значения: ), либо с недостатком. В случае, когда оценка не равна оцениваемому параметру, возникают систематические ошибки. Во избежание ошибок надо потребовать, чтобы математическое ожидание оценки параметра было бы равно самому оцениваемому параметру: Для практической ценности к оценке неизвестного параметра предъявляются три требования: несмещенности оценки, эффективности оценки и её состоятельности. Несмещенная оценка параметра - это такая оценка , если (4), (т.е. математическое ожидание оценки должно совпадать с самой оценкой параметра ). Смещенная оценка параметра - это такая оценка , для которой (5). Не всегда несмещенная оценка неизвестного параметра дает его хорошее приближение: возможные значения могут быть сильно рассеяны вокруг , поэтому дисперсия , показывающая меру рассеяния, может оказаться достаточно большой. Поэтому возникает требование, чтобы отклонение оценки от было минимальным (чтобы дисперсия была мала). Эффективная статистическая оценка - это оценка, имеющая наименьшую возможную дисперсию (при заданной выборке).

7.Если в генеральной совокупности объёма «каждый объект обладает признаком Х, количество признака у каждого объекта: , то генеральная средняя – это среднее арифметическое значений признака Х : , . Если все значения признака с частотами и вероятностями (а) различны, то (6) или (7); если значения заданы частотами, то (8) или (9). При (вероятность ) получаем:

(10). Из (9) и (10): (11) – это генеральная средняя.

Если вероятность появления признака постоянна ( ), то

, т.е. - математическое ожидание признака Х - это генеральная средняя этого признака. Выборочная средняя - это среднее арифметическое значений признака Х выборочной совокупности: . Как и в генеральной средней: для различных значений признака - (12); для значений признака Х, заданных частотами : (13). Если выборочные значения

принять за случайные велиичны с теми же характеристиками, то

- выборочная средняя случайная величина, из (3): ,

Из и : (14); параметр оценивается через выборочную среднюю .

8. Генеральная дисперсия – это среднее арифметическое квадратов отклонений значений признака Х генеральной совокупности от генеральной средней: (16) – для различных значений признака случайной величины), (17) – для значений признака, обладающих соответствующими частотами. Например, если генеральная совокупность задана таблицей распределения (табл.8):

 

Табл.8

 
 

 

то: (1) n=10+2+3+5=20; (2)

(3)

Генеральное среднее квадратическое отклонение –этоквадратный корень из генеральной дисперсии: (18). Рассеяние значений признака вокруг его среднего значения оценивается выборочной дисперсией: (1) (19) - среднее арифметическое квадратов отклонений значений признака Х от выборочной средней при различных значених признака; (2) (20) – при значениях признака , заданеых соответствующими частотами . Более постая формула для вычисления дисперсии: (21).

Из и получаем выборочную дисперсию:

= (22) - дисперсия выборочной средней равна - ой дисперсии случайной величины Х.

Т.к. (11) и , то

,

т.е. (23). Из то (24).

Если (несмещенная оценка выборочнойдисперсии) и можно доказать, что , то это утверждает, что выборочная дисперсия является смещенной оценкой генеральной дисперсии (для несмещенной верно ).

9.. Оценки неизвестных параметров бывают точечные и интервальные. Точечная оценка–это оценка, которая определяется одним числом. Все оценки, которые рассматривались выше, это точечные оценки. Если выборка «небольшая, точечная оценка может существенно отличаться от истинного значения неизвестного параметра и приводить к ошибкам в вычислениях. Поэтому пользуются оценками, определяемыми двумя числами, между которыми заключен неизвестный параметр. Интервальная оценка – это оценка, которая определяется двумя числами – концами интервала. Пусть (статистическая оценка неизвестного параметра - константа) принадлежит некоторому интервалу; тем точнее определит параметр , чем ближе будут находиться друг к другу концы интервала, т.е. чем меньше величина . Иначе, если (25), то чем меньше , тем оценка параметра точнее. Однако оценка статистически не всегда удовлетворяет условию , поэтому говорят о вероятности, с которой оценка попадает в интервал Доверительная вероятность, или надежность, оценки параметра - это вероятность « », с которой выполняется неравенство : (26).

10. В науке (естествознании, психологии, экономике) для выяснения справедливости какого–то факта высказывают некоторые предположения, которые необходимо проверить, опираясь на серию наблюдений. Для выяснения справедливости высказанного предположения формулируются гипотезы. Статистические гипотезы классифицируют на гипотезы (а) о видах законов распределения и (b) о неизвестных параметрах распределения. Если закон распределения неизвестен, но есть основания предположить, что это закон А, то формулируют гипотезу: генеральная совокупность распределена по закону А. Иногда закон распределения известен, но неизвестны его параметры. Если есть основания предположить, что неизвестный параметр равен определенному значению , то выдвигают гипотезу о равенстве параметра этому значению: . В первом случае в гипотезе идет речь о виде предполагаемого распределения, во втором случае - о предполагаемой величине параметра известного распределения. Статистическаягипотеза- это гипотеза о виде неизвестного распределения или о параметре известного распределения. Например, статистическая гипотеза: генеральная совокупность распределена по нормальному закону. Статистические гипотезы классифицируются по двум основаниям: (I) нулевая – альтернативная, (II) направленная – ненаправленная. Пусть стоит задача статистической проверки гипотезы о параметре некоторого закона распределения. Если некоторая случайная величина Х зависит от параметра , который пока неизвестен, то задается некоторая функция распределения: и надо сравнить два значения параметра: и . Если значения этих параметров не различаются, то гипотезу о сходстве этих параметров можно записать в виде равенства , откуда (27). Если саму гипотезу обозначить Н, то отсутствие различий в значениях параметра обозначают , это - нулевая гипотеза, гипотезу о том, что или обозначают , это - конкурирующая (альтернативная) гипотеза, т.е. нулевая гипотеза – это гипотеза о сходстве, а альтернативная гипотеза – это гипотеза о различии. Например, если нулевая гипотеза предполагает, что а=М(Х) нормального распределения равно 12, то конкурирующая гипотеза может, в частности, состоять в предположении, что ; кратко это записывается: . Появляется задача проверки гипотезы относительно конкурирующей гипотезы , эта проверка осуществляется на базе выборки объема «n» независимых наблюдений случайной величины Х. Поэтому множество А выборок объема « можно разделить на два непересекающихся подмножества (а) и (b), таких, что проверяемая гипотеза принимается, если выборка попадает в множество , и отвергается, если выборка принадлежит . Множество (а) называется областью допустимых значений, множество (b) - критической областью. Условиями критическая область определяется однозначно.

 

-ОСНОВНАЯ-

1. Виленкин И. В. Высшая математика. Линейная алгебра. Аналитическая геометрия. Дифференциальное и интегральное исчисления. Учебное пособие для студентов экономических, технических, естественнонаучных специальностей вузов. Ростов н/Д: Феникс, 2011г.- 415с.

2. Кудрявцев Л. Д. Курс математического анализа. Т. 1.: Учебник для бакалавров, студентов вузов, обучающихся по естественнонаучным и техническим направлениям и специальностям. 6 изд. – М.: Юрайт, 2012г.-703с.

3.Щипачев В. С. Курс высшей математики. Учебник для вузов. 4 изд. М.: ОНИКС - 2009г.- 600с.

4. Р.А. Александрова. Математика. Учебное пособие. Изд-во РГУ им. И. Канта, 2007 г. (РГУ).

5. Данко П. Е.Высшая математика в упражнениях и задачах с решениями : в 2 ч. : учеб. пособие для вузов / П.Е. Данко, А.Г. Попов, Т.Я. Кожевникова. - М. : ОНИКС 21 век : Мир и образование, 2009 - Ч. 1. - 6-е изд. - 304 с. - ISBN5-94666-008-Х. - ISBN5-329-00326-1. (имеется в РГУ)

6. Данко П. Е.Высшая математика в упражнениях и задачах c решениями : в 2ч. : учеб. пособие для вузов / П.Е. Данко, А.Г. Попов, Т.Я. Кожевникова. - М. : ОНИКС 21 век : Мир и образование, 2009 - Ч. 2. - , 6-е изд. - 416 с. - ISBN5-94666-009-8. - ISBN5-329-00327-Х. (имеется в РГУ)

7. М.В.Кретов, Н.В. Виноградова. Сборник задач по высшей математике для студентов специальности «Телекоммуникация». Калининград, 2008г. (БФУ)

8.Математика:Учебно – методическое пособие /Авт.-сост. Р.А.Александрова. - Калининград: Изд-во КГУ,2002г.-68с. (имеется в БФУ).

9. Гмурман Е.В. руководство к решению задач по теории вероятностей и математической статистике. М. 1998.

1. Шипачев Е. С. Высшая математика: базовый курс 8 изд. Учебное пособие для вузов. – М.: Изд. Юрайт, 2011г.

2. Смирнов В. Курс высшей математики. Том I. 24 изд. –Спб.: БХВ-Петербург, 2010г. – 624с. Электронное издание- Гриф НМС по математике.- ISBN 978-5-94157-909-9/

3. Смирнов В. Курс высшей математики. Том II. 24 изд. – Спб.: БХВ-Петербург, 2010г. –848с. Электронное издание- Гриф НМС по математике.- ISBN 978-5-94157-909-9/

4. Гмурман Е.В. Теория вероятностей и математическая статистика 12 изд. Учебное пособие для вузов. –М.: Изд – во Юрайт, 2010г. – 479с.

-ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА-

1.Математика, ч.1, Справочник/ сост. Р.А.Александрова: Изд-во РГУ им. И.Канта, 2010г.-41 с. (имеется в БФУ).

2. Баврин, И. И. Высшая математика: учебник для студ. пед. вузов, обуч. по естественнонауч. спец. / И. И. Баврин. - М. : Высш. шк. : Academia, 2000. - 611 с. : ил. - (Высшее образование). - Библиогр.: с. 609 (16 назв.). - ISBN5-06-003930-7. - ISBN5-7695-0612-1 (БФУ).

3. Математика: Учебно-методическое пособие для студентов заочного отделения специальностей «Психология», «Педагогика и психология». / Авт.-сост. Р.А.Александрова. - Калининград: Изд-во КГУ, 2001г.-61с. (БФУ)