Некоторые понятия теории вероятности и математической статистики
В теории вероятностей результаты опытов или наблюдений принято называть событиями. Случайные события характеризуются вероятностью P их осуществления, принимающей значения на промежутке [0,1]. Любое событие можно рассматривать как некоторое подмножество пространства элементарных событий Ω.
Случайной величиной Х называется числовая функция, определенная на пространстве элементарных событий Ω. Основной характеристикой случайной величины является распределение вероятностей. Функция распределения случайной величины Х определяется равенством F(x)=P(X<x), где xÎR (R — множество действительных чисел). Функция распределения обладает следующими свойствами:
- 0£F(x)£ 1 при любом xÎR; ;
- F(x) является неубывающей функцией;
- P(a£X<b)=F(b)-F(a) для любых чисел a<b.
Функция распределения содержит всю вероятностную информацию о случайной величине Х.
Дискретную случайную величину удобно представлять в виде таблицы
(1.1)
Случайная величина Х называется непрерывной, если её функция распределения дифференцируема, т.е. существует производная p(x)=F’(x), называемая плотностью распределения случайной величины Х, или сокращенно плотностью вероятности. В частности, . График функции распределения изображен на рис.3.
Рис.3. Функция нормального распределения.
Плотность распределения обладает следующими свойствами:
- р(х)³0 при любом xÎR;
-
Случайная величина полностью определяется законом распределения вероятностей. Но иногда закон распределения неизвестен, и приходится довольствоваться числовыми характеристиками случайной величины, оценки которых удаётся получить на основании эксперимента. Важнейшие из них — математическое ожидание и дисперсия.
Математическое ожидание (среднее значение) дискретной случайной величины Х, имеющей распределение (1.1), есть по определению сумма ряда при условии его абсолютной сходимости. Для непрерывной случайной величины Х с плотностью распределения р(х) математическое ожидание — это интеграл
, (1.2)
также при условии, что он абсолютно сходится. Математическое ожидание имеет следующие свойства (X,Y — произвольные случайные величины, a, b — константы):
- E(aX+bY)=aE(X)+bE(Y);
- Если X³Y при всех реализациях, то E(X) ³ E(Y);
- Если X — непрерывная случайная величина с плотностью распределения p(x), а g(x), xÎR — числовая функция, то для случайной величины Y=g(X) справедливо равенство ;
- E(a)= a.
Другой важнейшей числовой характеристикой случайной величины Х является дисперсия, отражающая степень «разброса» случайной величины относительно среднего значения.
Дисперсия определяется равенством
(1.3)
Она имеет следующие свойства (X,Y — независимые случайные величины, a, b — константы):
- D(aX+bY)=a2 D(X)+b2 D(Y);
- D(X)=E(X2)–(EX)2;
- D(a)= 0
;
В ряде случаев вместо дисперсии используют величину
(1.4)
называемую стандартным (среднеквадратичным) отклонением случайной величины Х.
Приведём примеры случайных величин, часто используемых в теории вероятностей, математической статистике и их приложениях.
1. Биномиальное распределение. Дискретная случайная величина xn, принимающая значения k=0,1,2,…,n с вероятностями
называется биномиальной случайной величиной с параметрами n и p. Случайная величина с таким распределением возникает в схеме Бернулли. Если случайные величины ei, i=1, …, n, независимы и принимают значение 1 с вероятностью p и 0 с вероятностью 1-p , то
2. Пуассоновское распределение. Дискретная величина P(l), принимающая значения k=0, 1,…, с вероятностями , называется пуассоновской случайной величиной с параметром l. Пуассоновское распределение широко используется в теории массового обслуживания. Число l называют интенсивностью. Е(P(l))=D(P(l))=l.
3. Равномерное распределение. Непрерывная случайная величина Х, плотность распределения которой задается формулой , называется равномерной на отрезке [a,b]. .
4. Показательное (экспоненциальное) распределение. Непрерывная величина Х, плотность распределения которой задается формулой , называется показательной или экспоненциальной с параметром l. Это распределение находит широкое применение в демографических исследованиях и в теории надёжности.
.
5. Нормальное (гауссовское) распределение. Непрерывная случайная величина Х, плотность распределения которой задается формулой
называется нормальной или гауссовской с параметрами Е(Х)= µ и D(X)= s2. Часто используется обозначение XÎN(µ , s2).
Полезно запомнить следующее соотношение, называемое правилом трёх сигм: значения Х случайной величины, распределённой нормально, лежат в пределах (µ-3s; µ+3s) с вероятностью 0,997.
Нормальная случайная величина с µ =0 и s2=1 называется стандартной нормальной величиной.
Кривая нормальной плотности для двух значений дисперсии s2 (s1<s2) показана на рис.4.
Существуют и другие виды распределений. Более подробно о них можно узнать в учебниках [4], [9].
Рис.4. Плотность нормального распределения.