Марковские случайные процессы с дискретными состояниями и непрерывным временем. Уравнения Колмогорова для вероятностей состояний.

Неоднородная марковская цепь

 

В общем случае вероятности переходов могут меняться от шага к шагу. Марковская цепь, обладающая таким свойством, называется неоднородной.

Обозначим через вероятность перехода системы из состояния в состояние на k-м шаге. Каждому шагу соответствует своя матрица переходных вероятностей :

.

 

Вероятность того, что система после k-го шага окажется в состоянии выражается формулой

 

или в матричной форме

 

Пример. Производится три выстрела по цели, которая может быть в тех же четырех состояниях, что и в предыдущем примере, но вероятности переходов для трех последовательных выстрелов различны и заданы тремя матрицами:

 

 

 

 

 

 

 

В начальный момент цель находится в состоянии S1. Необходимо определить вероятности состояний цели после 3 выстрелов.

 

Решение:

 

 

 

 

 

 

Сумма элементов вектора вероятностей состояний на любом шаге равна единице.

 

Таким образом, вероятности состояний цели после 3 выстрелов:

· цель невредима: ;

· цель незначительно повреждена: ;

· цель получила существенные повреждения: ;

· цель полностью повреждена и не может функционировать: .


 

 

Выше рассматривалась марковская цепь, т.е. случайный процесс, протекающий в системе, которая может переходить из состояния в состояние только в некоторые, заранее определенные, фиксированные моменты времени.

 

На практике значительно чаще встречаются ситуации, когда переходы системы из состояния в состояние происходят не в фиксированные, а в случайные моменты времени, которые заранее указать невозможно – переход может осуществиться в любой момент. (Например, выход из строя любого элемента аппаратуры может произойти в любой момент времени.)

 

Для описания таких процессов может быть применен аппарат марковских случайных процессов с дискретными состояниями и непрерывным временем, называемых также непрерывными марковскими цепями.

 

Рассмотрим, как выражаются вероятности состояний для такого процесса. Пусть имеется ряд дискретных состояний:

S1, S2, …, Sn,

причем переход системы S из состояния в состояние может осуществляться в любой момент времени. Обозначим через вероятность того, что в момент t система S будет находиться в состоянии Si (i = 1, …, n). Очевидно, что в любой момент времени t сумма вероятностей состояний равна единице:

 

так как события, состоящие в том, что в момент t система находится в состояниx S1, S2, …, Sn, несовместны и образуют полную группу событий.

 

Основная задача при исследовании непрерывных марковских цепей: определить вероятности состояний для любого момента времени t.

 

В случае марковских процессов с дискретным временем для расчета вероятностей состояний необходимо знать переходные вероятности , определяющие вероятности перехода системы из состояния в состояние в точно заданный момент времени. Но для непрерывной марковской цепи вероятность перехода в точно заданный момент времени будет равна нулю (точно так же, как вероятность любого конкретного значения непрерывной случайной величины). Поэтому вместо переходных вероятностей для непрерывных марковских цепей используются плотности вероятностей перехода .

 

Пусть система S в момент времени t находится в состоянии Si. Рассмотрим малый промежуток времени Δt, примыкающий к моменту t:

t
t
t+Dt
Dt

Рис. 9.

Назовем плотностью вероятности перехода предел отношения вероятности перехода системы за время Δt из состояния Si в состояние Sj к длине промежутка Δt:

 

где – вероятность того, что система, находившаяся в момент t в состоянии Si, за время Δt перейдет из него в состояние Sj.

 

При малом Δt вероятность перехода равна (с точностью до бесконечно малых высших порядков):

 

 

Если все плотности вероятностей перехода не зависят от t, марковский процесс называется однородным. Если ходя бы одна из плотностей вероятностей зависит от времени ( ), процесс называется неоднородным.

 

Так же, как и для марковских процессов с дискретным временем, для процесса с непрерывным временем строится размеченный граф состояний, в котором каждой дуге приписана плотность вероятности перехода.

 

В качестве примера рассмотрим систему S с четырьмя возможными состояниями: S1, S2, S3, S4 и размеченным графом состояний, приведенном на рис. 10.

 

S1
S2
S3
S4
l12
l23
l31
l24
l42
l34

 

Рис. 10.

 

Найдем вероятность того, что в момент времени t система будет находиться в состоянии S1.

 

Придадим t малое приращение Δt и найдем вероятность события: "система в момент времени t + Δt будет находиться в состоянии S1". Согласно размеченному графу на рис. 10, это событие может произойти двумя способами:

 

1) в момент t система уже была в состоянии S1 и за время Δt не вышла из этого состояния;

или

2) в момент t система была в состоянии S3 и за время Δt перешла из него в состояние S1.

 

Вероятность первого варианта равна вероятности того, что в момент t система была в состоянии S1 (т.е. ), умноженной на условную вероятность того, что, будучи в состоянии S1, система за время Δt не перейдет в состояние S2. Эта условная вероятность (с точностью до бесконечно малых высших порядков) равна .

 

Вероятность второго варианта равна вероятности того, что в момент t система была в состоянии S3 (т.е. ), умноженной на условную вероятность перехода за время Δt в состояние S1, равную

 

Так как эти варианты взаимоисключающие, то, по правилу сложения вероятностей, получим:

 

 

Отсюда получаем:

 

 

Устремим Δt к нулю и перейдем к пределу:

 

 

 

Левая часть равенства есть производная функции по времени:

 

 

 

Таким образом, мы получили дифференциальное уравнение, которому должна удовлетворять функция .

 

Рассмотрим второе состояние. Событие "система в момент времени t + Δt будет находиться в состоянии S2" может произойти тремя способами:

 

1) в момент t система уже была в состоянии S2 и за время Δt не вышла из этого состояния;

или

2) в момент t система была в состоянии S1 и за время Δt перешла из него в состояние S2;

или

3) в момент t система была в состоянии S4 и за время Δt перешла из него в состояние S2.

 

Вероятность первого варианта равна вероятности того, что в момент t система была в состоянии S2 (т.е. ), умноженной на условную вероятность того, что система за время Δt не перейдет из него ни в S3, ни в S4. Так как события, состоящие в переходе за время Δt из S2 в S3 и из S2 в S4 несовместны, то вероятность того, что осуществится один из этих переходов, равна сумме их вероятностей, т.е. (с точностью до бесконечно малых высших порядков). А вероятность того, что не совершится ни один из этих переходов, равна . Отсюда вероятность первого варианта:

 

 

 

Прибавляя вероятности второго и третьего вариантов, получим:

 

 

 

Перенося в левую часть, деля на Δt и переходя к пределу, получим дифференциальное уравнение для :

 

 

Рассуждая аналогичным образом для состояний S3, S4, получим в результате систему дифференциальных уравнений (для краткости отбросим аргумент t у функций pi):

 

 

 

Эти уравнения для вероятностей состояний называются уравнениями Колмогорова.

 

[Колмогоров Андрей Николаевич (1903 - 1987) – выдающийся советский математик, один из основоположников современной теории вероятностей, им получены фундаментальные результаты в топологии, математической логике, теории сложности алгоритмов и ряде других областей математики и её приложений.]

 

Решение полученной системы уравнений даст нам вероятности состояний как функции времени. В общем случае решение выполняется посредством численного интегрирования, но для однородных марковских процессов уравнения Колмогорова представляют собой систему обыкновенных дифференциальных уравнений с постоянными коэффициентами и могут быть решены аналитически.

 

При решении необходимо задать начальные условия в зависимости от того, каково было начальное состояние системы. Например, если в начальный момент времени (при t = 0) система находилась в состоянии S1, то надо принять следующие начальные условия:

 

 

 

Заметим, что сумма правых частей всех уравнений системы всегда равна нулю. Это следует из того, что сумма вероятностей состояний в любой момент времени равна единице:

 

 

 

Дифференцируя это равенство, получим: