Диагностическая матрица в методе Байеса

Таблица 1

Диагностическая матрица.

Для определения вероятности диаг­нозов по методу Байеса необходимо составить диагностическую матрицу (табл. 1), которая формируется на основе предвари­тельного статистического материала. В этой таблице содержатся вероятности разрядов признаков при различных диагнозах. Если признаки двухразрядные (простые признаки «да—нет»), то в таб­лице достаточно указать вероятность появления признака P(kj,/Di).

В диагностическую матрицу включены априорные вероят­ности диагнозов. Процесс обучения в методе. Байеса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения вероятности, но и следующие величины: N — общее число объектов, исполь­зованных для составления диагностической матрицы; Nt — число объектов с диагнозом D; Nij — число объектов с диагнозом D, обследованных по признаку Kj.

 

Решающее правило — правило, в соответствии с которым при­нимается решение о диагнозе. В методе Байеса объект с комплек­сом признаков К* относится к диагнозу с наибольшей (апостериорной) вероятностью (Апостерио́рная вероя́тность - условная вероятность случайного события при условии того, что известны данные, полученные после опыта)

(3.19)

Символ Є, применяемый в функциональном анализе, означает принадлежность множеству. Условие (3.19) указывает, что объект, обладающий данной реализацией комплекса признаков К* или, реализация K* принадлежит диагнозу (состоянию) D. Правило (3.19) обычно уточняется введением порогового значе­ния для вероятности диагноза:

P(Di/K*)>Pi, (3.20)

где Pi — заранее выбранный уровень распознавания для диаг­ноза D. При этом вероятность ближайшего конкурирующего диагноза не выше 1 — Pi . Обычно принимается Pi > 0,9. При условии

P(Di/K*)≤Pi, (3.21)

решение о диагнозе не принимается(отказ от распознавания) и требуется поступление дополнительной информации.

Процесс принятия решения в методе Байеса при расчете на ЭВМ происходит достаточно быстро.

Как указывалось, методу Байеса присущи некоторые недо­статки, например погрешности при распознавании редких диаг­нозов. При практических расчетах целесообразно провести диаг­ностику и для случая равновероятностных диагнозов, положив

P(D)i=1/n. (3.22)

Тогда наибольшим значением апостериорной вероятности будет обладать диагноз D, для которого P(D)i максимальна:

Иными словами, устанавливается диагноз D, если данная сово­купность признаков чаще встречается при диагнозе D, чем при других диагнозах. Такое решающее правило соответствует методу максимального правдоподобия. Из предыдущего вытекает, что этот метод является частным случаем метода Байеса при оди­наковых априорных вероятностях диагнозов. В методе макси­мального правдоподобия «частые» и «редкие» диагнозы равно­правны.