Автоматизированные системы для консультативной помощи в принятии решений

Среди систем для помощи в принятии решений на основании используемых методов выделяют:

• автоматизированные системы для распознавания патологических состояний методами вычислительной диагностики;

• автоматизированные консультативные системы для помощи в принятии решений на основе интеллектуального (экспертного) подхода;

• автоматизированные гибридные (экспертно-статистические, экспертно-моделирующие) системы для консультативной помощи в принятии решений.

Рассмотрим эти системы подробнее.

 

Автоматизированные системы для распознавания патологических состояний методами вычислительной диагностики

 

С начала 1960-х гг. при решении задач дифференциальной диагностики использовались методы математической статистики и распознавания образов (под образами понимаются классифицируемые классы - заболеваний, состояний). В России первыми применили вычислительную диагностику Н. М. Амосов и М. JI. Быховский.

Вычислительная диагностика используется для решения задач:

• клинической дифференциальной диагностики;

• выявления лиц с повышенным риском заболевания при массовых профилактических или профессиональных осмотрах;

• прогнозирования течения заболевания, эффективности лечения, оценки тяжести состояния, исхода заболевания.

Примерный план действий при разработке алгоритма (решающего правила) для дифференциальной диагностики заболеваний (состояний, синдромов) в большинстве случаев состоит из четырех этапов.

1. Постановка задачи. Формулируется перечень заболеваний (синдромов, состояний), которые необходимо распознавать с помощью разрабатываемого правила. При этом необходимо учитывать, что все объекты (пациенты) должны описываться определенным набором параметров, с помощью которых предположительно можно будет распознать эти объекты. Формируется их перечень. Создается формализованная карта параметров с их градациями. Продумывается система (шкала) кодирования градаций параметров.

2. Формирование обучающей выборки. Чтобы приступить к решению задачи дифференциальной диагностики, нужно иметь некоторое множество реальных историй болезни с известными верифицированными диагнозами, которые и будет распознавать построенное в будущем решающее правило. Такое множество необходимо для анализа материала с целью определения статистически «типичной» картины для каждого рассматриваемого заболевания (состояния, синдрома) - образа заболевания.

Однако важно понимать, что в обучающую выборку должны войти все пациенты за определенный (обычно несколько лет) период работы клиники или случайно отобранные больные, соответствующие сформулированным критериям отбора. Неслучайный отбор пациентов может привести к разработке узконаправленного правила.

Необходимо отметить, что сформировать обучающую выборку можно как на ретроспективном материале (по историям болезни), так и в проспективном исследовании. Чрезвычайно важны полнота собираемого клинического материала и его объем при минимальном числе пропущенных значений используемых параметров.

Формализованные карты всех пациентов, входящих в обучающую выборку, заносятся в массив (например, в таблицу MSExcel), который впоследствии и будет обрабатываться для получения диагностического алгоритма.

3. Исследование параметров на информативность и минимизация их количества. Подходов к исследованию параметров на информативность при дифференциальной диагностике и решении задач прогнозирования достаточно много. Это и подсчет частот, и применение методов параметрической и непараметрической статистики для исследования различий средних значений выборок, точного метода Фишера, метода Байеса (например, для оценки диагностической информативности совокупности отобранных параметров) и др.

Важно, что в результате такого исследования в рассмотрении остаются наиболее информативные параметры, число которых существенно сокращается, причем без ущерба для конечной цели - распознавания дифференцируемых состояний. Наоборот, повышение качества распознавания происходит при отборе наиболее информативных параметров, так как при этом отсеиваются параметры, создающие так называемый «шум», т. е. не имеющие дифференциально-диагностической ценности.

Для минимизации количества параметров можно (и часто нужно) использовать математические методы, например корреляционный анализ. Если имеет место сильная корреляция, то один из пары параметров следует убрать из набора. В этом случае необходимо рассматривать как клинические аргументы, так и аргументы с позиции здравого смысла (например, какой из параметров труднее и дороже измерять, тот из пары и следует исключить).

4. Получение решающего правила и его оценка. Для получения диагностического алгоритма часто используют принципы кластеризации, методы множественного статистического анализа: дискриминантный, регрессионный, нейросетевой и др. В настоящее время для этого в большинстве случаев используют известные статистические пакеты: SPSS, Statistica и др.

Два принципиально различных подхода к распознаванию - вероятностный (стохастический) и детерминистский - выдают решение в различной форме. При вероятностном подходе ответ сопровождается оценкой (обычно в процентах), указывающей на возможность того или иного диагноза (прогноза). При детерминистском однозначно указывается один из возможных вариантов ответа.

Критериев качества распознавания несколько. Одним из них является процент правильных отнесений (или наоборот - число ошибок распознавания) на обучающей выборке. Принято оценивать чувствительность диагностического алгоритма и его специфичность.

Чувствительность - доля пациентов с диагностированным заболеванием среди всех пациентов с данным заболеванием в обучающей выборке, т. е. отношение числа истинно положительных результатов к числу случаев с наличием заболевания.

Специфичность - это доля пациентов с недиагностированным заболеванием среди пациентов без данного заболевания в обучающей выборке, т. е. отношение числа истинно отрицательных результатов к общему числу случаев с отсутствием заболевания.

Одним из способов оценки качества полученного диагностического алгоритма является проведение скользящего экзамена. Суть его заключается в том, что данные каждого пациента по очереди исключаются из обучающей выборки, процедура классификации повторяется без него, а затем данные исключенного пациента подставляются в полученное правило и оценивается правильность диагностики.

Достаточно распространенным подходом к оценке полученного диагностического алгоритма остается его проверка на контрольной (экзаменационной) выборке ретроспективных данных и в опытной эксплуатации в проспективном исследовании. Этапы распознавания можно представить следующим образом:

1) предварительный анализ данных и минимизация пространства параметров;

2) классификация на обучающий выборке;

3) контроль результатов классификации на экзаменационной выборке.

Весь описанный процесс разработки диагностических алгоритмов кроме первого этапа, на котором активно участвует врач как эксперт, и оценки эффективности полученного решающего правила обычно осуществляется с минимальным участием врача. Он является пользователем системы. Современные системы не только строят диагностическое заключение (нозологический диагноз, синдромальный диагноз и др.), но и представляют его в виде, облегчающем интерпретацию.

Автоматизированные системы вычислительной диагностики могут быть полезны для начинающих врачей, клинических ординаторов, фельдшеров. В особенности это касается необходимости принятия решений в отношении редких заболеваний. Высокоэффективным является применение таких систем при неотложных состояниях (в условиях дефицита времени на принятие решений при небольшом объеме имеющейся о пациенте информации), особенно в дистанционном режиме.

С конца 1970-х до середины 1980-х гг. в Российской Федерации осуществлялась масштабная программа по разработке и внедрению системы дистанционной консультативной диагностики (руководитель программы - С. А. Гаспарян). В ее реализации участвовали восемь медицинских вузов и клинических НИИ, три территориальных медицинских вычислительных центра.

Целью разработки было создание системы вычислительной диагностики, позволяющей осуществлять дифференциальную диагностику заболеваний в дистанционном режиме при неотложных состояниях: нарушениях мозгового кровообращения, травмах черепа, ишемической болезни сердца, инфаркте миокарда, острых заболеваниях органов брюшной полости, таза, забрюшинного пространства, в том числе в педиатрической практике.

В середине 1980-х гг. система была внедрена в 48 административных территориях РФ на базе круглосуточно работающих консультативных диагностических центров при отделениях санитарной авиации. Дистанционная диагностика осуществлялась путем телефонного или радиообщения между врачом, обратившимся за консультацией, и дежурным оператором центра (средним медицинским работником). Врач диктовал номера признаков формализованной карты осмотра больного дежурному оператору центра, который вводил эти данные в компьютер и передавал врачу результаты диагностического заключения. Пользователю передавался также перечень признаков, которые могли бы повысить ка­чество диагностики при повторной обработке данных, и выдавалась рекомендация о времени повторного обращения в центр.

В системе детского здравоохранения была создана ассоциация «Неотложная педиатрия» (руководитель - Э.К.Цыбулькин), объединившая ЛПУ более 10 регионов - пользователей системы дистанционного вычислительного консультирования.

Средний уровень правильной диагностики, осуществляемой врачами районных и сельских больниц, в то время составлял 62 %. Анализ 40 тыс. консультаций, осуществленных консультативными диагностическими центрами, показал, что использование системы вычислительной диагностики позволило поднять уровень правильно диагностированных случаев до 87 %, а при повторной обработке данных на расширенном наборе признаков - до 95 %.

Подобные разработки могут иметь хорошие перспективы для использования при дистанционной диагностике с помощью современных телемедицинских технологий.

Системы для распознавания патологических состояний методами вычислительной диагностики могут использоваться как отдельно, так и в составе автоматизированных рабочих мест врачей разных профилей.

Существенным недостатком большинства диагностических алгоритмов, построенных с помощью методов распознавания образов, была и остается непрозрачность их логики для медицинского персонала. Врачи, работающие с такими системами, пытаются интерпретировать хотя бы набор признаков, вошедших в диагностический алгоритм, но не могут понять логику решений автоматизированной системы.

 

Автоматизированные консультативные системы для помощи в принятии решений на основе интеллектуального(экспертного) подхода

 

Искусственный интеллект - это область компьютерной науки, занимающаяся, по определению Дж. Ф.Люгера (ЛюгерДж.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем: пер. с англ./Дж.Ф. Люгер.-М.: Изд. дом «Вильямс», 2003), «автоматизацией разумного поведения» на основе использования знаний, получаемых от экспертов или из литературных источников.

Диагностическое заключение врача представляет собой результат логических умозаключений, базирующихся на научных знаниях, субъективном опыте, полученном в процессе работы, и здравом смысле. Принципы математической статистики не всегда эффективны при анализе клинических данных, в особенности при редких заболеваниях, когда имеются малые выборки. Поэтому наряду с обработкой данных широкое применение нашла и «обработка» знаний.

Под знаниями подразумеваются закономерности предметной области (принципы, связи, законы), полученные в результате теоретических исследований, практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области. Если знания отражены в литературе, системы, построенные на основе их использования, называют интеллектуальными. Если же знания были получены в процессе собеседований с высококвалифицированными специалистами (экспертами в конкретной области медицины), системы называют экспертными.

Для того чтобы знания можно было использовать при построении систем, их формализуют. Под формализацией понимается однозначное (иногда многозначное) описание клинических проявлений заболеваний (включающее дифференциально значимые признаки и их сочетания для отдельных или групп заболеваний), профессиональных навыков, технологий, методов принятия решений, на основе которого возможно последующее моделирование деятельности врача и использование знаний в автоматизированных системах, в данном случае экспертных.

Знания предметной области по источникам можно разделить на фактические и эвристические. Фактические знания - хорошо известные в данной предметной области факты, описанные в специальной литературе. Эвристические знания основаны на собственном опыте специалиста-эксперта, пользоваться ими нужно осмотрительно, но именно они определяют эффективность ЭС.

Экспертная система - это программа для компьютера, оперирующая с формализованными знаниями врачей-специалистов и имитирующая логику человеческого мышления, основанную на знаниях и опыте экспертов с целью выработки рекомендаций или решения проблем. Одним из важных свойств ЭС является ее способность объяснить понятным для пользователя образом, как и почему принято то или иное решение. Экспертные системы эффективны в специфических областях, таких как медицина, в которых существует много вариантов проявлений заболеваний и поэтому отсутствуют однозначные критерии диагностики и лечения, в связи с чем важен эмпирический опыт специалистов и качество принятия решения зависит от уровня экспертизы. По областям применения можно выделить ЭС для диагностики, интерпретации данных, лечения, прогнозирования и мониторинга за состоянием больных. По данным исследования, проведенного в США в середине 1990-х гг., медицина является одним из основных потребителей ЭС - около 23 % всех имеющихся.

Пользователем ЭС обычно является специалист в той же предметной области, для которой разработана система, но его квалификация недостаточно высока по конкретному профилю патологии, в связи с чем он нуждается в поддержке принятия решений. Пользователями медицинских ЭС могут быть также врачи смежных специальностей, общей практики, ординаторы, интерны.

Как разработчики, так и пользователи предъявляют к медицинским ЭС ряд требований.

1. Система должна обеспечивать высокий уровень решения задач в своей предметной области.

2. «Поведение» ЭС (задаваемые врачу вопросы, рекомендации, логика работы и принятия решений) должно моделировать поведение грамотного врача.

3. Система должна объяснять получаемые решения, используя конструкции, понятные врачу.

4. Созданные ЭС должны обеспечивать возможность модификации при обновлении медицинских знаний по данной предметной области.

Близки к процессу дифференциальной диагностики заболеваний предложенные В. К. Финном интеллектуальные системы на основе ДСМ-рассуждений (ДСМ - по инициалам Джона Стюарта Милля), использующие понятия аргументов и контраргументов, т.е. утверждений «за» или «против» диагноза при наличии определенных признаков (показателей).

В ЭС реализуются четыре базовых функции:

1) приобретение (извлечение) знаний;

2) представление знаний;

3) управление процессом поиска решения;

4) разъяснение принятого решения.

Приобретение знаний - это восприятие опыта решения проблемы от источника знаний (эксперт, литература) и преобразование его в вид, который позволяет использовать эти знания в экспертной или интеллектуальной системе. Для извлечения знаний необходимы усилия не только эксперта, знающего предметную область, но и когнитолога или инженера по знаниям (knowledge engineer) либо аналитика, владеющего методами извлечения, структуризации и организации знаний предметной области. Извлечение знаний может происходить в процессе собеседований между инженером по знаниям и экспертом в конкретной проблемной области или в результате взаимодействия эксперта со специальной программой, замещающей в этом случае когнитолога.

Представление знаний - описание приобретенных знаний с помощью машинного языка (языка представления знаний), включая проверку на корректность и полноту. Существует несколько языков представления знаний. Самыми распространенными из них в настоящее время являются продукционные модели, фреймы, семантические сети.

Продукционная модель, или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если (условие), то (действие)». При выполнении условия реализуется действие.

К достоинствам продукционных моделей можно отнести простоту и наглядность представления знаний, их модульность, что обеспечивает легкую модификацию имеющихся и добавлёние новых правил. Однако у этого подхода имеются и недостатки. Главным из них является ограниченность его использования для представления знаний, которые выходят за рамки утверждений типа «Если..., то...».

Фрейм (от англ. Frame - рамка) - структура данных для представления стереотипных знаний. Он представляет собой логическую запись, включающую поля (подструктуры) для хранения информации. Эти поля называют слотами (от англ. slot- щель). Некоторые слоты могут хранить неизменную информацию. Слоты могут также содержать перечень возможных значений, присоединенные процедуры (позволяющие производить операции для получения значения этого слота) или другие фреймы. В каждом слоте задается условие, которое должно выполняться при установлении соответствия между значениями. Соединив множество фреймов, являющихся отношениями, можно построить фреймовую систему.

Использование фреймов для представления знаний позволяет получить описание проблемной области в виде связанных, иерархически упорядоченных, крупных информационных структур.

Семантические сети состоят из узлов, представляющих концепты (понятия), и связей - отношений между ними. Все узлы сети определяются через другие узлы.

Отношения между концептами могут быть двух типов. Первый тип отношений может быть сформулирован как отношения «от общего к частному», чему могут соответствовать фразы «включает в себя», «состоит из», «содержит». Второй тип - это отношение «от частного к общему», чему соответствуют формулировки «является частью», «характерно для». Частным случаем семантических сетей являются семантические пороговые иерархические сети. Они устроены таким образом, что «переключение» на узлы более высоких по иерархии уровней происходит только после того, как будет преодолен заданный порог.

Особенностью семантической сети, являющейся и ее недостатком, является ее целостность - невозможность разделить базу фактических знаний и механизм поиска решения.

Каждая модель представления знаний имеет свои достоинства и недостатки, поэтому при решении клинических задач в настоящее время обычно используется не одна, а несколько взаимно дополняющих моделей представления знаний: продукционная модель, фреймовая структура.

Управление процессом поиска решения - это осуществление доступа к знаниям, порядок и способ их использования в процессе формирования решения.

Разъяснение принятого решения - важная базовая функция, обеспечивающая высокий уровень доверия к ЭС. Данная функция позволяет врачу понять логику, оценить качество и безопасность решений, предлагаемых системой, и сделать окончательный обоснованный выбор.

Экспертная система имеет структуру, состоящую из набора определенных блоков.

База знаний (БЗ) является ядром экспертной или интеллектуальной системы. Это совокупность знаний предметной области, записанная на машинный носитель в форме, понятной пользователю и эксперту.

Создание БЗ является основной задачей когнитолога и главным этапом разработки ЭС. В функции когнитолога входит не только опрос экспертов, но и последующее сопоставление и обобщение полученной информации, а также ее представление в виде формализованных знаний (совокупности фактов и правил) в форме, пригодной для непосредственного занесения в БЗ. Когнитолог является основным разработчиком базы знаний ЭС. От полноты признакового пространства, включая связи симптомов разра­ботанной БЗ, и точности сформулированных алгоритмов вывода зависит качество выносимых ЭС решений.

Разработка БЗ экспертной системы для диагностики и консультативной помощи в принятии решений включает в себя несколько этапов.

1. Формирование эталонного описания основных диагностических заключений. Эталонное описание диагноза - это наиболее полная совокупность характерных признаков анамнеза, текущих клинических симптомов, результатов лабораторных и специальных исследований, присущих конкретному диагнозу. При использовании в описании весовых коэффициентов признаки могут иметь разные значения, характеризующие их вклад для выдвижения конкретной диагностической гипотезы.

2. Формирование признакового пространства, обеспечивающего решение выбранной проблемы. Признаковое пространство формируется как объединение подмножеств признаков, вошедших в эталонное описание всех диагностических заключений, сформированных на первом этапе создания БЗ.

3. Формирование алгоритмов (решающих правил), позволяющих получать диагностические заключения. Алгоритмы могут быть:

1) эмпирическими, т.е. сообщенными экспертом;

2) обнаруженными в больших БД историй болезни - шаблоны, отражающие многоаспектные взаимоотношения в данных; процесс обнаружения в «сырых» данных ранее неизвестных, практически полезных и доступных для интерпретации знаний носит название DataMining, т. е. «раскопка» или «добыча» данных (синонимами этого понятия являются Knowledgediscoveryindatabases-обнаружение знаний в БД и интеллектуальный анализ данных);

3) полученными в результате специальной статистической обработки первично извлеченными у эксперта знаниями.

Блок логического вывода - это программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в БЗ.

Подсистема объяснений - программа, позволяющая пользователю получить ответ на вопрос, как и почему было принято то или иное решение.

Редактор базы знаний - программа, предоставляющая инженеру по знаниям возможность дополнять разработанную БЗ, что позволяет ЭС не терять свою актуальность с течением времени. Другой вариант пополнения БЗ был предложен в конце 1970-х гг. американскими исследователями, создавшими программу TEIRE-SIAS, обеспечивающую интерактивный диалог с экспертом на ограниченном естественном языке. Но широкого использования этот подход не нашел ввиду большой сложности такой работы для экспертов.

Интерфейс пользователя - это комплекс программ, реализующих интерактивный диалог с ЭС. Он должен соответствовать задачам системы, обеспечивать высокую скорость работы с программой, минимизировать количество человеческих ошибок в процессе работы с системой, быть удобным, т.е. «дружественным».

В различных областях медицинских знаний накоплен определенный опыт в построении АС по принятию врачебных решений.

Одной из первых медицинских ЭС, в которых в качестве основной модели представления знаний использовалась система продукций, была диагностическая система MYCIN, предназначенная для идентификации возбудителей инфекционных заболеваний. Эта система ставит диагноз, исходя из имеющихся симптомов, и рекомендует курс лечения. Она содержит 450 правил, разработанных при участии группы специалистов по инфекционным заболеваниям Стэнфордского университета. Знания в MYCIN подразделяются на факты и продукции. Система «умеет» объяснять свои заключения, позволяет модифицировать старые правила и вводить новые.

Система Empty MYCIN (EMYCIN) - «пустая» MYCIN - является универсальной системой, не зависящей от конкретной проблемной области. Это одна из первых «оболочек» для разработки медицинских ЭС. На ее основе были созданы:

• PUFF - для диагностики легочных заболеваний с использованием результатов функциональных исследований;

• ONCOCIN - для химиотерапевтического лечения онкологических больных и наблюдения за ними;

• BLUEBOX - для диагностики и лечения депрессий и других состояний.

Наиболее крупная по числу диагностируемых терапевтических заболеваний ЭС INTERNIST/CADUCEUS содержит в БЗ сведения о 500 нозологических единицах и 6000 признаках.

Среди отечественных разработок можно выделить:

• «МОДИС» - для диагностики различных форм артериальной гипертензии;

• «КОНСУЛЬТАНТ-2» - для диагностики острых заболеваний брюшной полости с учетом уровня подготовки медицинского персонала (врач, фельдшер);

• «ДИНАР» - диспетчерско-консультативная система по неотложным состояниям в детском возрасте;

• «ЭСТЕР» - для диагностики лекарственных отравлений - анализирует 19 групп распространенных препаратов, имитирует рассуждения врача-эксперта в токсикологии.

Среди отечественных ЭС хотелось бы выделить многолетний и разносторонний опыт разработок для педиатрии под руководством Б. А. Кобринского. Существуют также ЭС для дифференциальной диагностики неотложных состояний («ДИН», 1989), 1200 наследственных болезней («ДИАГЕН», 1991), судорожных синдромов («ИНФАНТИЛЬНЫИ СПАЗМ», 1997). И это далеко не полный перечень применяющихся систем.

 

Автоматизированные гибридные системы для консультативной помощи в принятии решений

 

Опыт в разработке АС для распознавания патологических состояний методами вычислительной диагностики и с использованием искусственного интеллекта позволил специалистам в области медицинской информатики сделать следующий шаг - перейти к гибридным системам, которые сочетают в себе разные подходы.

Для решения одной и той же задачи в принципе можно использовать как алгоритм диагностики на основе математической статистики, математических моделей, так и системы знаний. Эти составляющие могут быть включены как подсистемы в единую автоматизированную консультативную систему.

Рассмотрим два подхода к построению гибридных систем.

Первый подход подразумевает создание ЭС для мониторно-компьютерного контроля, построенных на совокупности математических и логико-лингвистических моделей в НЦССХ им. А. Н. Бакулева. Этот подход реализован в виде систем «Гарвей», «Айболит», «Миррор». Алгоритм, обеспечивающий врача информацией для обоснованного принятия решений, опирается на фундаментальные знания в области кровообращения и работы сердца. Предложенная технология обеспечивает персонализацию суммы знаний о пациенте на основе контроля результатов текущих решений системы.

Второй подход может иллюстрировать гибридная система для консультативной диагностики типов инсульта (ишемического и геморрагического), включающая патогенетические подтипы ишемического инсульта на основе сочетания трех методов: статистического, логико-статистического и нейросетевого, разработанная в Научно-исследовательском центре неврологии РАМН. Как результат их объединения появилось понятие «статистические ЭС». В частности, в решающих правилах ЭС начали применять математические методы для «вычисления» на разных этапах построения интеллектуальных систем.