Онтологии представления

Классификация по цели создания

Классификации онтологий

ОНТОЛОГИИ.

ОБЛАСТЕЙ, ПРИКЛАДНЫХ ОНТОЛОГИИ. ЛЕКСИЧЕСКИЕ

ТИПЫ ОНТОЛОГИЙ: ВЕРХНЕГО УРОВНЯ, ПРЕДМЕТНЫХ

В проектировании онтологий условно можно выделить два направления,

до некоторого времени развивавшихся отдельно. Первое связано с

представлением онтологии как формальной системы, основанной на

математически точных аксиомах. Второе направление развивалось в рамках

компьютерной лингвистики и когнитивной науки. Там онтология

понималась, как система абстрактных понятий, существующих только в

сознании человека, которая может быть выражена на естественном языке

(или какой-то другой системой символов). При этом обычно не делается

предположений о точности или непротиворечивости такой системы.

Таким образом, существует два альтернативных подхода к созданию и

исследованию онтологий. Первый (формальный) основан на логике

(предикатов первого порядка, дескриптивной, модальной и т.п.). Второй

(лингвистический) основан на изучении естественного языка (в частности,

семантики) и построении онтологий на больших текстовых массивах, так

называемых корпусах.

В настоящее время данные подходы тесно взаимодействуют. Идет поиск

связей, позволяющих комбинировать соответствующие методы. Поэтому

иногда бывает сложно отделить лексические онтологии с элементами

формальных аксиоматик от логических систем с включениями

лингвистических знаний.

 

Независимо от различных подходов можно выделить 3 основных

принципа классификации онтологий:

• По степени формальности

• По наполнению, содержимому

• По цели создания

Рассмотрим соответствующие классификации по порядку.

 

Классификация по степени формальности. «Спектр онтологий»

Обычно люди и компьютерные агенты (программы) имеют некоторое

представление значений терминов. Программные агенты иногда

предоставляют спецификацию входных и выходных данных, которые могут

быть использованы как спецификация программы. Сходным образом

онтологии могут быть использованы, чтобы предоставить конкретную

спецификацию имен терминов и значений терминов. В рамках такого

понимания (где онтология является спецификацией концептуальной модели –

концептуализации) существует простор для вариаций. Онтологии могут быть

представлены как спектр в зависимости от деталей реализации.

Рис. 1. Спектр онтологий

 

На рисунке 1 изображен, так называемый, спектр онтологий по степени формальности представления, использованию тех или иных формальных элементов. Каждая точка соответствует наличию некоторых ключевых структур в онтологии, отличающих ее от других точек на спектре. Косая черта условно отделяет онтологии от других ресурсов, имеющих

онтологический характер.

Первой точке на спектре соответствует контролируемый словарь, т.е.

конечный список терминов (простейшим примером является каталог на

основе идентификаторов). Каталоги представляют точную (не многозначную)

интерпретацию терминов. Например, каждый раз ссылаясь на термин

«машина» мы будем использовать одно и то же значение (соответствующее

некоторому ID в словаре), вне зависимости от того, о чем идет речь в

контексте: о «стиральной машине», «автомобиле» или «государственной

машине».

Другой спецификацией онтологии может быть глоссарий,

представляющий список терминов с их значениями. Значения описываются в

виде комментариев на естественном языке. Это дает больше информации,

поскольку люди могут прочесть такой комментарий и понять смысл термина.

Интерпретации терминов могут быть многозначными. Глоссарии непригодны

для автоматической обработки программными агентами, но можно, как и

ранее, присвоить терминам ID.

Тезаурусы несут дополнительную семантику, определяя связи между

терминами. Отношения свойственные для тезаурусов: синонимия,

иерархическое отношение и ассоциация. Обычно тезаурусы в явном виде не

имеют иерархии терминов, но она может быть восстановлена.

Ранние иерархии терминов, появившиеся в Сети, определяли общие

понятия обобщения и уточнения. Yahoo, например, ввела небольшое число

категорий верхнего уровня таких как “предметы одежды”. Затем “Платье”

определялось как вид (женской) одежды. Явная иерархия, не соответствовала

в точности формальным свойствам иерархического отношения (isA). В таких

иерархиях может встретиться ситуация, в которой экземпляр класса-потомка

также является экземпляром класса предка. Например, общая категория

«предметы одежды» включает подкатегорию «женские» (которая должна

более точно называться «женские предметы одежды»), а эта категория в свою

очередь включает подкатегории «аксессуары» и «платья». Каждый экземпляр

категории «платья» является экземпляром категории «предмет одежды» (и,

возможно, экземпляром «женского платья» - ведь существуют и «кукольные

платья»). Ясно, что экземпляр категории «духи» (как женские «аксессуары»)

не может быть экземпляром категории «предмет одежды». Здесь не

выполняется важное свойство отношения isA – транзитивность.

Далее следует точка «формальные таксономии». Эти онтологии

включают точное определение отношения isA (класс-подкласс). В таких

системах строго соблюдается транзитивность отношения isA: если В –

является подклассом класса А, то каждый подкласс класса В также является

подклассом класса А. А для отношения класс-экземпляр (isInstanceOf)

выполнятся следующее свойство: если В – является подклассом класса А, то

каждый экземпляр класса В также является экземпляром класса А. Поэтому в

приведенном выше примере с «духами», «духи» не могут быть помещены

ниже в иерархии «предмет одежды» (аксессуары, строго говоря, не являются

предметами одежды) или стать экземпляром этой категории. Строгая

иерархия необходима при использования наследования для процедуры

логического вывода.

Следующая точка - наличие формального отношения класс-экземпляр.

Некоторые классификации включают только имена классов, другие содержат

на нижнем уровне экземпляры (индивиды). Данная точка спектра включает

экземпляры классов.

Далее среди структурных элементов появляются фреймы. Здесь классы

(фреймы) могут иметь информацию о свойствах (слотах). Например, класс

«предмет одежды» может иметь свойства «цена», «сделанИз». Свойства

бывают особенно полезными, когда они определены на верхних уровнях

иерархии и наследуются подклассами. В потребительской иерархии класс

«продукт» может иметь свойство «цена», которое получат все его подклассы.

Большей выразительностью обладают онтологии, включающие

ограничения на область значений свойств. Значения свойств берутся из

некоторого предопределенного множества (целые числа, символы алфавита)

или из подмножества концептов онтологии (множество экземпляров данного

класса, множество классов). Можно ввести дополнительные ограничения на

то, что может заполнять свойство. Например, для свойства «сделанИз»

класса «предмет одежды» значения можно получать как экземпляры класса

«Материал». Легко увидеть, какие проблемы могут возникнуть в этом случае

при использовании нестрогой таксономии. Если «духи» - подкласс класса

«предмет одежды», то он наследует свойство «сделанИз» вместе с

ограничением («Материал»).

В целом с необходимостью выразить больше информации,

выразительные средства онтологии (и ее структура) усложняется. Например,

может потребоваться заполнить значение какого-либо свойства экземпляра,

используя математическое выражение основанное на значениях других

свойств и даже других экземплярах. Многие онтологии позволяют объявлять

два и более классов дизъюнктивными (непересекающимися). Это означает,

что у данных классов не существует общих экземпляров.

Некоторые языки позволяют делать произвольные логические

утверждения о концептах – аксиомы.

Языки описания онтология, подобные CycL и Ontolingua позволяют

описывать утверждения на языке логики предикатов первого порядка (FOL).

 

В рамках этой классификации выделяют 4 уровня (см. рис. 2): Онтологии

представления, онтологии верхнего уровня, онтологии предметных областей

и прикладные онтологии.

 

Рис. 2. Классификация онтологий по цели создания.

 

Рис. 3. Онтология представления языка OWL.

Цель их создания: описать область представления знаний, создать язык

для спецификации других онтологий более низких уровней. Пример:

описание понятий языка OWL средствами RDF/RDFS (рис.3).