Получение знаний

Языки

Данные и знания

Основные задачи теории представления знаний в ИС

Характерный признак интеллектуальных систем – наличие знаний, необходимых для решения задач конкретной предметной области. Что такое знания? Чем они отличаются от данных?

Данные – это информация фактического характера, описывающая объекты, процессы и явления предметной области, а также их свойства.

Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания называют структурированными данными.

Человек, познавая окружающую его действительность, отражая ее в своем сознании и проверяя на практике результат такого отражения, получал знания, оперируя которыми он мог не только познавать действительность, но и изменять ее.

Существует неопределенность смыслового содержания, "разночтения" терминов: "данные", "информация", "знания". Можно определить их следующим образом.

Данные представляют собой информацию, рассматриваемую в чисто синтаксическом аспекте, т.е. безотносительно к ее содержанию и использованию, т.е. семантике и телеологии (обычно на каком-либо носителе или в канале передачи).

Информация – это данные, проинтерпретированные с использованием тезауруса, т.е. осмысленные данные, рассматриваемые в единстве синтаксического и семантического аспектов.

Знания есть система информации, обеспечивающая увеличение вероятности достижения какой-либо цели, т.е. по сути, знания – это "Ноу-хау" или технологии.

Вышесказанное резюмируем в следующей форме:

 

знание = информация + цель

информация = данные + смысл;

знания = данные + смысл + цель.

 

Историческое развитие свойства отражения в про­цессе эволюции природы и общества привело к появле­нию абстрактного и постоянно совершенствующего мышления человека - опосредованного, отвлеченного и обоб­щенного отражения моз­гом внешнего мира и его законов.

Язык является основным средством выражения мышления. Язык культуры - это совокупность культурных объектов, обладающая внутренней структурой (комплексом устойчивых отношений, инвариантных при любых образованиях), явными (формализованными) или неявными правилами образования, осмысления и употребления ее элементов, и служащая для осуществления коммуникативных и трансляционных процессов (производства культурных текстов).

В лингвистике принято разделение языков на естественные (исторически сложившиеся вербальные языки) и искусственные (более четко формализованные).

Рассматривая язык как систему знаков, служащих для хранения, переработки и передачи информации, можно различить следующие типы знаковых систем: естественные, образные, языковые, системы записи, кодовые системы.

Знаковая система базируется на тройственном взаимодействии: реальность - мышление - язык. Знаком является объект или событие, которое способно что-то обозначать, т.е. указывать на некоторый другой объект, и что-то означать, т.е. иметь некоторый смысл. При этом объект, обозначаемый данным знаком, называется денотат. Свойство денотата, выражаемое знаком называется концепт. Когда знак реально вступает во взаимодействие со своим денотатом и концептом, возникает знаковая ситуация. Соотношение, с одной стороны, между знаками и их денотатами, с другой – между знаками и их концептами (смыслами) изучает семантика.

Каждому типу системы соответствует свой базисный знак. Каждый тип знака отражает действительность определенным образом:

естественный знак – указывает;

образ – отражает;

слово – описывает;

буква – фиксирует;

символ – кодирует.

Каждой знаковой системе присущи свои правила, но есть и общие законы построения любых систем:

- каждая система должна выбрать свой базисный знак;

- все знаки занимают определенные позиции во внутрисистемной иерархии;

- каждой позиции соответствуют свои правила, которым подчиняются знаки данной категории.

Наиболее характерной чертой человеческого мышления, отличающей его от интеллекта животных, оперирующих только образами, является способность оперировать понятиями - формами мышления, в которых отража­ются предметы и явления реального мира в их существен­ных необходимых признаках и отношениях.

Понятие представляет собой единицу знания. Сис­тема понятий об окружающем нас мире, сформированная в сознании человека в процессе творческого мышления, трансформируется и передается в виде взаимосвязанной системы терминов. Все понятия естественного языка, служащие для описания окружающего мира, представ­ляют всеобщие знания.

Получение знаний предполагает и необходимость обмена ими (коммуникация). Однако разнообразие выразительных средств языков, а следовательно, и принципов их означения делают вопросы их «переводимости» (возможности выражения смысла средствами различных языков) и «приоритетности» (выбора того или иного языка в конкретной коммуникативной ситуации) весьма сложными.

Процесс обмена знаниями можно рассматривать как информацию (от лат. informatio— разъяснение, изложение). Первоначально этот термин обозначал све­дения, передаваемые одними людьми другим людям уст­ным, письменным или каким-либо другим способом (например, с помощью условных сигналов, с использо­ванием технических средств и т. д.). Попытки алгоритмизации семантических процессов (означения и понимания) оказали значительное влияние на поиски универсального языка записи семантических характеристик.

Современное состояние мира требует организации информационных систем - совокупностей технических и обеспечивающих средств, технологических процессов и кадров, реализующих следующие основные функции:

- сбор информации;

- хранение информации;

- поиск и обработка информации;

- передача информации;

При этом все возрастающую роль в современном обществе играют соответствующие каналы коммуникаций, их технические средства. Следует учитывать, что в искусственно созданные информационные системы знания и информация привнесены их создателями. Машинная технологическая информация имеет формальный, синтаксический характер, семантическая же сущность сообщения и ее системная интерпретация остается за человеком. Семантическая сущность информации, циркулирующей в человеко-машинных системах, проявляется через человека. В машинах, в каких бы совершенных формах они не создавались и какие бы семантические модели не реализовывали, нет плана содержания. В этом состоит принципиальное различие создаваемых человеком искусственных систем от естественных.

В настоящее время понятие информации включает обмен сведениями не только между человеком и человеком, но и между человеком и автоматом, автоматом и автоматом, обмен сигналами в животном и растительном мире.

Знание - есть потенциальная информация, а информация есть актуальное знание. Знание выступает как стратегическая информация, необходимая для формирования цели и построения кинематической траектории, отражающих идеальное, возможное, желаемое развитие системы. Информация выступает как оперативные знания, используемые системой в динамическом процессе, переводящем ее из реального, фактического состояния в идеальное. С семантических позиций такая модель представляет системное единство формы и содержания.

Под информацией непосредственного управления понимаются сведения, циркулирующие по каналам существующей конкретной системы и используемые для решения оперативных задач, стоящих перед системой.

Под информацией развития системы понимаются знания, добытые наукой, содержащие результаты научно-технических достижений, которые могут быть использованы для конкретных стратегических преобразований и в государственной практике. Они имеют название «информационный ресурс». Информация непосредственного управления более или менее жестко привязана к текущим конкретным задачам управления.

Одной из наиболее важных проблем, характерных для систем, основанных на знаниях, является проблема представления знаний. Это объясняется тем, что форма представления знаний оказывает существенное влияние на характеристики и свойства системы.

Приняв за основу тезис о том, что информация является одним из универсальных свойств материи, можно рассматривать информацию как форму отражения, при которой структура некоторой системы А представлена элементами системы В в виде структуры А1, то есть в виде модели системы А. Такое отражение называется моделированием. При этом сущность информации состоит в ее коммуникативной функции, отражающей неразрывное единство источника информации (отражаемого объекта) и приемника (управляющего субъекта), актуализирующего часть знаний, хранящихся в системе. При такой трактовке понятия «информация» неиспользуемая часть знания исключается из информации. В то же время эти знания могут храниться, передаваться, в том числе с применением ЭВМ. В этом случае для исключенной части знания используются понятия «сведения», «данные», «сообщения».

При проектировании модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородное представление приводит к упрощению механизма управления логическим выводом и упрощению управления знаниями. Представление знаний должно быть понятным экспертам и пользователям системы. В противном случае затрудняется приобретение знаний и их оценка. Однако выполнить это требование, как для простых, так и для сложных задач, довольно трудно. Обычно для несложных задач останавливаются на некотором среднем (компромиссном) представлении, но для решения сложных задач необходимо структурирование и модульное представление.

Все разнообразие моделей представления знаний можно разбить на два типа: логические и эвристические.

В основу логических моделей представления знаний положено понятие формальной системы, в которой существующие отношения между единицами знаний выражаются с помощью только синтаксических правил.

Эвристические модели имеют разнообразный набор средств, передающих специфические особенности предметной области.

Эквивалентная интерпретациядостигается введением понятия абстрактных состояний предметной области, определенных формально и служащих однозначной интерпретацией описания состояния, как на естественном, так и на формальном языке.