Стандартный синтаксис описания данных - RDF

Глобальная схема имен - URI

Семантические технологии Web

Организация данных в семантической паутине

Реализация

Для создания понятного компьютеру описания ресурса в семантической паутине используется формат RDF (Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. RDF был утверждён как стандарт W3C в феврале 2004 года. RDF — это система описания сетевых ресурсов, понятная компьютеру. Формат RDF предназначен для хранения метаданных1. В соответствии с концепцией семантической паутины, описания в формате RDF должны прикрепляться к каждому сетевому ресурсу. Документы RDF должны обрабатываться компьютером автоматически, RDF не предназначен для прочтения и использования человеком. К настоящему времени формат RDF уже устоялся и получил широкое распространение, он служит каркасом для создания семантической паутины

С точки зрения организации данных Семантическая Сеть представляет собой структурированные хранилища информации и набор правил вывода, позволяющий компьютерам производить рассуждения в автоматическом режиме. Следует обратить внимание, что как данные, так и набор правил вывода, и даже сервисы, позволяющие выводить из каких-либо посылок нужную информацию, не концентрируются в одном месте. Всё это множество знаний (а по сути, совокупность данных, правил вывода и обработчиков образуют не что иное, как базу знаний) децентрализовано и распределено в Сети, как сейчас распределён в ней гипертекст.

Метаданные1 — данные о данных

К семантическим технологиям Web относятся следующие:

· глобальная схема имен (URI);

· стандартный синтаксис описания данных (RDF);

· стандартные способы описания свойств данных (схема RDF);

· стандартные способы описания связей между объектами данных (онтология, определяемая с помощью онтологического языка Web (Web Ontology Language)).

 

URI - это просто идентификатор Web, т.е. адреса, начинающиеся с http или ftp. Любой пользователь может создать URI, но права собственности на них четко организованы, поэтому они представляют идеальную базовую технологию для построения глобальной сети. Фактически, интернет является именно такой структурой: все, что имеет URI, считается находящимся в глобальной сети. Любой объект, схема или модель данных семантической сети должны иметь собственный уникальный адрес (URI).

Универсальный указатель ресурсов (Uniform Resource Locator, сокр. URL) - это URI, который, помимо идентификации ресурса, указывает на способ действия или представления ресурса путем описания основного механизма доступа к нему или его положения в сети. Например, URL http://www.webifysolutions.com - это URI, который идентифицирует ресурс (домашняя страница компании Webify Solutions) и указывает, что его представление (т.е. текущий код HTML домашней страницы как набор закодированных символов) можно получить по протоколу HTTP с сетевого узла www.webifysolutions.com.

Универсальное имя ресурса (Uniform Resource Name, сокр. URN) - это URI, который идентифицирует ресурс с помощью имени в определенном пространстве имен. Оно позволяет говорить о ресурсе без использования его местоположения или снятия ссылок на него. Например, URN urn:ISBN:1-0-7666-98-0 - это URI, который, аналогично номеру ISBN, позволяет упоминать книгу, но при этом не указывает, где и как ее можно приобрести.

RDF - это спецификация, которая определяет модель представления мира и синтаксис для сериализации и обмена этой модели. Консорциум всемирной сети (World Wide Web Consortium, сокр. W3C) разработал XML-сериализацию для RDF. RDF XML - это стандартный формат обмена для RDF в семантической сети, хотя он не является единственным. Например, Notation3 - это отличная тестовая альтернативная сериализация.

RDF обеспечивает последовательный стандартный способ описания и работы практически с любыми интернет-ресурсами: от текстовых страниц и графиков до аудио-файлов и видео-клипов. Он предлагает синтаксические возможности для взаимодействия сетей и формирует базовый слой для создания семантической сети. RDF определяет управляемые графы связей, представленные тройками объект-атрибут-значение. Например, объект О имеет атрибут А со значением V.

В листинге 1 представлен пример RDF XML.