Полнотекстовые информационно-поисковые системы

Процессы компьютеризации деятельности предприятий привели к накоплению большого объема неструктурированной текстовой информации. Возникла потребность в программном обеспечении, реализующем эффективный поиск информации.

Информационно-поисковые каталоги, фасетные и тезаурусные системы не могли быть в полной мере использованы в массовой персональной автоматизации. Потребовались средства, которые бы в максимальной степени освобождали пользователя от необходимости сложной предварительной структуризации предметной области и затратных процедур индексирования при накоплении текстовых данных, но в то же время создавали бы эффективный и интуитивно понятный поисковый инструментарий [14]. В результате на рынке программных продуктов появились полнотекстовые ИС.

Примером полнотекстовых информационно-поисковых систем являются автоматизированные информационные системы по законодательству.

Автоматизированная информационная система по законодательству (АИСЗ) — это программный комплекс, включающий в себя массив правовой информации и инструменты для работы с ним [37]. Эти инструменты позволяют производить поиск документов, формировать подборки документов, печатать документы.

АИСЗ являются частью следующих типов информационных систем [37]:

1. Справочно-информационные системы общего назначения, ориентированные на доступ пользователей к нормативно-правовым актам («Консультант Плюс», «Гарант», «Кодекс» и др.);

2. Глобальные информационные службы (хост-системы), предоставляющие доступ удаленным пользователям к библиографической, полнотекстовой или другой информации (крупнейшей в мире коммерческой службой, обеспечивающей доступ к юридической информации, является система LEXIS (США));

3. Системы информационной поддержки деятельности правотворческих органов (спецификой таких систем является необходимость хранения и поиска многих версий и редакций нормативно-правовых документов, с учетом вносимых поправок и изменений);

4. Системы автоматизации делопроизводства судов, милиции и других правоохранительных органов.

Основными особенностями АИСЗ являются [37]:

• необходимость предоставления адресного доступа к полным текстам;

• в информационных языках для поиска в БД по законодательству необходим учет контекстных связей, регламентированных прилагательных (типа «обязательный», «произвольный» и др.);

• тексты нормативных актов должны подвергаться так называемой юридической обработке, при которой тексту приписываются не только классификационные индексы, ключевые слова, но и комментарии специалистов, ссылки на предшествующие версии, связанные документы, решения судов и др. (без юридической обработки АИСЗ является всего лишь электронным аналогом бумажных изданий).

В настоящее время наиболее распространена АИСЗ «Консультант Плюс». Система «Гарант» занимает второе место в России по количеству пользователей. На третьем месте находится достаточно популярный продукт — информационно-поисковая система «Кодекс», которая разработана малым государственным предприятием «Центр компьютерных разработок».

Доступ пользователя к информации, хранящейся в АИСЗ, может осуществляться двумя способами, каждый из которых имеет свои достоинства и недостатки [37]:

• работа с удаленной базой;

• работа с локальной базой.

При работе с удаленной базой пользователю нет необходимости хранить на своем компьютере данные системы, они хранятся на сервере разработчика и доступны через сеть. Большинство АИСЗ имеют версии, доступные через глобальную сеть Интернет. Основное преимущество работы с такими версиями заключается в том, что пользователь всегда имеет доступ к самым последним данным [37].

Однако для работы с удаленной базой пользователю необходим доступ к Интернету. Зачастую скорость передачи информации через Интернет низкая из-за плохого качества каналов, а стоимость доступа достаточно высокая. Поэтому иногда более выгоден вариант работы с локальной базой,которая доступна в любой момент. Недостатком этого варианта по сравнению с предыдущим является более продолжительный период актуализации информации.

Контрольные вопросы

1. В чем заключались предпосылки появления и распространения. ДИС?

2. Дайте понятие ДИС. Какие различают группы ДИС?

3. Охарактеризуйте функционирование ДИС на основе индексирования.

4. Дайте понятие информационно-поискового языка. Назовите элементы ИПЯ.

5. Назовите виды ИПЯ.

6. Охарактеризуйте системы перечислительной, систематизированной, фасетной классификации.

7. Охарактеризуйте подходы к автоматическому индексированию.

8. Охарактеризуйте полнотекстовые информационно-поисковые системы.

9. Дайте понятие автоматизированной информационной системы по законодательству.

10. Перечислите особенности АИСЗ.

11. В чем заключается сущность юридической обработки документов, помещаемых в базу АИСЗ?

12. Какими способами может осуществляться доступ пользователя к информации, хранящейся в АИСЗ?