Полнотекстовые информационно-поисковые системы
Процессы компьютеризации деятельности предприятий привели к накоплению большого объема неструктурированной текстовой информации. Возникла потребность в программном обеспечении, реализующем эффективный поиск информации.
Информационно-поисковые каталоги, фасетные и тезаурусные системы не могли быть в полной мере использованы в массовой персональной автоматизации. Потребовались средства, которые бы в максимальной степени освобождали пользователя от необходимости сложной предварительной структуризации предметной области и затратных процедур индексирования при накоплении текстовых данных, но в то же время создавали бы эффективный и интуитивно понятный поисковый инструментарий [14]. В результате на рынке программных продуктов появились полнотекстовые ИС.
Примером полнотекстовых информационно-поисковых систем являются автоматизированные информационные системы по законодательству.
Автоматизированная информационная система по законодательству (АИСЗ) — это программный комплекс, включающий в себя массив правовой информации и инструменты для работы с ним [37]. Эти инструменты позволяют производить поиск документов, формировать подборки документов, печатать документы.
АИСЗ являются частью следующих типов информационных систем [37]:
1. Справочно-информационные системы общего назначения, ориентированные на доступ пользователей к нормативно-правовым актам («Консультант Плюс», «Гарант», «Кодекс» и др.);
2. Глобальные информационные службы (хост-системы), предоставляющие доступ удаленным пользователям к библиографической, полнотекстовой или другой информации (крупнейшей в мире коммерческой службой, обеспечивающей доступ к юридической информации, является система LEXIS (США));
3. Системы информационной поддержки деятельности правотворческих органов (спецификой таких систем является необходимость хранения и поиска многих версий и редакций нормативно-правовых документов, с учетом вносимых поправок и изменений);
4. Системы автоматизации делопроизводства судов, милиции и других правоохранительных органов.
Основными особенностями АИСЗ являются [37]:
• необходимость предоставления адресного доступа к полным текстам;
• в информационных языках для поиска в БД по законодательству необходим учет контекстных связей, регламентированных прилагательных (типа «обязательный», «произвольный» и др.);
• тексты нормативных актов должны подвергаться так называемой юридической обработке, при которой тексту приписываются не только классификационные индексы, ключевые слова, но и комментарии специалистов, ссылки на предшествующие версии, связанные документы, решения судов и др. (без юридической обработки АИСЗ является всего лишь электронным аналогом бумажных изданий).
В настоящее время наиболее распространена АИСЗ «Консультант Плюс». Система «Гарант» занимает второе место в России по количеству пользователей. На третьем месте находится достаточно популярный продукт — информационно-поисковая система «Кодекс», которая разработана малым государственным предприятием «Центр компьютерных разработок».
Доступ пользователя к информации, хранящейся в АИСЗ, может осуществляться двумя способами, каждый из которых имеет свои достоинства и недостатки [37]:
• работа с удаленной базой;
• работа с локальной базой.
При работе с удаленной базой пользователю нет необходимости хранить на своем компьютере данные системы, они хранятся на сервере разработчика и доступны через сеть. Большинство АИСЗ имеют версии, доступные через глобальную сеть Интернет. Основное преимущество работы с такими версиями заключается в том, что пользователь всегда имеет доступ к самым последним данным [37].
Однако для работы с удаленной базой пользователю необходим доступ к Интернету. Зачастую скорость передачи информации через Интернет низкая из-за плохого качества каналов, а стоимость доступа достаточно высокая. Поэтому иногда более выгоден вариант работы с локальной базой,которая доступна в любой момент. Недостатком этого варианта по сравнению с предыдущим является более продолжительный период актуализации информации.
Контрольные вопросы
1. В чем заключались предпосылки появления и распространения. ДИС?
2. Дайте понятие ДИС. Какие различают группы ДИС?
3. Охарактеризуйте функционирование ДИС на основе индексирования.
4. Дайте понятие информационно-поискового языка. Назовите элементы ИПЯ.
5. Назовите виды ИПЯ.
6. Охарактеризуйте системы перечислительной, систематизированной, фасетной классификации.
7. Охарактеризуйте подходы к автоматическому индексированию.
8. Охарактеризуйте полнотекстовые информационно-поисковые системы.
9. Дайте понятие автоматизированной информационной системы по законодательству.
10. Перечислите особенности АИСЗ.
11. В чем заключается сущность юридической обработки документов, помещаемых в базу АИСЗ?
12. Какими способами может осуществляться доступ пользователя к информации, хранящейся в АИСЗ?