Документальные информационные системы. Общие понятия и определения.
Документальные системы служат для работы с документами на естественном языке -монографиями, публикациями в периодике, сообщениями пресс-агенств. текстами законодательных актов. Они обеспечивают их смысловой анализ при неполном, приближенном представлении смысла.
Несмотря на то, что принципы хранения данных в системах обработки фактической и документальной информацией схожи, алгоритмы обработки в них заметно различаются.
Наиболее распространенный тип документальных систем - информационно-поисковые системы (ИПС). Хотя, если быть точнее, их следует называть документальными ИПС (ДИПС), поскольку традиционные СУБД также являются ИПС, только фактографическими.
В отличие от традиционных БД, ориентированных на полное и точное представление данных достаточно простой смысловой структуры, документальные БД ориентированы на частичное, приближенное представление данных, имеющих значительно более сложную смысловую структуру, представленных на входе в форме текста.
Основной функцией любой ДИПС является информационное обеспечение потребителей на основе выдачи ответов на их запросы. Осуществление выдачи системой требуемых данных реализуется с помощь главной операции ДИПС - проведения информационного поиска. Информационный поиск является процедурой отыскания документов, содержащих ответ на заданные потребителем вопросы.
Заметим, что в отличие от фактографических информационно-поисковых систем, которые в ответ на запрос потребителя осуществляют выдачу конкретных сведений (фактов), ДИПС в результате проведения информационного поиска предоставляют потребителю совокупность документов, смысловое содержание которых соответствует его запросу.