Билет 22 Информационно-поисковые системы (ИПС).
Информационно-поисковые системы (ИПС) предназначены для отыскания в каком-то множестве документов тех, которые посвящены указанной в информационном запросе теме или содержат необходимые сведения. Информационно-поисковые системы не предусматривают завершающей обработки информации.
Под индексированием понимается процесс, состоящий из двух этапов:
определение тем, которые отражаются в данном документе;
выражение этих тем на языке, принятом в информационно-поисковой системе, и запись в виде поисковых образов, которые связываются с документом.
Для того чтобы при помощи ИПС можно было отыскать документы, соответствующие некоторому информационному запросу, сам запрос также должен быть заиндексирован. Процесс поиска осуществляется путем сопоставления поисковых образов документов с поисковым образом запроса. При полном или частичном совпадении образов документ считается соответствующим запросу и выдается пользователю.
Соответствие текста (документа, фактографической записи) фактической информационной потребности называется пертинентностью, а соответствие одного текста другому – релевантностью. При поиске различают смысловую и формальную релевантность.
Смысловая релевантность определяется смысловым соответствием текстов, формальная – соответствием поисковых признаков. В связи с этим различают критерий смыслового соответствия и критерий формального соответствия. Первый устанавливает смысловое соответствие между сведениями, содержащимися в документе и запросе, второй определяет совокупность признаков, согласно которым ИПС осуществляет формальный отбор документов в результате сравнения поисковых образов документов и запросов.
Информационно-поисковые системы различаются между собой по многим признакам, но при решении задач сбора, хранения и выдачи информации все они должны выполнять следующие операции:
анализ важности документов и их отбор;
создание поискового образа документов (ПОД);
запись документов и поисковых образов документов на принятые в ИПС носители;
хранение документов и их поисковых образов;
выдачу документов потребителям.
Информационно-поисковые системы с известной степенью условности можно классифицировать по следующим основным аспектам:
роду выполняемых функций;
режиму поиска;
типу информационно-поискового языка (ИПЯ);
типу критерия соответствия (КрС);
степени автоматизации.