Поиск информации в Интернете
Для поиска информации в WWW имеется развитая сеть поисковых WWW-серверов, использующих различные методы индексации информации. Путешествие от ссылки к ссылке называется Web-серфингом, а целенаправленное перемещение – Web-навигацией.
Поиск во Всемирной паутине может вестись как по известным URL-адресам Web-документов, так и по ключевым словам, отражающим смысловое содержание документа, или по фрагментам текста, содержащимся в именах файлов.
Проблему поиска информации отчасти решают справочные ресурсы Интернета, которые условно можно разделить на следующие группы:
1) тематические каталоги и справочные базы данных;
1) поисковые системы (машины);
2) метапоисковые системы.
Тематические каталоги во Всемирной паутине напоминают систематизированные библиотечные каталоги. Поиск по каталогам требует последовательного движения по иерархическому списку ссылок называемых категориями или рубриками. Поиск по каталогу ведется в ресурсе этого каталога и не обеспечивает полноты информации.
Справочные базы данных – это Web-серверы, которые содержат информацию об адресах других серверов по той или иной тематике.
Поисковые системы обеспечивают поиск информации (Web-страниц и других ресурсов Интернета) по ключевым словам и запросам в виде логической комбинации нескольких ключевым слов. Они содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail-адресах и других информационных ресурсах Интернета.
Крупнейшими на сегодняшний день в Рунете поисковыми системами являются www.yandex.ru, www.rambler.ru, www.google.ru, www.aport.ru. Эти порталы снабжены каталогами ресурсов Интернета и мощными поисковыми роботами.
Поисковые системы, как правило, состоят из поискового сервера, отвечающего за взаимодействие поисковой системы с пользователем и предоставляющего удобный интерфейс для ввода ключевых слов и формирования запросов, а также поисковой машины, обрабатывающей базу индексов в соответствии с полученным запросом.
Работа поисковых машин состоит и трех этапов:
1) Сбор информации поисковыми роботами. Специальные программы путешествуют по Web-сайтам Интернета, просматривают их и копируют информацию на центральный сервер поисковой системы.
2) Индексация. Это процесс преобразования собранных роботом данных в другие формы, удобные для быстрого просмотра. В результате индексации образуется база данных, называемая поисковым индексом.
3) Ответ на запрос клиента. В ответ на запрос просматриваются индексы и возвращается список ссылок. При этом используются ключевые слова, использованные клиентом при запросе.
Метапоисковые (мультипоисковые) системы сами не выполняют поиск, но обращаются сразу к нескольким наиболее мощным поисковым системам.