Поиск информации в Интернете

Для поиска информации в WWW имеется развитая сеть поисковых WWW-серверов, использующих различные методы индексации информации. Путешествие от ссылки к ссылке называется Web-серфингом, а целенаправленное перемещение – Web-навигацией.

Поиск во Всемирной паутине может вестись как по известным URL-адресам Web-документов, так и по ключевым словам, отражающим смысловое содержание документа, или по фрагментам текста, содержащимся в именах файлов.

Проблему поиска информации отчасти решают справочные ресурсы Интернета, которые условно можно разделить на следующие группы:

1) тематические каталоги и справочные базы данных;

1) поисковые системы (машины);

2) метапоисковые системы.

Тематические каталоги во Всемирной паутине напоминают систематизированные библиотечные каталоги. Поиск по каталогам требует последовательного движения по иерархическому списку ссылок называемых категориями или рубриками. Поиск по каталогу ведется в ресурсе этого каталога и не обеспечивает полноты информации.

Справочные базы данных – это Web-серверы, которые содержат информацию об адресах других серверов по той или иной тематике.

Поисковые системы обеспечивают поиск информации (Web-страниц и других ресурсов Интернета) по ключевым словам и запросам в виде логической комбинации нескольких ключевым слов. Они содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail-адресах и других информационных ресурсах Интернета.

Крупнейшими на сегодняшний день в Рунете поисковыми системами являются www.yandex.ru, www.rambler.ru, www.google.ru, www.aport.ru. Эти порталы снабжены каталогами ресурсов Интернета и мощными поисковыми роботами.

Поисковые системы, как правило, состоят из поискового сервера, отвечающего за взаимодействие поисковой системы с пользователем и предоставляющего удобный интерфейс для ввода ключевых слов и формирования запросов, а также поисковой машины, обрабатывающей базу индексов в соответствии с полученным запросом.

Работа поисковых машин состоит и трех этапов:

1) Сбор информации поисковыми роботами. Специальные программы путешествуют по Web-сайтам Интернета, просматривают их и копируют информацию на центральный сервер поисковой системы.

2) Индексация. Это процесс преобразования собранных роботом данных в другие формы, удобные для быстрого просмотра. В результате индексации образуется база данных, называемая поисковым индексом.

3) Ответ на запрос клиента. В ответ на запрос просматриваются индексы и возвращается список ссылок. При этом используются ключевые слова, использованные клиентом при запросе.

Метапоисковые (мультипоисковые) системы сами не выполняют поиск, но обращаются сразу к нескольким наиболее мощным поисковым системам.