Поиск информации с применением серверов глобального поиска и каталогов

Пожалуй, самой полезной чертой интернета является наличие в нем поисковых серверов. Это выделенные компьютеры, которые автоматически просматривают все ресурсы интернета, которые могут найти, и индексируют их содержание. Затем Вы можете передать такому серверу фразу или набор ключевых слов, описывающих интересующую Вас тему, и сервер возвратит Вам список ресурсов, соответствующих Вашему запросу. Сегодняшние поисковые системы поддерживают индексы, включающие весьма значительную часть ресурсов интернета. Таких серверов существует довольно-таки много, более десятка, и вкупе они охватывают практически все доступные ресурсы. К самым популярным русскоязычным поисковым серверам можно отнести rambler.ru, yandex.ru, google.ru и другие.

В каталогах интернета хранятся тематически систематизированные коллекции ссылок на различные сетевые ресурсы, в первую очередь на документы World Wide Web. Ссылки в такие каталоги заносятся не автоматически, но их администраторами. Более того, занимающиеся этим люди стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, но достаточно найти этот вопрос в каталоге - работа по поиску и систематизации ссылок уже сделана за него.

Каталоги обычно имеют древовидную структуру и похожи на очень большой список закладок. Когда World Wide Web только начинала развиваться, и ее серверы еще можно было пересчитать, некоторые пользователи вели их списки. Со временем WWW-серверов становилось все больше, каждый день появлялись новые, и механизма закладок стало недостаточно для того, чтобы хранить эту информацию. Некоторые пользователи WWW стали создавать специальные программы для поддержания базы данных по ссылкам на ресурсы интернета, ее автоматической синхронизации и управления ею. Именно так и родились глобальные каталоги сети, как, например, наиболее известный и крупный - YAHOO.

Как правило, хорошие каталоги интернета обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях. Все это делает использование таких коллекций весьма удобным.

Поисковые системы индексируют документы автоматически, не оценивая его завершенности или полезности. Поэтому они могут находить информацию в самых "глухих" углах интернета. С другой стороны, если вы неудачно сформулируете ваш запрос, сервер может и не возвратить ссылки на нужный документ. В этом случае, если вы определенно знаете, что из себя представляет искомый ресурс, и он наверняка хорошо известен, разумно обратиться к каталогам интернета. Это решение также является адекватным в случае, когда Вам требуется наиболее полный список ресурсов по некоторому вопросу. Если же Вам нужна хотя бы одна ссылка, то использовать поисковый сервер гораздо быстрее.

Довольно-таки часто возникают ситуации, когда Вас интересует не информация о самом объекте, а ссылки на него в других, не связанных c ним непосредственно, документах. Тогда Вам тоже нужно воспользоваться поисковым сервером. То есть условно можно сказать, что каталоги - средство сфокусированного поиска информации, а поисковые серверы - рассеянного.

Каталоги и поисковые серверы - две стороны поиска информации в интернете. Они разные по методам, но едины в целях. Научившись быстро использовать один, наиболее подходящий для Вас, каталог и несколько хороших поисковых серверов, Вы получите средство быстрого и эффективного нахождения информации в глобальной сети.

ГЛАВА 3. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СОЗДАНИЯ WEB-САЙТОВ

3.1. Введение

Годом рождения World Wide Web считается 1989 - в этом году был изобретен язык, ставший впоследствии основным языком web-документов - это язык - HTML (HyperText Markup Language - язык разметки гипертекста).

Автором языка HTML является Тим Бернерс-Ли, выпускник Оксфордского университета, работавший в то время по контракту в Женеве, в Европейской лаборатории физики элементарных частиц (CERN, Conseil Europeen pour la Recherche Nucleaire) консультантом по программному обеспечению. CERN - достаточно большая организация, и потому, чтобы лучше ориентироваться в ее структуре, не хранить в памяти данные о большом количестве проектов, должностных лиц и пр., Тим Бернерс-Ли разработал для своего личного пользования программу Enquire, на основе которой через несколько лет для лаборатории было создано своего рода информационное пространство. Программа Enquire позволяла осуществлять так называемый "нелинейный" поиск документов - т.е. переходить от одного документа к другому без обращения к оглавлению или справочнику.

Язык HTML составляет основу технологии гипертекста.

Гипертекстовый документ содержит так называемые гиперссылки. Гиперссылки - это фрагменты текста или изображения, щелчок мыши на которых вызывает переход к новому документу или к новому разделу данного документа.

Текстовые гиперссылки обычно выделяются цветом и подчеркиванием, хотя это необязательно.

Гиперссылки позволяют пользователю немедленно перейти к нужному документу, независимо от места его физического расположения. Это существенно облегчает поиск информации, разбросанной по всему Земному шару.

Технология гипертекста позволила связать всю совокупность опубликованных в интернете документов в единую систему - WWW.

Язык HTML не является собственно языком программирования - это есть средство описания структуры документа, его стиля и связей его с другими документами.

Создание языка HTML в 1989 году облегчило обмен информацией в пределах лаборатории CERN, однако это не решало проблем, связанных обменом информацией между сотрудниками лаборатории и их коллегами, работавшими в разных странах. Для того, чтобы такой обмен был возможен, необходимо было создать децентрализованную информационную систему, основанную на некоем стандарте обмена данными. Таким стандартом стал созданный Тимом-Бернерсом Ли в 1990 году протокол HTTP (HyperText Transfer Protocol, протокол передачи гипертекстовых файлов).

Протокол HTTP позволил передавать по сети HTML-документы. Появилась возможность организовать доступ многочисленных пользователей (клиентов) к HTML-документам, находящимся на так называемых серверах (англ.: to serve - служить, обслуживать). Ясно, что и на компьютере пользователя, с которого происходит обращение к серверу, и на сервере должно быть установлено специальное программное обеспечение:

· сервер должен не только хранить документы, но и уметь быстро находить их по запросу клиента;

· клиент (браузер) должен распознать HTML-код и визуализировать его, представить в легко воспринимаемом виде.