Вопрос 21 URL – сетевой адрес документа. Поиск в Интернете. Поисковые службы в Интернете.

Построение запросов в поисковых службах. Приемы, форматы и кодировки при сохранении

Найденной в Интернете информации.

URL-адрес документа состоит из трех частей и, в отличие от доменных имен, читается слева направо. В первой части указано имя прикладного протокола, по которому осуществляется доступ к данному ресурсу. Для службы World Wide Web это протокол передачи гипертекста HTTP (HyperText Transfer Protocol). У других служб — другие протоколы. Имя протокола отделяется от остальных частей адреса двоеточием и двумя косыми чертами.

 

Второй элемент— доменное имя компьютера, на котором хранится данный документ. Со структурой доменного имени мы уже знакомы — его элементы разделяются точками. После доменного имени ставится косая черта.

Последний элемент адреса — путь доступа к файлу, содержащему Web-документ, на указанном компьютере. С записью пути доступа к файлу в операционной системе Windows мы уже знакомы, но здесь есть важное отличие. В Windows принято разделять каталоги и папки символом обратной косой черты «\», а в Интернете положено использовать обычную косую черту «/». Это связано с тем, что Интернет зарождался на компьютерах, работающих в операционной системе UNIX, а там принято разделять каталоги именно так.

В систему URL заложены следующие принципы:

Расширяемость - новые адресные схемы должны легко вписываться в существующий синтаксис URL; расширяемость достигается за счет выбора определенного порядка интерпретации адресов, который базируется на понятии "адресная схема". Идентификатор схемы стоит перед остатком адреса, отделен от него двоеточием и определяет порядок интерпретации остатка.

Полнота - по возможности любая из существовавших схем должна описываться посредством URL.

Читаемость - адрес должен легко пониматься человеком, что вообще характерно для технологии WWW, - документы вместе с ссылками могут разрабатываться в обычном текстовом редакторе.

Формат URL включает:

схему адреса (тип протокола доступа - http, gopher, wais, telnet, ftp и т.п.);

IP- или доменный адрес машины;

номер TCP-порта;

адрес ресурса на сервере (каталог или путь к файлу);

имя HTML-файла или метку;

критерий поиска данных.