HTML-документы
В глобальных сетях
Применение гипертекстовых технологий
Служба WWW (World Wide Web) — гипертекстовая система поиска ресурсов в Internet и доступа к ним.
Областью самого массового применения гипертекстовых технологий является сетевая служба World Wide Web (WWW — всемирная паутина) глобальной сети Internet. Служба WWW предоставляет набор услуг Internet, позволяющий просмотреть любые данные, хранящиеся на компьютерах этой сети через систему связывающих их гиперссылок.
Можно выделить четыре составляющих элемента сетевой службы WWW:
СЕТЕВАЯ СЛУЖБА WWW | |||
Язык гипертекстовой разметки документов HTML HyperText Markup Language | |||
Универсальный способ адресации ресурсов в сети URL Uniform Resource Locator | |||
Протокол обмена гипертекстовой информацией HTTP HyperText Transfer Protocol | |||
Универсальный интерфейс шлюзов CGI Common Gateway Interface | |||
Язык гипертекстовой разметки HTML (HyperText Markup Language) является стандартным языком, предназначенным для создания гипертекстовых документов в среде WWW. Он был предложен Тимом Бернерсом-Ли в 1989 г. в качестве одного из компонентов технологии разработки распределенной гипертекстовой системы World Wide Web.
Основная идея языка HTML заключается в следующем: текст документа дополняется информацией, задающей макетную и логическую структуры документа. Таким образом, структура HTML-документа включает два функциональных элемента:
- собственно текст, т. е. данные, составляющие содержимое документа
- тэги (markup tags), называемые также флагами разметки, - специальные конструкции языка HTML, используемые для разметки документа и управляющие его отображением
Тэг — код (набор символов), идентифицирующий некоторый элемент документа и обозначающий способ ото-бражения этого элемента.
Тэги языка HTML управляют форматированием текста и определяют, в каком виде будет представлен текст, какие его компоненты будут исполнять роль гипертекстовых ссылок, какие графические или мультимедийные объекты должны быть включены в документ. Графическая и звуковая информации, включаемые в HTML-документ, хранятся в отдельных файлах.
По своему значению тэги близки к понятию «скобок». В большинстве случаев они используются парами. Пара состоит из открывающего (start tag) и закрывающего (end tag) тэгов. Идентификаторы тэгов заключаются в треугольные скобки, имя закрывающего тэга отличается от имени открывающего лишь тем, что перед ним ставится наклонная черта:
<имя тэга> — открывающий тэг;
</имя тэга> — закрывающий тэг.
Например, тэги <hml> и соответственно </html> открывают и закрывают сам HTML-документ, а текст, стоящий между тэгами <b> и </b>, будет выделен полужирным шрифтом.
Существует два способа создания гипертекстовых документов:
• создание документа с помощью HTML-редактора. Этот способ позволяет создавать документы для WWW без знания языка HTML. HTML-редакторы автоматизируют создание гипертекстовых документов и избавляют разработчика от рутинной работы. Однако их возможности ограничены, они сильно увеличивают размер получаемого файла и не всегда полученный с их помощью результат соответствует ожиданиям.
• создание и разметка документа при помощи обычного текстового редактора. При этом способе разработчик вручную вставляется в текст команды языка HTML.
Для просмотра HTML-документов существуют специальные программы, которые называются браузеры. Они интерпретируют тэги разметки документа и располагают текст и графику на экране соответствующим образом.
Для записи гипертекстовых ссылок в системе WWW была разработана специальная форма, которая называется универсальный способ адресации ресурсов в сети URL (Uniform ResourceLocator). Указатель ресурса URL — это адрес в системе WWW, при помощи которого однозначно определяется каждый документ. Он используется для записи гиперссылок и для обеспечения доступа к распределенным ресурсам сети Internet. Синтаксис URL имеет такой вид:
схема://хост/путь,
где:
• схема — это протокол, используемый для соединения с данным хост-компьютером;
• хост — это имя хост-компьютера, с которым необходимо установить соединение;
• путь — полное имя документа, затребованного с данного сервера.
Например, в указателе ресурса http://www.dlib.org/dlib.html
http — означает название протокола для соединения с компьютером;
www.dlib.org — имя компьютера;
dlib.html — имя файла на этом компьютере.
Неформально этот URL может интерпретироваться следующим образом: «Используя HTTP-протокол, соединиться с компьютером www.dlib.org и получить файл dlib.html».
В настоящее время активно используются следующие схемы (протоколы) адресации ресурсов в Internet, приведенные в табл.:
Схема доступа (протокол) | Описание |
file | Имя файла в компьютере |
ftp | Протокол передачи файлов |
gopher | Протокол службы Gopher |
http | Протокол передачи гипертекста |
mailto | Адрес электронной почты |
news | Новости телеконференции USENET |
telnet | Сеанс удаленного доступа telnet |
Протокол передачи гипертекста HTTP (HyperText Transfer Protocol) используется для обмена данными в системе WWW. Он обеспечивает передачу гипертекстовой информации с учетом ее специфики. Этот протокол предоставляет пользователю возможность в процессе взаимодействия с сервером получить новый адрес сетевого ресурса, запросить встроенную графику, принять и передать параметры и т. п. Управление в HTTP реализовано с помощью встроенных команд.
Каждый запрос клиента и ответ сервера WWW состоит из трех частей:
• строка запроса (ответа);
• раздел заголовка;
• тело запроса.