Universal Resource Location

Техническое задание на Кавангу

Архитектура Каванги

Э... следующий слайд, пожалуйста...

HTTP протокол в картинках (мысленных)

На самом деле полностью HTTP протокол стоит двух больших лекций. Но я пробегусь по нему бегом и остановлюсь подробно на тех вещах, которые касаются менеджеров. Вы не должны знать протокол, на то программисты есть. Но понимать некоторые принципы полезно, это позволяет понимать многие “почему”. В конце главы расскажу еще буквально в трех словах о языке HTML - с теми же целями, а потом сделаю пару неожиданных выводов.

 

URL

Universal Resource Location

Это обычный интернет-адрес, который мы набираем или видим в адресной строке браузера. Адрес состоит из нескольких частей, и все имеют собственное подлое значение.

1. Протокол. Бывает http:// или https://. На самом деле их больше, бывает ftp://, file://, goopher:// и еще прорва разного мусора. Есть деятели, которые собственные протоколы выдумывают, что оканчивается плачевно. Мы в обычной жизни встречаемся с файлом - когда смотрим баннеры с локального диска, и с HTTP, простым и безопасным. Разница между ними в способе запроса информации, более подробно знать необязательно. Нас в принципе интересует только кусочек строки. Например, во многих сетях принято проверять адрес страницы, где расположен баннер, на наличие интернет протокола. Берешь код, смотришь локально - не работает. Выкладываешь в интернет - работает. Не принято смешивать на одной странице безопасный и небезопасный адреса, чревато идиотскими алертами. Для этих целей каванга понимает протокол https.

2) Домен или Хост. Это часть, которая стоит денег :) По сути название сайта клиента. Ну или партнера. Или того же сервера каванги. К доменному имени привязываются куки, вот это вы должны понимать. Тут спрашивали, если сайт меряется счетчиком адривера, можем ли мы организовать бумеранг на этот сайт. Не сможем. Адривер, может, и знает, какие куки на сайте были. Он даже может нам эти куки отдать. Но мы от посетителей никогда адриверовские куки не получим.

Бывает, что у клиента или у партнера множество доменов, обычно доменами верхнего уровня разруливают разделы сайта (news.mail.ru, auto.mail.ru). Как правило, ничего страшного в этом нет, но насторожиться надо. Это потенциальная граната - из за кук.

Домен заканчивается слешем.

3) Путь. На самом деле это именно имя файла с путем до него на сервере. В большинстве случаев именно такой файл на сервере и есть. Следовательно, большие и маленькие буквы отличаются (!). В домене, например, все равно. На особо хитрых серверах бывает сложнее, например в самой каванге :) Но это заморока для разработчиков, а не для пользователей. Имя файла заканчивается вопросом. Бывает имя файла по умолчанию, его знает сервер (это чтобы не удивлялись, если нет никакого файла)

4) Параметры. Следуют после вопроса, разделяются амперсандами. Не содержат в себе амперсандов, вопросов, пробелов итд. Есть общее требование - если сервер не понимает какие то параметры, он обязан их игнорировать. На этом базируются всевозможные счетчики, в том числе горячо любимый гугл-аналитикс. На сайт клиента передаются параметры, которые самому клиенту на фиг не нужны. Поэтому на сайте ничего не меняется, а счетчик эти параметры видит, и обрабатывает.

Наш собственный сервер похитрее остальных. Он не только игнорирует незнакомые параметры, он их дальше передает. На этом впоследствии будут основываться многокликовые баннеры

5) Хеш (якорь) Отделяется от параметров решеткой #. Используется для прокрутки страницы без перезагрузки. Встречается редко, но метко ( Не передается на сервер по стандарту, следовательно не должен использоваться в баннерах.

 

http:// b.kavanga.ru /click ?sid=0&bt=5&ct=2&bc=3&banner=123&utm_source=kavanga
Протокол Хост (домен) путь (файл) пачка параметров