[ Протоколы цифровых сетей. ]

Encyclopaedia COMCOR-TV
[ ftp: ] [ http: ] [ mailto: ] [ news: ] [ irc: ] [ ed2k: ] [ синтаксис URL ]

URL ( Uniform Resource Locator ) – что такое и с чем его едят?


ОБЩИЕ СВЕДЕНИЯ

Данная справка претендует не на полноту, а на популярное введение в синтаксис и практическое применение URL, которые являются принятым в технологии internet стандартом ссылки на ресурс. URL служат для указания на ресурс в таких системах, как WWW, ICQ, E-mail, News, IRC, а также могут быть записаны на бумаге, на стене и т. п. для последующего ручного ввода в окошке Address (Location) browser'а, в командной строке или в окошке Run (Запуск) в Windows. Применение URL экономит не только сетевой traffic, но ещё время и нервы пользователя, так что рекомендуется указывать их как можно чаще.

URL записывается в виде строки видимых символов ASCII (не может включать ни пробелов, ни переводов строки) и всегда начинается с имени схемы (протокола), после которого стоит знак двоеточия ( : ) и затем всё остальное. На страницах WWW ссылки URL ставятся в код HTML (то же возможно и при пересылке HTML через E-mail или News), в ICQ предусмотрена команда посылки URL, но URL можно вставлять и в простой текст: следует отделять URL от остального текста пробелами, переводами строки или угловыми скобками < > и располагать непременно на одной строке. Приводим описание четырёх схем URL, имеющих наибольшую важность в Сети КОМКОР-ТВ.

URL протокола FTP

Применяется для указания файла FTP, директории на сервере FTP или сервера FTP в целом. Понимается любым современным Web-browser'ом. URL ресурса FTP выглядит так:

ftp://host/путь

путь состоит из нескольких (можно 0) имён директорий (завершаемых каждое символом /) и потом возможно собственно имени файла.

Если требуется авторизация на сервере, то URL выглядит так:

ftp://user:password@host/путь

URL протокола HTTP

Применяется для указания Web-страницы, картинки, файла, аудиопотока .mp3 (при наличии такого проигрывателя) или любого иного ресурса HTTP. Понимается любым Web-browser'ом. URL текущего ресурса отображается наверху в окошке Address (Location) и может быть оттуда извлечён. Иногда встречаются Web-страницы со фреймовой структурой (frameset), где URL конкретного фрейма не отображается, однако в Netscape Navigator это лечится командой загрузки желаемого фрейма в новое окно.

URL ресурса HTTP выглядит так:

http://host/путь доп. параметры

путь обычно состоит из нескольких (можно 0) имён директорий (завершаемых каждое символом /) и потом возможно собственно имени файла.

доп. параметры могут включать в указанном порядке:

Неверное указание пути приводит к Ошибке 404. Неверное указание строки запроса может привести к ошибке соответственной программы на сервере (если только она предусмотрена для данного пути). Неверное указание якоря не приводит ни к какой ошибке.

Если сервер HTTP работает на порту TCP, отличном от 80 (принятого по умолчанию), то URL должен выглядеть так:

http://host:port/путь доп. параметры

URL контактного адреса (Mail To)

Строго говоря, не является ссылкою на ресурс. Применяется главным образом в HTML для указания адреса E-mail (куда читатель может направлять сообщения) и интерпретируется как команда создания (но не отправки) такого сообщения в почтовой программе читателя, куда нужный текст он уже введёт сам. Netscape сам обрабатывает mailto:-URL, а MS Internet Explorer обращается для этого к Windows, которая как правило загружает Outlook Express.

URL контактного адреса выглядит так:

mailto:кому доп. параметры

кому есть обычный адрес E-mail в форме account@domain или user@host , а доп. параметры (если указаны) представляют строку вроде ?Cc=кому-ещё&Subject=subj&body=что-бы-такого-послать

URL новостей (News)

Применяется для указания конкретной статьи на новостном сервере или конкретной группы новостей в целом. Netscape сам обрабатывает news:-URL, а MS Internet Explorer обращается для этого к Windows, которая как правило загружает Outlook Express. В Сети КОМКОР-ТВ подразумевается, что News-читало пользователя по умолчанию нацелено на сервер news.comcor-tv.ru, он же news.comtv.ru.

URL конкретного сообщения (статьи) новостей выглядит так:

news:ID@host

Сервер ищет и выдаёт статью, имеющую в заголовке:

Message-ID: <ID@host>

Извлечение news:-URL какого-либо сообщения новостей делается в MS Outlook Express через свойства (properties) и закладку Details (откуда содержимое поля Message-ID можно скопировать и дописать news: от руки), или можно создать ответ на сообщение, но никуда его не отсылать, а выдрать из его шаблона готовую news-ссылку на исходное сообщение; в Netscape поле Message-ID можно увидеть в режиме показа заголовков (View/Headers/All), откуда его опять-таки можно скопировать или применить команду Copy Link Location (в меню, вызываемом при нацеливании на Message-ID и нажатию второй кнопки мыши). Следует отметить, что последнее копирует в буфер обмена ссылку в формате news://news.comcor-tv.ru/ID@host , который вообще-то стандартом не предусмотрен, но обычно работает. Впрочем, ненужные символы //news.comcor-tv.ru/ можно удалить и вручную.
По поводу поддержки news-ссылок в Mozilla.

Добавление: IRC

Ссылка на IRC-канал выглядит так:

irc://IRC.server.net/channel

, где channel это имя канала без начального символа #. Работает это дело только в Windows с mIRC.

Добавление: eDonkey(Ослик)

Ссылки на файлы системы eDonkey выглядят так:

ed2k://|file|имя_файла|размер|checksum|

Работает это дело только в Windows.

Полезные детали синтаксиса URL

Как было сказано, URL записывается только видимыми символами ASCII. Более конкретно, части URL (кроме символов-разделителей, выделенных полужирным шрифтом) должны быть составлены из следующего набора обычных символов:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 
a b c d e f g h i j k l m n o p q r s t u v w x y z 
 0 1 2 3 4 5 6 7 8 9 - + * . , ! ' ( ) $ _          

, но кроме того могут включать кодированные байты, записываемые как % H h, где H и h суть старшая и младшая шестнадцатеричные цифры кодируемого байта. К примеру

Кодирование символов в URL предписано применять и для не-ASCII символов (кириллицы и т.п.). Кодированный байт рассматривается как просто символ и не может являться разделителем. Элементы синтаксиса, выделенные полужирным шрифтом в приведённых выше схемах, не могут быть закодированы через %, что в частности вызывает проблемы с представлением разделителей & в URLах, включаемых в код HTML. Интерпретация обычного символа не должна зависеть от того, указывается он прямым текстом, или же кодируется через %. Так, нет разницы между $ и %24.