[ Протоколы цифровых сетей. ] |
![]() |
URL ( Uniform Resource Locator ) – что такое и с чем его едят?
Данная справка претендует не на полноту, а на популярное введение в синтаксис и практическое применение URL, которые являются принятым в технологии internet стандартом ссылки на ресурс. URL служат для указания на ресурс в таких системах, как WWW, ICQ, E-mail, News, IRC, а также могут быть записаны на бумаге, на стене и т. п. для последующего ручного ввода в окошке Address (Location) browser'а, в командной строке или в окошке Run (Запуск) в Windows. Применение URL экономит не только сетевой traffic, но ещё время и нервы пользователя, так что рекомендуется указывать их как можно чаще.
URL записывается в виде строки видимых символов ASCII
(не может включать ни пробелов, ни переводов строки)
и всегда начинается с имени схемы (протокола),
после которого стоит знак двоеточия ( : ) и затем всё остальное.
На страницах WWW ссылки URL ставятся в код HTML
(то же возможно и при пересылке HTML через E-mail или News),
в ICQ предусмотрена команда посылки URL,
но URL можно вставлять и в простой текст:
следует отделять URL от остального текста пробелами, переводами строки
или угловыми скобками < >
и располагать непременно на одной строке.
Приводим описание четырёх схем URL, имеющих наибольшую важность в Сети КОМКОР-ТВ.
URL протокола FTP
Применяется для указания файла FTP, директории на сервере FTP или сервера FTP в целом. Понимается любым современным Web-browser'ом. URL ресурса FTP выглядит так:
путь состоит из нескольких (можно 0) имён директорий (завершаемых каждое символом /) и потом возможно собственно имени файла.
Если требуется авторизация на сервере, то URL выглядит так:
Применяется для указания Web-страницы, картинки, файла, аудиопотока .mp3 (при наличии такого проигрывателя) или любого иного ресурса HTTP. Понимается любым Web-browser'ом. URL текущего ресурса отображается наверху в окошке Address (Location) и может быть оттуда извлечён. Иногда встречаются Web-страницы со фреймовой структурой (frameset), где URL конкретного фрейма не отображается, однако в Netscape Navigator это лечится командой загрузки желаемого фрейма в новое окно.
URL ресурса HTTP выглядит так:
путь обычно состоит из нескольких (можно 0) имён директорий (завершаемых каждое символом /) и потом возможно собственно имени файла.
доп. параметры могут включать в указанном порядке:
Неверное указание пути приводит к Ошибке 404. Неверное указание строки запроса может привести к ошибке соответственной программы на сервере (если только она предусмотрена для данного пути). Неверное указание якоря не приводит ни к какой ошибке.
Если сервер HTTP работает на порту TCP, отличном от 80 (принятого по умолчанию), то URL должен выглядеть так:
URL контактного адреса (Mail To)
Строго говоря, не является ссылкою на ресурс. Применяется главным образом в HTML для указания адреса E-mail (куда читатель может направлять сообщения) и интерпретируется как команда создания (но не отправки) такого сообщения в почтовой программе читателя, куда нужный текст он уже введёт сам. Netscape сам обрабатывает mailto:-URL, а MS Internet Explorer обращается для этого к Windows, которая как правило загружает Outlook Express.
URL контактного адреса выглядит так:
кому есть обычный адрес E-mail в форме account@domain или user@host , а доп. параметры (если указаны) представляют строку вроде ?Cc=кому-ещё&Subject=subj&body=что-бы-такого-послать
Применяется для указания конкретной статьи на новостном сервере или конкретной группы новостей в целом. Netscape сам обрабатывает news:-URL, а MS Internet Explorer обращается для этого к Windows, которая как правило загружает Outlook Express. В Сети КОМКОР-ТВ подразумевается, что News-читало пользователя по умолчанию нацелено на сервер news.comcor-tv.ru, он же news.comtv.ru.
URL конкретного сообщения (статьи) новостей выглядит так:
Сервер ищет и выдаёт статью, имеющую в заголовке:
Извлечение news:-URL какого-либо сообщения новостей
делается в MS Outlook Express
через свойства (properties) и закладку Details
(откуда содержимое поля Message-ID можно скопировать и дописать news: от руки),
или можно создать ответ на сообщение, но никуда его не отсылать,
а выдрать из его шаблона готовую news-ссылку на исходное сообщение;
в Netscape поле Message-ID можно увидеть
в режиме показа заголовков (View/Headers/All),
откуда его опять-таки можно скопировать
или применить команду Copy Link Location
(в меню, вызываемом при нацеливании на Message-ID
и нажатию второй кнопки мыши).
Следует отметить, что последнее копирует в буфер обмена
ссылку в формате news://news.comcor-tv.ru/ID@host ,
который вообще-то стандартом не предусмотрен, но обычно работает.
Впрочем, ненужные символы //news.comcor-tv.ru/ можно удалить и вручную.
По поводу
поддержки news-ссылок в Mozilla.
Ссылка на IRC-канал выглядит так:
, где channel это имя канала без начального символа #. Работает это дело только в Windows с mIRC.
Ссылки на файлы системы eDonkey выглядят так:
Работает это дело только в Windows.
Полезные детали синтаксиса URL
Как было сказано, URL записывается только видимыми символами ASCII. Более конкретно, части URL (кроме символов-разделителей, выделенных полужирным шрифтом) должны быть составлены из следующего набора обычных символов:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9 - + * . , ! ' ( ) $ _
,
но кроме того могут включать кодированные байты,
записываемые как % H h,
где H и h суть старшая и младшая шестнадцатеричные цифры
кодируемого байта.
К примеру
Кодирование символов в URL предписано применять и для не-ASCII символов (кириллицы и т.п.). Кодированный байт рассматривается как просто символ и не может являться разделителем. Элементы синтаксиса, выделенные полужирным шрифтом в приведённых выше схемах, не могут быть закодированы через %, что в частности вызывает проблемы с представлением разделителей & в URLах, включаемых в код HTML. Интерпретация обычного символа не должна зависеть от того, указывается он прямым текстом, или же кодируется через %. Так, нет разницы между $ и %24.