Что такое урлы – Что такое URL адрес и как с ним работать

Содержание

Что такое URL (УРЛ) — простой ответ что это значит, что такое урлы

URL (УРЛ) – это уникальный адрес веб ресурса (сайта), который зарегистрирован в единой схеме адресации известной как «Uniform Resource Locator» или сокращенно – URL.

 

Что такое URL (УРЛ) — значение, определение простыми словами.

 

Простыми словами URL – это адрес сайта, включая путь к конкретной странице или контенту на ней. Все браузеры имеют строку для ввода адреса, где отображается просматриваемая в данный момент страница. Именно в данное поле мы вводим адрес сайта, который хотим посетить.

 

Как выглядит URL (УРЛ)

 

URL-адрес может состоять из слов, таких как «chto-takoe.net» или из цифр соответствующих Интернет протоколу (IP): 195.191.24.196. Естественно, что большинство людей используют текстовые адреса, так как это более удобно и их проще запоминать.

 

 

Наверное, каждый пользователь интернета замечал, что в браузерной строке, адрес сайта начинается с

HTTP: //сайт или https: //сайт. Но что это значит, знают далеко не все.

 

Большинство сайтов, адрес которых начинается с «HTTP: //»  не шифруются. А это значит, что любая информация, проходящая между вашим компьютером и интернет ресурсом, может быть перехвачена и использована в каких либо целях.

 

Именно по этому, в целях безопасности передачи данных, многие сайты переходят на зашифрованный протокол «https: //». Для пользователя это значит, что если сайт использует такой протокол, то на нем можно совершенно спокойно совершать действия связанные с частной перепиской или оплатой товаров и услуг.

Получи плюсик к карме — поделись добром с друзьми:

VK

Facebook

Twitter

chto-takoe.net

Урл — это… Что такое Урл?

Структура URL

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

<схема>://<логин>:<пароль>@<хост>:<порт>/<URL‐путь>

В этой записи:

схема 
схема обращения к ресурсу, в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль, ассоциированный с указанным именем пользователя
хост 
полностью прописанное доменное имя хоста в системе IP-адрес хоста в форме четырёх десятичных чисел, разделённых точками. Числа находятся в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса (зависит от протокола)

Схемы (протоколы) URL

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов гипертекста HTTP, использующая шифрование (как правило, TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet через протокол IRC
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию WAIS
  • xmpp — Протокол XMPP (часть файла
  • data — Непосредственные данные (Data: URL)

Экзотические схемы URL:

Кодирование URL

Появление адресов URL стало существенным нововведением в Интернете. Однако с момента его изобретения и по сей день стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нужные нам символы должны быть перекодированы особым образом.

В русскоязычной Википедии ежедневно приходится видеть пример кодирования URL, поскольку русский язык использует символы кириллицы. Например, строка вида:

http://ru.wikipedia.org/wiki/Микрокредит

кодируется в URL как:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82

Такое преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в Юникоде (шестнадцатеричном представлении:

М → D0 и 9C → %D0%9C
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
р → D0 и 80 → %D0%80, и т. д.

Перед каждым таким шестнадцатеричным кодом байта, согласно спецификации URL[1], ставится знак процента (%) — отсюда даже возник английский термин «percent‐encoding», обозначающий способ кодирования символов в URL и URI.

Иные распространённые, но недопустимые в URL символы кодируются в таком соответствии:

 "  #[2] %  &[2]  '  *  ,[2] :[2] ;[2]  <   >  ?[2] [   ^   `   {   |   }  <пробел>
%22 %23 %25 %26 %27 %2a %2c %3a %3b %3c %3e %3f %5b %5e %60 %7b %7c %7d   +[3]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами на подавляющем большинстве языков (кроме английского, итальянского, латинского) может утратить способность восприниматься людьми.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и англ. International Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы URI в целом).

Инициатива PURL

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Примеры URL

http://ru.wikipedia.org/wiki/URL
http://en.wikipedia.org:80/wiki/Special:Search?search=train&go=Go 
ftp://myname:[email protected]:21/etc/motd
prospero://myhost.dom//pros/somename
file://vms.myhost.edu/disk$user/my/notes/note123.txt

См. также

Сноски

  1. RFC 2396 часть 2.
  2. 1 2 3 4 5 6 Символ допустим, но при указании прямым текстом несёт специальное синтаксическое значение
  3. Следует отметить, что поисковики заменяют пробел на символ «+».

Ссылки

dic.academic.ru

УРЛ — что это такое? Расшифровка, определение, перевод

URL это английская аббревиатура, которая расшифровывается как Uniform Resource Locator, что в переводе на русский язык означает «Единый Локатор Ресурса». Говоря простыми словами, УРЛ это уникальный адрес какого-либо документа или медиа-файла в интернете. Современные УРЛы, как правило, содержат три параметра: 1) протокол, по которому передаются данные, 2) домен, на котором расположен документ, и 3) путь к этому документу на сервере. Но давайте скорее рассмотрим пример, хорошо?

Текст, который вы прямо сейчас читаете, имеет следующий URL:
https://chto-eto-takoe.ru/url
Буквы, расположенные перед «://», обозначают протокол передачи данных. В нашем случае это https. Дальше следует домен, то есть адрес этого сайта: chto-eto-takoe.ru. После косой черты, сразу за доменом, идёт путь к этой статье на сервере. В данном случае это «url» (строчными буквами).



URL это английская аббревиатура, которая расшифровывается как Uniform Resource Locator, что в переводе на русский язык означает «Единый Локатор Ресурса». Говоря простыми словами, УРЛ это уникальный адрес какого-либо документа или медиа-файла в интернете. Современные УРЛы, как правило, содержат три параметра: 1) протокол, по которому передаются данные, 2) домен, на котором расположен документ, и 3) путь к этому документу на сервере. Но давайте скорее рассмотрим пример, хорошо?

Текст, который вы прямо сейчас читаете, имеет следующий URL:
https://chto-eto-takoe.ru/url
Буквы, расположенные перед «://», обозначают протокол передачи данных. В нашем случае это https. Дальше следует домен, то есть адрес этого сайта: chto-eto-takoe.ru. После косой черты, сразу за доменом, идёт путь к этой статье на сервере. В данном случае это «url» (строчными буквами).


УРЛ находится в списке: Интернет


Вы узнали, откуда произошло слово УРЛ, его объяснение простыми словами, перевод, происхождение и смысл.
Пожалуйста, поделитесь ссылкой «Что такое УРЛ?» с друзьями:

И не забудьте подписаться на самый интересный паблик ВКонтакте!

 


Сайт новых и хорошо забытых слов Что-это-такое.ru
Добавить слово | Помочь проекту

Псст… Совесть есть?
А если найду?

chto-eto-takoe.ru

Что такое URL адрес сайта? Параметры, допустимые символы URL

  Параметры и допустимые символы URL адреса сайта

В одной из предыдущих статей я описывал человеко-понятные урл — ЧПУ URL и разное отношение поисковиков к ним. В данной статье хотелось бы рассмотреть само понятие УРЛ, так как оно является основополагающим для всего Интернета.

URL (Uniform Resource Locator) — переводится с английского как Унифицированный указатель ресурса, или Единообразный (универсальный) локатор ресурса, т.е. это путь, по которому можно найти любой файл и каталог в сети Интернет.

URL адрес страницы сайта состоит из следующих элементов: протокол://полное доменное имя/(папка(и))/имя ресурса (файла). В расширенном варианте УРЛ может выглядеть так:

схема://логин:пароль@хост:порт/(папка(и))/имя ресурса (файла)?параметры#якорь

Основные параметры Урл:

  • в качестве схемы  выступает обычно какой-нибудь протокол, обычно это http(s), ftp и множество других (skype, nfs)
  • логин-пароль нужны для прохождения одного из способов авторизации пользователя на сервере. Если авторизации не требуется, эти параметры не указываются
  • хост — полное доменное имя или IP-адрес компьютера в сети. Например, для Яндекса — это Yandex.ru
  • порт — на каком порту сервера будет производиться подключение к нему. В большинстве случаев, данный параметр не указывается, т.к. по умолчанию подразумевается порт 80, которым обычно пользуются браузеры. Попробуйте к любому URL адресу сайта подставить «:80», ничего нового не произойдёт — будет совершён переход на адрес «без порта». Например http://www.google.ru:80 перекинет на  http://www.google.ru.
  • далее идёт или сразу имя файла (например, page.php), или сначала 1 и более каталогов, а потом имя файла. Если имя файла отсутствует, то открывается т.н.
    индексный файл
    — index.php (index.html, index.jsp и множество других расширений).
  • после имени файла могут указываться дополнительные параметры — после знака вопроса (?). Между параметрами ставится знак амперсанда (&). К примеру, выглядеть это может так: http://www.bing.com/account/web?sh=5&ru=%2f. Самих параметров может быть много, они имеют вид переменная=значение и обрабатываются на сервере с помощью языков серверного программирования
  • якорь в URL подставляется после решётки (#) и указывает на элемент открываемой страницы, причём браузер обычно автоматически производит прокрутку до того html-элемента, id которого равно якорю. Например, на созданных на WordPress сайтах при клике на «Читать далее»как раз это и происходит:

      Пример из WordPress’а

Допустимые символы URL

В URL адресе допустимы только латинские буквы, арабские цифры и ограниченный набор знаков препинания:

  • дефис (-),
  • подчёркивание (_)
  • точка (.)

Также возможны запятые (,) и точки с запятой (;), но используются они редко и обычно кодируются, как и все остальные символы (русские буквы, пробелы и т.п.). Яркий пример закодированных урл’ов — статьи Википедии —  http://ru.wikipedia.org/wiki/%D0%95%D0%B6.

Правила кодирования  нелатинских букв (в т.ч. кириллицы) и прочих не допустимых символов URL: сначала буква кодируется в UTF-8 (кодировку Unicode) — получается 2 байта из каждого символа. Затем каждый из этих байтов преобразуется в шестнадцатиричную систему счисления и перед ним ставится знак процента (%), получается что-нибудь такое:  %D0%95%D0%B6 (по-русски будет «еж»). Недопустимые знаки препинания кодируются так:

  Кодирование символов в адресах. Справка из Википедии (кликабельно)

Среди УРЛ выделяют относительные и абсолютные, а также статические и динамические URL адреса страниц сайта. Об этом будет рассказано в следующих статьях.

Loading…

web-ru.net

URL — что это такое

Все страницы, размещенные в сети Интернет, имеют свои гиперссылки. Поэтому URL является основной составляющей всех сайтов, без которой пользование ресурсами просто невозможно.

В таком случае следует разобраться, что представляет собой УРЛ и для чего необходим этот элемент. При этом стоит учесть, что он имеет определенную структуру и несколько параметров. Подробное описание приведено ниже.

Что такое URL

Аббревиатуру URL можно расшифровать как Uniform Resource Locator. Данная фраза дословно переводится как единый указатель ресурсов. Кроме того, его называют единообразным локатором или универсальным указателем ресурса. В произношении звучит как «ю-ар-эл» или же «у-эр-эл». Зачастую аббревиатура в разговорной речи произносится как «УРЛ».

Фото: url адрес сайта или страницы

Изобрел единый указатель ресурсов Тим Бернерс-Ли. Случилось это в 1990 году в Швейцарии. Над этим проектом Бернерс-Ли работал в стенах Европейского совета, специализирующегося на ядерных исследованиях.

URL стал настоящим прорывом в интернет-разработках. Изначально единый указатель ресурсов использовался для того, чтобы обозначать места, где находятся ресурсы, как правило, файлы в сети. На данный момент единообразный локатор необходим для указания адресов. При этом он применяется практически ко всем ресурсам в Интернете.

Общая структура

Разберемся подробней, что же представляет собой URL. Также можно сказать, что это путь к какому-нибудь файлу.

Это может быть как:

  • видео;
  • текстовый документ;
  • фото;
  • HTML,
  • аудио.

Такой адрес присвоен всем документам, которые расположены в Интернете. Используя единообразный локатор, сервер предоставляет доступ к хранящимся на нем файлам всем пользователям сети.

Фото: структура URL адреса

Существует специальный стандарт, согласно которому и должен выглядеть Uniform Resource Locator к какому-либо документу.

Этот шаблон применяется для доступа:

  • к различным файлам и сайтам по протоколам https и http;
  • для передачи данных на портал по протоколу ftp.

Кроме того, УРЛ-адрес имеет определенную структуру, которая состоит из нескольких основных параметров.

Параметры адреса

Каждый из данных параметров является важной составляющей адресной ссылки.

Фото: параметры структуры URL

При этом все они имеют своё значение, а именно:

  • схема – это и есть протокол для передачи информации. С его помощью можно обратиться к нужному ресурсу.
  • логин и пароль – они необходимы для того, чтобы правильно определить права пользователя для доступа на конкретную страницу Интернет-портала. В протоколе http эта информация не указывается.
  • собака – это разделитель, который представляет собой @. Собака, как правило, указывается только вместе с логином и паролем.
  • хост – это и есть доменное имя. Реже, это может быть IP-адрес какого-то ресурса, к которому пользователю необходимо получить доступ.
  • порт – данный параметр указывается достаточно редко. Когда пользователь обращается к порталу или любому другому файлу, который имеется на сайте, сразу же присваивается определенное значение, как правило, это 80 или 8080.
  • URL-путь – путь к месту, где находится тот или иной файл.
  • параметры – следуют сразу после имени файла и пишутся после знака вопроса (?). Для разделения этих параметров используется знак амперсанда (&). Это может выглядеть так:

    Фото: использование знака амперсанда

Параметров может быть несколько. Используя языковое серверное программирование, они обрабатываются в системе.

  • якорь – это специальная строка, в которой могут иметься как буквенные символы, так и цифры. С помощью якоря ссылаются на определенное место на сайте, который открывается. Благодаря этому пользователь попадается не на главную страницу портала, а сразу в нужное место. Якорь располагается в единообразном локаторе сразу после знака решетки (#).

Кодировка в УРЛ

Для URL-адресов, как правило, используют множество кодировок. В случае если перекодирование исключено, можно воспользоваться только обозначенным количеством символов.

Для этого используют:

  • цифры от 0 до 9;
  • строчные буквы от а до z;
  • заглавные буквы от A до Z;
  • в том числе [ _ ];
  • [-].

Для того, чтобы не было ошибок, файлы, размещенные на сайте необходимо именовать в нижнем регистре. Кроме того, путь к ним следует указывать таким же образом и писать его маленькими буквами.

Кодирование данных в цифры, буквы и некоторые знаки латинского алфавита, связывают с тем, что физические устройства ограничены в передаче символов. Поэтому они могут распознавать только алфавитно-цифровые знаки.

Фото: кодировка символов

В Uniform Resource Locator подобное кодирование используется для того чтобы передать символы, которые изначально находятся в формате Unicode (UTF-8) в последовательность, состоящую из двух байт. После этого они будут записаны в шестнадцатеричном виде. То есть такой метод допустим только для русских букв.

Для того, чтобы разделить каждый байт применяется знак %. Используя данное кодирование, строка «книга» приобретет вид, такой как %D0%BA%D0%BD%D0%B8%D0%B3%D0%B0. Таким образом, букве «к» соответствует последовательность знаков %D0%BA. Такая кодировка всегда используется для того, чтобы указать путь в УРЛ к документам, папкам и различным файлам.

Например, такая ссылка: 

Преобразуется в такую: 

Применение ЧПУ

Подобный вид является крайне неудобным и непонятным для восприятия. Поэтому в таких случаях используется ЧПУ УРЛ. Иными словами – это человеко-понятный единообразный локатор.

При человеко-понятном Uniform Resource Locator слова, содержащиеся в ссылке, будут написаны транслитом. То есть русские буквы преобразуются в их аналоги, но только уже на латинице. Для этого используется метод сопоставления. В результате чего, каждой исходной букве будет подобрано несколько или один символ на латинском языке.

фото: человеко-понятные ссылки на страницы статей

Подобные ссылки, формирующиеся методом транслитерации, выполняются по специальным стандартам.

Из них существует:

  • стандарт ISO 9-95;
  • ГОСТ 16876-71.

Между ними разницы практически никакой не наблюдается. Однако есть некоторые отличия. Так, например, русская буква «х» при использовании стандарта ISO 9-95 преобразовывается в «х» — икс. Эта же буква при транслитерации через ГОСТ 16876-71 будет иметь вид «h» — аш.

Применим метод транслитерации для photographer.ru/всё для фотографа

В результате она будет иметь вид:

Динамические единообразные локаторы

Существуют также УРЛ, которые носят название динамические.

В подобных единых указателях ресурса могут присутствовать такие допустимые символы в адресе как:

Они необходимы для того, чтобы создать параметр структуры адреса. Такие URL образовываются из-за скриптов, которые имеются на Интернет-портале. Динамические ссылки могут выглядеть как:

Фото: динамическая ссылка

В случае если в адресе страницы содержится якорь, он будет иметь подобный вид:

Фото: адрес страницы с якорем

Таким образом, в строке образовался еще один параметр #231razdel, так называемый якорь. С подобным часто имеют дело создатели сайтов и контента. Якорь позволяет сразу же оказаться именно в той части портала, куда указывает этот параметр. Подобные Uniform Resource Locator нередко применяются для страниц, где содержится большое количество информации для упрощения навигации.

Канонические адресные ссылки

Канонический URL используется для оптимизации определения рейтинга сайтов с похожим или даже одинаковым содержанием, которые находятся на разных адресах.

Часто бывает, что одной странице присвоено несколько разных УРЛ-адресов.

Такими ресурсами могут быть:

  1. интернет-магазины;
  2. порталы, где применяется автоматическая система управления данными.

Дублирование универсальных указателей ресурсов происходит из-за распространения контента. Это означает что, одинаковый материал можно будет найти по разным ссылкам.

Как правило, дублирование происходит по таким причинам:

  • адреса страниц, на которых находится один и тот же товар могут отличаться, в случае если они были созданы в разных сессиях или по отличающимся запросам в поисковике;
  • в блогах установлена система, которая способствует сохранению нескольких отличающихся адресов для одного сообщения, если оно было размещено несколько раз в разных разделах;
  • сервер автоматически отображает одинаковое содержание для протокола https или же для субдомена www;
  • если в блоге находится сообщение, которое распространяется на других ресурсах.

Видео: Термин URL

Относительные и абсолютные ссылки

Абсолютная ссылка должна иметь стандартный вид УРЛ. В ней должны присутствовать:

  • протокол, используемый для передачи информации;
  • доменное имя ресурса;
  • путь к необходимому файлу.

Такие ссылки применяются, когда возникает необходимость сослаться на внешние Интернет-порталы. Для переходов внутри ресурса существуют относительные ссылки. Они более короткие и при этом не утяжеляют и не загромождают основной код сайта.

Как сделать URL ссылку

Рассмотрим пример, как создать универсальный указатель ресурса для блога.

Перед тем как создать блог, необходимо придумать для него уникальное название. Для того, чтобы зайти в него посетители ресурса должны будут ввести этот УРЛ в адресную строку браузера.

Советы как правильно создать ссылку:

  • адрес должен выглядеть подобным образом:

    Фото: пример адреса

  • выбирая единообразный локатор, следует помнить, что использовать для него можно: 
  1. только цифры;
  2. буквенные символы;
  3. дефисы;
  • так как на данном сайте уже существует множество разнообразных блогов, выбор адреса потребует времени и творческого подхода.

В случае если возникла необходимость изменить уже созданную УРЛ-ссылку рекомендуется выполнить следующие действия:

  1. зайти в личный аккаунт на портале blogger.com;
  2. попасть в раздел Настройки;
  3. нажать на Основные;
  4. в поле «Адрес блога» можно внести нужные изменения;
  5. после чего следует все сохранить.

При изменении своего адреса стоит помнить о том, что прежняя ссылка освобождается и её может использовать другой пользователь.

В статье было выяснено, что представляет собой единый указатель ресурсов. Также было дано его описание и применение.

proremontpk.ru

Что такое url-адрес: определение и структура

Приветствую всех читателей блога Александра Сергиенко! Сегодняшняя тема нашей статьи будет посвящена URL-адресам, собственно тому, что такое url-адрес сайта какую структуру имеет и ещё кое-что.

Эта статья будет первой в рубрике «Вопросы новичков», в которой я буду писать о наиболее простых вопросах, которые возникают у новичков. Ну, а эта статья может быть полезна не только новичкам, кое-что новое может узнать и «бывалый» блоггер.

Если подробно разбирать тему формирования урл-адресов, а тем более их более расширенную версию URI, можно встретить много сложностей в плане понимания, которые, в принципе, рядовому блоггеру и не нужно знать, разве  что для общего развития.


data-ad-client=»ca-pub-8243622403449707″
data-ad-slot=»1319308473″
data-ad-format=»auto»>

Нам же главное понять, на данном этапе, структуру создания урлов, что мы и будем делать в данной статье.

Определение

Как вы уже знаете поисковые системы индексируют страницы сайты по некоторому принципу, в результате данную страницу сайта можно найти при помощи поисковой системы по некоторому запросу.

Но это можно сделать, набрав, в строке браузера url-адрес страницы сайта. В общем, любая вебстраница (документ) любого Интернет-ресурса имеет свой уникальный адрес, который называют аббревиатурой URL (урл), а расшифровывается она как Uniform Resource Locator (определитель местонахождения ресурса). Разработал URL-адрес Тим Бернерс — Ли.

URL-адрес — это частный случай идентификатора  URI (Uniform Resource Identifier — унифицированный идентификатор ресурса). Но об этом мы подробно разговаривать не будем, так как нам все эти тонкости на данном этапе не нужны.

Итак, урл-адрес — это способ в Интернете указать на какой-либо Интернет-ресурс (его страницу, документ). Этот URL-адрес используется не только для работы по протоколу http и https, которые нас будут интересовать в данной статье.

Вот как будет выглядеть c протоколом передачи данных http:

http://int-net-partner.ru/papka/fail.html

После протокола передачи данных http следует «int-net-partner.ru» или же это может быть «www.int-net-partner.ru». Доменное имя входит в обозначение URL-адреса и оно может быть как с WWW, так и без него.

Если говорить о поисковиках, то сайты с WWW и без него для них являются абсолютно разными для них. И если не произвести склейку зеркал, то ссылочная масса будет делится на два этих зеркала.

Обычно склейку зеркал производит хостер, но это нужно обязательно проверить. Главное, что нужно сделать — это определить главное зеркало, которое будет индексироваться поисковиками, а также участвовать в ранжировании. Это можно сделать при помощи Гугл или Яндекс Вебмастер или прописыванием директивы Host в файле robots.txt.

На моём блоге главное зеркало — «int-net-partner.ru», «без WWW». Если же добавить к этому URL-адресу «WWW», то произойдёт автоматическое перенаправление на адрес «без WWW».

http://www.int-net-partner.ru/papka/fail.html

Хочу заметить, что склеить можно любые доменные имена. Но давайте рассмотрим Урл — адрес, расположенный выше. Путь до документа или файла (конкретного объекта) будет расположен за третьим слешем, в данном случае это «papka/fail.html«. В вышеприведённом примере в роли документа выступает «fail.html«, который находится в каталоге «papka«, который находится в корневой папке.

Также через урлы различные системы управления контентом передают GET параметры, которые добавляются в конец URL-адреса, после знака вопроса:

http://www.int-net-partner.ru/papka/fail.html?print=yes

Дело в том, что документы с GET параметром и без него, являются абсолютно разными для поисковиков, поэтому нужно вводить запрет в robots.txt, во избежание дублирования контента, за которое поисковики могут наложить определённые санкции.

К главной странице моего сайта можно обратиться по трём URL-адресам:

  1. http://int-net-partner.ru
  2. http://www.int-net-partner.ru
  3. http://www.int-net-partner.ru/index.php

И это опять же в плане дублирования контента очень и очень плохо. У меня же, при любом вводе Урла перенаправление идёт на URL-адрес такого вида: «http://int-net-partner.ru«

Как я уже говорил, перенаправление можно сделать при помощи 301 редиректа в файле .htaccess, или в настройках сервера вами или вашим хостером.

Структура URL-адреса

Вот так выглядет полный вид URL-адреса (блок-схема):

Обычно не используют логин, пароль и порт, хотя на некоторые сайты они могут понадобиться:

http://login:[email protected]/platniy-dostup.html

Иногда для входа на ftp-сервер может быть использован не стандартный порт, который отличается от используемого «по умолчанию» протокола. Тогда для доступа к такому ftp-серверу придётся вводить подобный урл:

ftp://login:[email protected]:6789/samoe-nujnoe/cimus

Кроме вышепреведённых примеров, в состав урл — адреса может добавляться якорь, который ставиться после символа «#» в конце урла. URL-адреса, которые содержат якоря, называют хеш-ссылками.

Якоря нужны для того, чтобы можно было перейти в нужное место страницы (там где проставлен якорь). Это удобно делать, если вы хотите сделать содержание своей статьи, тогда посетитель может перейти в нужную ему часть статьи, не просматривая её полностью. Чтобы это осуществить, нужно заранее проставить якоря (в нужных местах) внутри Html кода страницы (документа), затем нужно добавить название самого якоря к урлу страницы через знак решётки «#».

Перекодировка

А теперь давайте ещё поговорим о перекодировке URL-адресов. Вот, например, использование русских символов допустимо, но в этом случае произойдёт перекодировка этих символов, URL Encoding.

Вот пример:

http://int-net-partner.ru/оптимизация сайта/

А вот, что получилось после перекодировки:

http//int-net-partner.ru/%BA%B1%82%D0%BE%20%D0%BD%D0% B0%20%D0%BD%D0%BE%D0%B2%D0%B5%D0%BD%D1%8C%B0%BA%D0 %BE%D0%B3%D0%BE

Вот видите, не очень удобоваримый вариант. Поэтому, по мнению многих оптимизаторов, лучше использовать транслитерацию, так как это будет намного лучше в плане SEO оптимизации под поисковики.

P.S. 

Как вам статья? Рекомендую получать свежие статьи блога на e-mail, чтобы не пропустить много новой интересной информации!

С уважением, Александр Сергиенко

int-net-partner.ru

Что такое URL адрес — его структура и технические параметры

Аббревиатура URL расшифровывается как Uniform Resource Locator. В переводе это значит «единый указатель ресурсов». Детище Тима Бернеса-Ли, «отца» всемирной паутины, создан для упрощения структурирования данных в сети Интернет и приведения всех адресов к единому виду.

Принятое произношение: «у-эр-эл» или «ю-ар-эл». В разговорной речи допустимо произносить эту аббревиатуру как «УРЛ». В этой статье мы рассмотрим что такое URL, какова его структура и технические особенности которые необходимо знать любому веб-мастеру.

Схема и структура URL адресов

Что же такое URL? Иными словами, это путь до какого-то файла: HTML, видео, аудио, текстового и пр. Этим адресом обладают все документы, находящиеся в сети Интернет. Только с помощью URL сервер может обеспечить доступ к своим файлам для любого пользователя всемирной паутины.

Разумеется, существует стандарт. Он-то и определяет, как именно должен выглядеть URL к тому или иному документу. Этот стандарт используется не только для доступа к сайтам и файлам, по протоколу http и https, его же используют и при передаче файлов на сервер по протоколу ftp и в других протоколах. Но нас они в данном случае не интересуют.

Как указать url адрес к веб-ресурсам?

Вообще URL может содержать множество параметров. Но для простого обращения к определенному файлу лежащему в какой то папке вашего сайта необходимо задействовать лишь некоторые из них. Поэтому, например, чтобы получить содержимое определенного файла размещенного на данном сайте достаточно указать следующее:

http://webmastermix.ru/direktoriya/fail.html

Давайте рассмотрим все подробно:

  • http:// — протокол передачи данных.
  • webmastermix.ru — доменное имя, название узла (хоста) и дополнительные параметры.
  • /direktoriya/ — директория, в которой располагается нужный нам файл. Из этой части ссылки мы видим, что на сервере хранится папка direktoriya, которая содержит необходимый нам файл.
  • fail.html — файл с расширением «.html», он-то нам и нужен.

Как видно, папки и файлы разграничиваются знаком «/», который называется «слеш». Путь может быть длиннее. Кроме этого доменное имя может быть указанно с WWW и без WWW. Т. е. может быть: http://www.webmastermix.ru. Это не обязательный параметр, поэтому без разницы укажете вы его или нет необходимый вам файл все равно откроется. Для упрощения его лучше не использовать. И если ваш сайт доступен по двум адресам т. е. с WWW и без WWW, то лучше склеить эти URL и привести к одному виду, где WWW не будет использоваться. Как это сделать читайте в статье: Как настроить 301 редирект в htaccess и в скриптах — более 18 примеров использования.

В общем и целом, что такое url сайта, страницы или изображения ясно. А теперь немножко углубимся.

Структура URL-адреса

Общая схема (структура) URL-адреса следующая:

Каждый из этих параметров важен и имеет своё значение:

  • Схема – протокол передачи данных. Через него мы обращаемся к ресурсу. (http, https, ftp и т.д.)
  • Логин и пароль – эти данные в протоколе http, как правило, не указываются. Они определяют права пользователя на доступу к определенной странице сайта.
  • Собака (@) – специальный разделитель. Без логина и пароля его не указывают.
  • Хост – это доменное имя, иногда IP-адрес ресурса, к которому обращается пользователь. (webmastermix.ru)
  • Порт тоже указывается довольно редко. При обращении к сайту или любому файлу размещенному на сайте автоматически присваивается одно из значений – 80 или 8080.
  • URL-путь – путь к тому или иному файлу. (/direktoriya/fail.html)
  • Параметры – запрос с определёнными параметрами, которые передаются на сервер методом GET. Чтобы разделять параметры применяют знак &, например: ?параметр1=значение1&параметр2=значение2
  • Якорь – это уникальная строка, состоящая из букв и/или цифр. Она ссылается на определённую область открываемого веб-документа. С его помощью можно сделать так, чтобы пользователь попал не в начало HTML документа, а сразу к определенному месту.

Дополнительная информация касающаяся URL адресов

1. В URL адресах используются различные кодировки. Если перекодирования нет, использовать можно только определённое количество символов. Рекомендуется использовать символы [0-9],[a-z],[A-Z],[_],[-].

Чтобы избежать ошибок, разработчик должен именовать файлы сайта только в нижнем регистре и путь к ним указывать точно так же – маленькими буквами. Потому как, на юникс-подобных системах, а на них, чаще всего, работают веб-серверы, символы, написанные в разных регистрах, будут восприниматься машиной как разные. В Windows такого нет, но пренебрегать правилом, всё же, не стоит потому как если ваш файл назван в нижнем регистре, а в URL его название вы указали в верхнем регистре, то сервер не сможет его открыть.

Русские символы использовать можно, однако каждый русский символ будет проходить перекодировку (URL Encoding). И этой после перекодировки они будут выглядеть «страшно», ведь любой символ кириллицы будет закодирован с помощью 2 байт в UTF-8 в шестнадцатеричном виде. Разделяются символы знаком «%».

Например ссылка вида:

http://webmastermix.ru/всё для веб-мастера

Будет иметь вид:

http://webmastermix.ru/%u0432%u0441%u0435%20%u0434 %u043B%u044F%20%u0432%u0435%u0431%u043C%u0430 %u0441%u0442%u0435%u0440%u0430

Бороться с таким неудобством пытаются, однако, не слишком быстро. Поэтому, используя ЧПУ на своих CMS, лучше использовать транслитерацию (vse-dlya-webmastera). Ориентироваться будет проще, да и  для SEO все же наверное лучше.

2. Есть ещё такие URL — адреса которые называются динамическими. Такие URL содержат разные символы («?», «&», «=» и пр.) при помощи которых задаются параметры, кода мы рассматривали структуру URL уже упоминали про параметры, смотрите выше. Появляются такие адреса вследствие работы скриптов, размещённых на сайте. В таком случае, ссылка может иметь примерно такой вид:

http://webmastermix.ru/?page_id=1

3. Кроме этого URL страницы может содержать якорь (о нем тоже шла речь выше, когда рассматривалась структура URL) и иметь следующий вид:

http://webmastermix.ru/direktiriya/fail.html#1razdel

Как видите здесь на конце ссылки появился еще один параметр — #1razdel, который называется якорем ссылки. С этим вы так же часто будете сталкиваться при создании сайта и материалов. При помощи URL в котором указан якорь мы можем автоматически переместиться к той области HTML страницы где данный якорь указан. Очень часто такие URL используют на страницах с большим количеством контента, для упрощения навигации по такой странице создается содержание состоящее из таких ссылок.

Чтобы создать такую ссылку, нужно заранее, в то место HTML страницы, куда вы хотите перенаправлять по ней пользователя, вставить следующий HTML код:

После этого можно сослаться на эту страницу при помощи ссылки представленной выше.

Рекомендуем ознакомиться:

Подробности

Опубликовано: 11 Ноябрь 2013

Обновлено: 11 Ноябрь 2013

Просмотров: 54801

webmastermix.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *