Релевантный документ это – Релевантный документ — это… Что такое Релевантный документ?

По релевантности это как?

В разговорах о поисковых системах и принципах их работы, очень часто упоминают такое слово, как релевантность. И что же это такое и почему любой web-документ должен быть релевантным?

В широком смысле релевантность – это степень соответствия документа поисковому запросу. Таким образом, идеально релевантная страница должна полностью удовлетворять потребности ее посетителя независимо от полноты и точности используемого им поискового запроса.

Виды релевантности

Если отвечать на вопрос о том, по релевантности этот как, в полной мере, то стоит выделить основные виды данного понятия. Релевантность бывает:

  • Формальной. Именно данный тип релевантности используется алгоритмами поисковых систем для ранжирования сайтов в выдаче. Используя алгоритмический метод поисковик сравнивает образ запроса пользователей с образами находящихся в его индексе документов. Данная релевантность рассчитывается без непосредственного участия человека по заранее заданной формуле.
  • Содержательной. Такая релевантность вычисляется неформальным образом. Поисковые системы также используют такой метод расчета соответствия web-документов запросам пользователей, но только с целью оценки качества поиска. Для этого сотрудники поисковиков самостоятельно оценивают результаты поиска, анализируя соответствие документов поисковым запросам. Такие специалисты называются асессорами.
  • Пертинентность, заключающаяся в полном удовлетворении потребностей пользователя в информации. Это именно то, к чему должны стремиться не только поисковые системы, но и владельцы сайтов.

Релевантность документов сайта

Сортировка по релевантности это как «игра с поисковиком», в которой для того чтобы оказаться на вершине выдачи, необходимо применить комплекс различных методов и инструментов. Именно поэтому перед началом продвижения любого сайта необходимо подобрать (создать) наиболее релевантные поисковым запросам документы.

При этом необходимо отталкиваться от того факта, что релевантность web-документа зависит не только от качества оптимизации расположенного в его структуре контента, но и некоторых дополнительных факторов: возраста и PR домена, ссылочного веса страницы, поведенческих факторов сайта и прочих аспектов. Но, безусловно, контент всегда остается самым важным инструментом достижения идеальной релевантности.

Если вам необходимо поднять релевантность страниц вашего сайта, то наши специалисты смогут сделать все необходимое для этого, что позволит существенно увеличить показатели эффективности интернет-площадки.

comments powered by HyperComments Сделайте репост:

webseotop.ru

Понятие релевантности

Релева́нтность (лат. relevo — поднимать, облегчать) в информационном поиске — семантическое соответствие поискового запроса и поискового образа документа. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть не только оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.

Виды релевантности:

Содержательная релевантность

Соответствие документа информационному запросу, определяемое неформальным путем. Одним из методов для оценки релевантности является TF-IDF-метод. Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину.

Формальная релевантность

Соответствие, определяемое путем сравнения образа поискового запроса с поисковым образом документа по определенному алгоритму.

Пертине́нтность (лат. pertineo — касаюсь, отношусь) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя, независимо от того, как полно и как точно эта информационная потребность выражена в тексте информационного запроса. Иначе говоря, это соотношение объёма полезной информации к общему объёму полученной информации.

Функции оценки релевантности

TF/IDF

TF-IDF (от англ. TF — term frequency, IDF — inverse document frequency) — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции.

Мера TF-IDF часто используется в задачах анализа текстов и информационного поиска, например, как один из критериев релевантности документа поисковому запросу, при расчёте меры близости документов при кластеризации.

Структура формулы

TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом, оценивается важность слова ti в пределах отдельного документа.

,

где ni есть число вхождений слова в документ, а в знаменателе — общее число слов в данном документе.

IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Учёт IDF уменьшает вес широкоупотребительных слов.

,

где

|D| — количество документов в корпусе;

—количество документов, в которых встречается ti (когда ).

Таким образом, мера TF-IDF является произведением двух сомножителей: TF и IDF.

Большой вес в TF-IDF получат слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.

Пример

Если документ содержит 100 слов и слово «заяц» встречается в нём 3 раза, то частота слова (TF) для слова «заяц» в документе будет 0,03 (3/100). Один из вариантов вычисления частоты документа (DF) определяется как количество документов содержащих слово «заяц», разделенное на количество всех документов. Таким образом, если «заяц» содержится в 1000 документов из 10 000 000 документов, то частота документа (DF) будет равной 0,0001 (1000/10000000). Для расчета окончательного значения веса слова необходимо разделить TF на DF (или умножить на IDF). В данном примере, TF-IDF вес для слова «заяц» в выбранном документе будет 300 (0,03/0,0001).

PageRank

PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.

Формула вычисления:

PR(A) = (1-d) + d (PR(T1)/C(T1) + …+ PR(Tn)/C(Tn)),

где PR(A) — это вес PageRank страницы A (тот вес, который мы хотим вычислить),

D — это коэффициент затухания, который обычно устанавливают равным 0,85,

PR(T1) — вес PageRank страницы, указывающей на страницу A,

C(T1) — число ссылок с этой страницы,

PR(Tn)/C(Tn) означает, что мы делаем это для каждой страницы, указывающей на страницу A.

LexRank

LexRank – это лексический аналог функции ранжирования PageRank, используемой в поисковике Google.

studfile.net

Релевантная информация — это… Что такое Релевантная информация?


Релевантная информация

Релевантная информация [re­levant information] — та информация, которая необходима для решения данной задачи (например, задачи управления). Соответственно, иррелевантная информация — ненужная, посторонняя. Разделение между этими понятиями относительно: например, в ходе решения задачи сообщение, иррелевантное в данный момент, может стать в дальнейшем релевантным.

Экономико-математический словарь: Словарь современной экономической науки. — М.: Дело. Л. И. Лопатников. 2003.

  • Релаксационная последовательность
  • Ремиз

Смотреть что такое «Релевантная информация» в других словарях:

  • релевантная информация — Та информация, которая необходима для решения данной задачи (например, задачи управления). Соответственно, иррелевантная информация ненужная, посторонняя. Разделение между этими понятиями относительно: например, в ходе решения задачи сообщение,… …   Справочник технического переводчика

  • РЕЛЕВАНТНАЯ ИНФОРМАЦИЯ — информация, относящаяся к делу, собираемая по конкретному вопросу …   Энциклопедический словарь экономики и права

  • Релевантная информация для принятия решения — данные, отбираемые под конкретную задачу, лицо, цель и период времени …   Словарь терминов антикризисного управления

  • релевантная информация для принятия решения — Данные, отбираемые под конкретные задачу, лицо, цель и период времени. [http://tourlib.net/books men/meskon glossary.htm] Тематики менеджмент в целом EN relevant information, for decision making …   Справочник технического переводчика

  • Информация Релевантная — информация, актуальная для конкретной задачи, цели и период времени. Словарь бизнес терминов. Академик.ру. 2001 …   Словарь бизнес-терминов

  • ИНФОРМАЦИЯ РЕЛЕВАНТНАЯ — информация, относящаяся к определенному делу, собираемая под конкретную задачу, уместная. Райзберг Б.А., Лозовский Л.Ш., Стародубцева Е.Б.. Современный экономический словарь. 2 е изд., испр. М.: ИНФРА М. 479 с.. 1999 …   Экономический словарь

  • Информация — [information] основное понятие кибернетики, точно так же экономическая И. основное понятие экономической кибернетики. Определений этого термина много, они сложны и противоречивы. Причина этого, очевидно, в том, что И. как явлением занимается… …   Экономико-математический словарь

  • информация (в кибернетике) — Основное понятие кибернетики, точно так же экономическая И. основное понятие экономической кибернетики. Определений этого термина много, они сложны и противоречивы. Причина этого, очевидно, в том, что И. как явлением занимается много разных наук …   Справочник технического переводчика

  • ИНФОРМАЦИЯ РЕЛЕВАНТНАЯ — (см. РЕЛЕВАНТНАЯ ИНФОРМАЦИЯ) …   Энциклопедический словарь экономики и права

  • информация релевантная —    информация, относящаяся к делу, собираемая под конкретную задачу …   Словарь экономических терминов

economic_mathematics.academic.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *