Релевантные запросы: Релевантность страницы: что это такое и как ее повысить? 7 сервисов для проверки позиций в поиске

Содержание

Релевантность страницы — Анализ релевантности страницы

Представители поисковых систем, в частности Google, уверено говорят о скорых изменениях в алгоритмах ранжирования, которые должны полностью изменить как методы оптимизации, так и намного снизить спам в выдаче.

Поисковые системы выдают страницы исходя из их релевантности запросу. Давайте узнаем, какому количеству запросов может быть релевантна какая-нибудь страница.

Не будем учитывать повторяющиеся слова и будем считать, что комбинация из нескольких слов читается только в одном направлении — слева направо для русского языка, например. Также не будем учитывать близость расположения отдельных слов из фразы друг к другу. Это все учитывается ПС, но чтобы найти количество релевантных слов, можно для простоты поступить и так.

Анализ релевантности страницы: сколько релевантных запросов содержит одна страница?

Считаем:

В документе из 1000 слов можно найти 996 возможных 5-словных комбинаций, 997 4-словных, 998 трехсловных и 999 двухсловных. То есть всего в 1000 словном документе можно найти 3990 возможных комбинаций от одного до пяти слов, которым данный документ релевантный. В общем можно подсчитать количество ключевых слов так: посчитать количество слов в документе, потом умножить количество слов на число слов в самой длинной комбинации (5 в нашем примере), потом отнять сумму чисел (1..5) плюс количество слов от первого числа. Например, в 1000 словном документе для запросов от 1 до 5 словного имеем 5*1000 — (1000+(1+2+3+4))=3990.

Конечно, среди таких запросов могут оказаться дубликаты. Чтобы учесть повторяющиеся слова, разделим полученную цифру на два. То есть наш 1000 словный текст релевантен 1995 1-5 словным комбинациям. Это число не точное, а приблизительное. Но закономерность понятна: мы не можем оптимизировать 1000 словный текст под почти 2000 запросов.

Мы можем органичиться не 5-и словными, а например 10-словными запросами. Тогда 1000 словная страница будет релевантна максимум 8955 комбинациям слов (от 1 до 10), то есть по нашим приближениям около 5000 фраз. Хотя 1000 слов — довольно длинный текст. Но даже если на странице 250 слов, то она релевантна 1103 комбинациям от одного до десяти слов.

Традиционное SEO гворит об оптимизации страницы под один-два, максимум три кейвуда. Некоторые оптимизируют под 5-10 кейвудов. Но если вы создаете 250-словный текст, то он релевантен приблизительно 1100 запросам. Почему бы не оптимизировать под все эти запросы?

Что остается делать поисковику? Правильно, — выделить ключевые слова из наиболее видимых элементов на странице — тега title, заголовков h2,h3 и далее, выделяющихся сочетаний слов (теги b или strong), а еще и из урла. Это что касается оптимизации текста.

Ситуация с огромным количеством релевантных запросов для любой страницы привела к появлению внешних факторов ранжирования, то есть ссылок.

Часто говорят о том, что главное для продвижения — ставить ссылки со страниц одной темы на страницу по той же теме, то есть релевантные одному и тому же запросу. То есть говорят, что Гугля каким-то образом придает больший или меньший вес ссылке исходя из контента страниц. То есть если страница “А” про лошадей ссылается на страницу “Б” про лошадей и страницу “В” про кошек, то ссылка с “А” на “С” весит меньше, чем с “А” на”Б”. При этом неважно, что каждая из страниц релевантна более чем 1000 запросов.

Имеются ввиду ссылки с тематических сайтов. Для Яндекса это действительно актуально — тематика определяется для сайтов из Яндекс.Каталога, и ссылки с сайтов той же тематики дают бонус при ранжировании сайтов каталога. Для общего веб-поиска даже в Рунете этот закон уже не действует, потому что роботу сложно определить тематику сайта. Да и Google в своих новостях включает новости в несколько категорий. Почему? Потому что каждая страница релевантна более чем 1000 запросам.

Слежение за тематичностью ссылок — это потеря времени, потому что никак не относится к релевантности. Релевантность для поисковой системы — совсем не то же самое, что релевантность для человека. Тема этой статьи — теория поисковой оптимизации, но она будет релевантна и слову “лошадь”, поскольку я использую это слово в тексте. И по запросу о лошадях эта страница будет включена в результат поиска, хотя не имеет к этой теме никакого отношения.

Единственный действующий механизм в этом случае — анкоры ссылок. То есть не просто рекомендация страницы со стороны другого сайта, а ссылка на него с соответствующим кейвудом.

Несовершенство поисковых систем обусловлено ограничениями их алгоритмов. Релевантность определяется не ссылками, а текстом. Одной из причин соединения основного и дополнительного индексов Гугли стал как раз тот факт, что именно содержание страницы имеет главное значение для релевантности, а не количество входящих ссылок. Если эти заявления — правда, то в скором времени ожидается смещение приоритетов с ссылочного ранжирования на текстовое.

Так что как бы Google ни учитывал историю поиска и остальные более 200 факторов (как говорят представители поисковика) при ранжировании, все равно текст остается основным фактором определения релевантности страницы. Поставьте ключевую фразу в титл, заголовок, пару раз в текст, в урл, проставьте ссылки с нужными анкорами — и будет вам топ. Теоретически.

Программный комитет еще не принял решения по этому докладу

Андрей Аксенов: Добрый день! Меня зовут Андрей Аксенов, я специалист по поиску в Sphinx

Сегодня я буду рассказывать про качественный поиск. Доклад будет про то, что можно сделать для улучшения качества поиска на вашем сайте в меньшей части, в большей части. Как устроена в современном мире загадочная штука под названием «релевантность», как она считается, до чего дошла (доросла) наука о веб-поиске.

Могу пока заранее ответить на вопросы какие-нибудь!

Реплика из зала: Список литературы посоветуйте.

Андрей Аксенов: Список литературы посоветуйте… Литературы для чего?

Реплика из зала: По работе с поиском…

Андрей Аксенов: Поиск – это гигантская штука. Тем не менее, список литературы попробую посоветовать. Если есть желание почитать про базовые концепты – это одно, про современные инновации на тему качества – это другое, обработка естественных языков – третье и так далее.

Это гигантская наука. В год защищается немало диссертаций и делается немало публикаций. Есть несколько хороших книжек… Я не читал ни одну, к несчастью. Говорят, что работа Маннига «Introduction to Information Retrieval» – хорошая. 

Зачем нужен этот доклад?

Скорости растут (в смысле, скорости «железа»). Как ни удивительно, со временем выясняется, что скорость  поиска сама по себе, блин, для 99 % людей не важна. Реально не важна! Какая разница, 300 запросов в секунду с ядра или 150 запросов в секунду с ядра, если ядер все равно 16, а пользователей на сайте все равно 10 в день? Это во-первых.

Во-вторых. К несчастью, «свободные» сервисы, которые не берут с пользователей денег, чтобы делать веб-поиск (типа Google, Yandex, Bingo и так далее) приучают людей к достаточно качественному поиску. Потребность есть. 

«Из коробки» с любой системой получается не очень. Более того, я убежден, что «из коробки» не может получиться хорошо. В любом случае, если у вас есть конкретная ниша, нужна конкретная предметная область – конкретный магазин с конкретной спецификой (но необязательно магазин), вам нужно специализироваться под эту область. Нужно всячески «тюнить» свой поиск на предмет релевантности и не только.

Краткий выборочный опрос показал, что мало кто понимает, что такое релевантность, а тем более – что можно делать помимо нее, что относится к магической релевантности, а что нет. Вот поэтому и появился мой доклад, да и в целом это интересная тема.

Все началось с коротенького блиц-доклада на прошлом РИТ меньше года назад. Доклад успел вырасти до 40 с чем-то минут. Ну, поехали!

Что такое релевантность?

Многие думают, что есть некая магическая функция релевантности, которую ты посчитал, и у тебя все хорошо. Неправильно думать, что она, в принципе, в природе есть. Это не совсем так.

Так называемая релевантность возникает ровно в тот момент, когда кто-нибудь где-нибудь что-нибудь ищет и находит, к несчастью своему глубокому. Очень плохо, если это новинки. Надо понимать, что у меня прицел сбит, потому что я разработчик этого всего добра.

Мне глубоко неприятно, когда кто-нибудь что-то ищет и находит, потому что в этом случае необходимо работать над результатами, ранжировать их и тратить на это много ресурсов. Это не круто!

Самая лучшая оптимизация – это работа, которую ты не делаешь. Самый лучший запрос – пустой. Ну, или хотя бы который не дал результатов. Если он их все-таки нашел, то приходится работать – в частности, ранжировать, выстраивать их по-разному.

Но ранжировать их сложно. Попробуем разобрать один случайный запрос. Это крайне сложно – этим никто в мире не умеет заниматься: человек не так устроен. Тем не менее, попробуем поставить себя на место пользователя, который что-то искал.

Вот один случайный запрос – я выбрал вот такой. К несчастью, он на английском (может быть, наоборот – к счастью) «battle ship».

Что имел в виду человек?

Может быть, он искал вот этот корабль: информацию по поводу того, когда его, наконец, спустят на воду. Или он интересовался правилами игры «Морской бой», или может быть, искал что-то более футуристическое. Может быть, он вообще сдалал опечатку и совсем не это имел в виду… Копирайт корпорации «Google» – отличная реклама. Я очень люблю.

Шокирующая истина

Внезапно, шокирующая истина! Запрос может быть одним и тем же, но разные люди могут хотеть найти разное. Кто-то правила «Морского боя», а кто-то просто не знал, что эта штука на английском называется не «battle ship».

Что же это за шокирующая истина? 

Нет никакой релевантности! Нет никакой ложки! Нет никакой объективной релевантности, если угодно, данной нам в ощущениях, существующей как идеальный концепт в платоновском мире мета-идей.

Так называемая релевантность: это всегда «красота – в глазах смотрящего». Для разных людей одному и тому же запросу релевантно совершенно разное. Хуже того – в разные моменты времени для одного и того же человека этому запросу может быть релевантно совершенно разное. 

Семантика коротенького полнотекстового запроса меняется в зависимости от того, пьян я или не пьян, в каком городе нахожусь и что конкретно ищу. Тоска!

Почувствуйте мою боль: мы делаем поисковый движок, и ранжировать результаты поиска нам все равно придется. Что же делать? Как же быть?


Умные люди решили, что у нас в момент полнотекстового поиска все равно ничего нет, кроме документа и разнообразных свойств этого документа. Я специально использовал слово «свойств», потому что его можно толковать очень широко.

Часть из этих свойств – это текст документа, с одной стороны, и текст запроса, с другой стороны.

Мы можем посмотреть на запрос, на текст. Посмотреть, какие конкретно слова совпали, сколько их совпало, насколько частотные это были слова, где они совпали. Рядом они находятся или далеко, в точности они совпали или после того, как к ним применили жесточайшую морфологическую обработку. Еще много всего приходится «выжимать» из этих самых слов запроса и документа.

Все это называется по науке «полнотекстовыми факторами».

Очередная слегка шокирующая истина

Во многом всё и всегда базируется ровно на одном факторе под названием BM25. Функция ВМ25 выглядит так. Совершенно несложная для тех, кто учился на технических специальностях. Гуманитарии, поверьте, она несложная.

Грубо говоря, тут по всем терминам, по всем ключевым словам запроса всего-навсего суммируется некая магия, которая растет, если слово редкое, и если слово встречается в документе часто. Соответственно, если слово слишком частое, то значение меньше. Если встречается в документе мало, то показатель падает.

Эту функцию 30 лет назад придумали. С тех пор никто не может придумать ничего, что концептуально лучше. Все равно на выходе получается ВМ25 и вариации на ее тему. Это, конечно, не основной, но один из очень важных, сильно влияющих на все подряд и постоянно использующихся в любом поисковом движке факторов. От него никуда уйти не удается.

Вообще-то факторов много. Наука о веб-поиске дошла до того, что надо учитывать больше факторов. Не только внутритекстовые факторы, которые считаются по тексту запроса и документа, но и факторы внетекстовые, которые привязаны к самому документу.

PageRank снаружи посчитали на основе того, сколько входящих ссылок на документ существует и насколько они авторитетны. Насколько длинный документ? Давно ли домен зарегистрирован? Сколько входящих ссылок на эту конкретно страницу, сколько на ней исходящих ссылок.

Очень важный фактор – определение того, порносайт это или нет. Очень разные результаты поиска надо показывать: особенно картиночные – вообще разные.

Предыдущий слайд – это сильное преуменьшение, потому что современный веб-поиск (подчеркиваю, именно масштаба веб) очень сложен. Люди, которые этим плотно занимаются, пользуются не десятком факторов, а реально тысячей. И все они учитываются в поиске.

Еще немаловажное отступление для тех, кто все-таки будет читать литературу. В англоязычной литературе обычно используется слово «сигнал». Не буду настаивать, что оно типичное… Может использоваться и слово «фактор», и слово «сигнал». Я мало читал или просто за статистикой не следил – определенного мнения не составил.

Итак, что мы выяснили?

У нас есть некоторое количество полнотекстовых факторов, которые мы считаем по тексту документа и запроса. У нас может быть некоторое количество нетекстовых факторов, которые мы просто знаем про документ (длина, «возраст» домена, PageRank, прочий «фарш»).

Что делать дальше? Что и зачем мы считаем, когда хотим посчитать магическую релевантность? Нам нужен ответ на несуществующий, субъективный вопрос – релевантен документ или нет, интересует он пользователя или нет.

Как положено в науке, мы считаем некую целевую функцию. На входе в нее много чисел, которые характеризируют все перечисленные факторы, которые поиск решил использовать. На выходе она должна сворачивать все в одно число.

Очередная небольшая (и поэтому без картинки) шокирующая истина заключается в том, что конкретные числа, которые вам выдаст функция релевантности, вообще не важны. Абсолютно! Умножь их все на 10, подели на 100 – что изменится? Ничего. Важен порядок документов, который порождается функцией релевантности. То есть, загадочная функция релевантности вообще не важна.

Значение релевантности вашей главной страницы в Yandex – 123.45 при поиске по конкретному запросу. И что? Абсолютное значение неважно совершенно – важен порождаемый порядок.

Есть и вторая вещь, которая важна, потому что надо работать с качеством. У нас есть субъективная функция непонятного вида – ничего с ней не сделать. Есть порядок, который этой функцией порождается. Но все еще непонятно, с чем работать. Непонятно, к чему применять научный подход, когда расчехлять калькулятор и что на нем считать.

А вот что. В большой науке про релевантность все начинается с человеческих оценок качества. Они субъективны и, к глубочайшему моему несчастью, никакими другими быть не могут.

Не существует, не существовало и не будет существовать программы, которая возьмет запрос и документ и скажет: «Это релевантно!»  Подчеркиваю: не просто не существует – это субъективно, это факт.

Что мы тогда делаем? Правильно: не можем написать программу, не можем построить робота – сажаем за работу миллиард китайцев. Живые люди сидят и кликают, оценивают пару «запрос-документ», ставят им оценки.

Иногда это просто бинарные числа 0 и 1. Иногда это оценки по шкале от 2 до 5, как в советской школе, или от А до F, как в американской. Для простоты давайте дальше говорить о бинарных оценках: релевантны или нет.

Конечная цель, про которую не надо забывать ни на секунду, – зачем мы все это делаем? Чтобы уметь сравнивать два разных отклика: одной поисковой машины или двух разных откликов двух разных поисковых машин, или двух разных версий одной и той же поисковой машины. И считать цифры, которые хоть что-то нам позволяют про это так называемое неуловимое субъективное качество сказать.

Пример. Кто-то поискал в Google слово Sphinx. Нашел вот что. Поскольку поиск открывал нормальный человек, который не интересуется этим всем – поиском и системой генерации документации Python – ему без затей подавай египетского сфинкса (два документа про это).

Второй и третий результат для него релевантны (подсвечены), а остальные нет.

Другой пример отклика, другая поисковая машина. Это придуманный пример, если что. Результаты я, правда, из Google взял, а как их «ремиксанул», не помню. Другой пример: то же самое, но результаты выше. Интуитивно понятно, что это лучше, потому что человек, который что-то искал, нашел это в первых рядах.

Еще один пример отклика. Результаты еще сильнее поменялись местами. Один совсем вверху (№ 1), а второй релевантный сполз вниз. Как быть? Как сравнивать эти три отклика, что с ними делать?

Метрики качества

Наука разобралась, что с ними делать. Вводятся так называемые метрики качества: их десяток уже точно придуман. Есть ряд совершенно примитивных метрик, которые вообще не смотрят на порядок документов: Precision и Recall – это как раз они. Это может звучать страшно, но на самом деле, когда начинаешь смотреть на формулы и вдумываться в них, ничего страшного в этом нет.

Precision

Precision – это всего-навсего количество релевантных результатов в показанном пользователю «куске» результатов поиска. Во всех этих трех случаях Precision одинаковый. Он равен 0,5. Два результата из четырех релевантны.

Recall

Recall тоже довольно примитивная штука. Мы знаем или предполагаем, что всего в индексе есть 10 релевантных результатов, а поиск каким-то образом возвращает только 8. Значит, Recall 80 % (0,8). Ничего страшного.

Это недостаточно: никак не различаются такие результаты, где порядок разный. Чисто интуитивно пользователю всегда приятнее, когда у него нужное идет 1-м результатом, а не 10-м. Ни с помощью Precision, ни с помощью Recall отличить два таких результата нельзя. Приходится что-то еще придумывать.

Есть стандартные метрики Average Precision, DCG (Discounted cumulative gain), BPREF, pFound от Yandex.

Я не буду никого утруждать точными формулами. Кому сильно интересно, почитает сам. Полезно думать, что, по большому счету, это просто взвешенная свертка нулей и единиц. Вес результата – 0 либо 1 в первой позиции умножается на большой коэффициент. Во второй – на коэффициент поменьше, и так далее. Это примерно и будет верно.

Мы все еще не можем ничего сказать про общую картину. Ну, хорошо – один запрос кое-как научились оценивать, но запросов много, и людей много. По одному запросу никогда нельзя делать никаких выводов.

Есть люди, которые пишут в Интернете: «А-а-а, я поискал это в Yandex и в Google (один запрос – прекрасно), и Google выдал сильно худший результат». Либо наоборот: «Yandex выдал мне сильно худший результат».

Они, мягко говоря, некомпетентны в вопросах оценки качества поиска. Делать что-то на основе одной субъективной (твоей личной) оценки одного запроса – это полный маразм. Это делается по десяткам, сотням тысяч оценок, а то и миллионам уже.

Чтобы это сделать, оценивается куча запросов! Оценивается куча документов по куче запросов. Усредняется куча откликов. Усредняется классическим образом: какую-нибудь метрику типа Average Precision считаем для одного запроса, для другого, для третьего, для миллиона. Все складываем вместе, делим.

Ура, ура! Что произошло? Только что из чудесных ноликов и единиц, которые пользователь проставил каждому документу, который мы ему отдали по запросу, мы каким-то образом получили магическую цифру.

Неважно, какую. Может быть, Mean AP, может, средний pFound, может быть, нижний доверительный 95%-ный диапазон для нормализованного DCG. Совершенно неважно, какую, но мы получили, наконец, заветную цифру (заветную для любого научного работника), которая кое-как моделирует среднее «счастье пользователя». Мы высчитали нечто, с чем можем работать, что можем оптимизировать.

Так называемая несуществующая релевантность проходит крайне извилистый путь.

Все начинается с мега-функции, которая по каким-то факторам и числам, привязанным к документу (или к документу и запросу), берет и считает магическое число. При помощи магического числа под названием «релевантность» документы, найденные в отклике, меняются местами.

Если мы вдобавок скрестим это с пользовательскими оценками и посчитаем несколько метрик (сверток реальных) вместо того, чтобы пытаться работать с нолями и единицами (все свернем в одно конкретное число), только в этот момент у нас появится возможность оценивать именно качество поиска. Так устроена наука.

Вот она – релевантность, будь она неладна.

Упрощенный вид функции. На самом деле переменных больше, чем две, поскольку это функция не от двух аргументов, а от двухсот. Но нарисовать график в двухсотмерном пространстве сложно. Увидеть такой график тоже не получится.

Очередная шокирующая истина. Этот график – иллюзия… Точнее, иллюзией является, что вообще есть какой-то график. Это субъективная функция… Аналитически придумать некую волшебную формулу от двухсот аргументов для функции, которая просто существует, невозможно.

Что делают, когда формулу придумать невозможно?

Наша формула гигантская, несуществующая и непонятная, да и данных очень много, поэтому у ученых возникает идея: давайте задействуем не человека, а машину – используем так называемое «машинное обучение».

Скажу буквально два слова о машинном обучении. Для любых практических, низменных, примитивных целей можно считать, что это стандартная регрессия. Вот нам дали облако точек, а мы к нему как-то подогнали функцию известного вида, подсчитали коэффициенты. Только на гигантском вагоне стероидов!

От регрессии до современного машинного обучения путь очень длинный.

Можно в первом приближении думать, что нам дали гигантскую матрицу оценок для запросов, мы провернули этот «фарш» через «мясорубку» функции релевантности, порядка запросов, метрик качества и так далее. Потом мы попытались подобрать регрессии такие коэффициенты, которые есть в нашей функции релевантности, проходящей через «фарш» оценки. Засунули в обычную линейную или нелинейную регрессию.

В первом приближении это хорошая ментальная модель. Можно думать, что оно так и работает. Хотя на самом деле, конечно, не так.

Что именно регрессируется?

Оптимизируем… Целевая функция… Можно оптимизировать ту самую среднюю «метрику счастья», которая имеет высоконаучный вид, но на самом деле считается, грубо говоря, в 20 строк кода Python (может быть, в 3).

Что нам известно? Что есть на входе? Где наши Х, где наши Y?

Y – это целевая функция. Тот самый MAP. Известны оценки, которые люди поставили. Известны факторы – числа, описывающие документ.

Если кто-то помнит со студенческих лет, какую задачу решает регрессия? Она нужна, когда нам известен вид функции, но неизвестны коэффициенты. Мы подгоняем коэффициенты так, чтобы отклонение было минимальным.

Но с релевантностью есть одна проблема. Поскольку это неуловимая субъективная функция, у нее и быть не может никакого вида в принципе. Как написать уравнение для того, чего не существует? Задача очень сложная. Даже вид функции, которую мы хотим искать, неизвестен.

Как всегда со сложными задачами – шокирующая истина. Она в современной науке решается крайне просто.

Берем и тупо приближаемся к кусочно-линейной функции. Отличное решение! Это мне по нраву. Работать с линейными функциями всегда просто. Понятное дело, что это кусочно-линейная функция в двухсотмерном векторном пространстве, но какая разница?

Зачем все это вообще? А вот зачем!

Как это ни удивительно, если вы действительно хотите заниматься качеством своего поиска (в частности, находить ту самую волшебную релевантность), вам необходимо знать, что есть такая штука, как метрики. Надо их считать. Есть такая штука – машинное обучение. Можно им пользоваться.

Проверять качество поиска вручную становится нереально в настолько маленьких масштабах, что аж страшно. Ну, сами представьте – вы сделали какое-то изменение в формуле ранжирования. И чего? Вводим один запрос – ну, блин, на глаз вроде лучше стало. Вводим второй запрос – блин, а тут хуже. Вводим третий – так, ладно: тут чего-то улучшилось. Счет пока 2:1.

Потуги проверять качество вручную без того, чтобы считать конкретные численные метрики и усреднять их, «умирают» уже при 5-10 оцениваемых запросах. Допустим, вы пытаетесь считать качество на очень маленькой выборке запросов… Пусть вы пытаетесь считать его не по принципу «мне кажется, стало лучше», а аккуратно и с конкретными цифрами, но очень быстро наступает момент, когда ничего невозможно посчитать вручную.

Уже начиная всего лишь с 5 запросов, с 10 документов на запрос, возникают трудности: это, извините, уже 50 цифр, 50 нолей и единиц, которые надо перемножить с заранее проставленными оценками. Считать вручную невозможно. Так что метрики нужны сразу, если мы хотим этим заниматься.

Следующий момент касается машинного обучения. Оно нужно для подгона формулы релевантности. Эта формула может быть крайне простой, а может быть крайне сложной. Но вручную их подгонять все еще можно в отличие от проверки результатов, которые эта подгонка дала. Саму подгонку вручную крутить можно.

Хорошо, один коэффициент поменяли, посмотрели, прогнали эксперимент. На мелких формулах однозначно работает поиск вручную. В компании Google говорят, что они свою формулу тоже не совсем роботом обучают. Не знаю… Там просто очень много сигналов, поэтому как-то страшно. Может, они наняли миллиард китайцев, опять же.

Но машинного обучения тоже не стоит сильно бояться, поскольку никто в современном мире не заставит вас взять и написать 20 тысяч строк кода, которые дадут плохой результат. Современный мир устроен иначе. Уже наверняка все сделано для нас. Можно просто воспользоваться математическим или статистическим пакетом в Open Source.

Можно посчитать в нем регрессию, прогнать в нем какой-то другой алгоритм машинного обучения, реализованного в этом пакете, попробовать загнать свои результаты в свой же поиск. После этого можно прогнать их со своими оценками качества. Как ни удивительно, несмотря на сложные формулы, концепты и так далее, в итоге быстро и просто удастся понять, стало лучше или нет.

Итоги первой части

В мире большого веб-поиска есть релевантность. В чем ее особенность? Очень много документов, высокие требования к качеству, нагрузки дикие (очень много запросов).

Начинается все с оценок качества. Все они субъективны. На входе много всякого «фарша», поэтому вручную делать ничего невозможно, исключительно машинным обучением. Цель всех нудных манипуляций – это получить на выходе метрику «счастья пользователя» и максимизировать ее.

С точки зрения простого человека, у которого блог на несколько тысяч постов, все по-прежнему начинается с субъективных оценок. Только их существенно меньше, поэтому все влезет в статистический пакет на одной машине.

Не нужно реализовывать машинное обучение, которое смасштабируется на кластер из 1000 машин. Можно просто подгонять руками формулу, но при этом даже простому человеку с блогом на 1000 постов метрики качества все равно придется считать и проверять автоматически, потому что здесь сложность растет очень быстро. Считать метрики качества вручную никакой возможности нет.

Конечная цель та же самая: вводим какую-то «метрику счастья» и максимизируем ее.

Это была довольно скучная теория. Теперь будет самопиар. Я расскажу, что у нас уже есть внутри Sphinx, что мы недавно сделали и что вы можете сделать, пользуясь нашими фичами. Это самое интересное.


Подзаголовк секции: «Как все хорошо у них, как все плохо у нас».

Примерно вот так. Может быть, даже еще хуже, потому что фотографии с «Boeing» и маленькой радиоуправляемой моделью я не нашел. 

В веб-поиске используется куча сигналов и факторов. Есть куча типичных оценок, которые накоплены компанией за годы работы. Элитным «state-of-the-art» решением находится магическая целевая функция релевантности – большая и очень сложная. На меньших масштабах у вас мало факторов. Зачастую оценок качества у вас просто нет.

Никто никогда не задумывался над тем, чтобы посидеть и вбить в поиск десяток запросов, проставить оценки документам. Хотя это можно сделать за полдня, за пару часов.

Функция ранжирования в лучшем случае подобрана методом с сурово звучащим названием «ad-hoc». В переводе на русский – «методом левой пятки». Покурили, подумали: «Наверное, лучше будет. Давайте вобьем эту формулу!». – «Откуда мы знаем, что лучше будет?». – «Да мы не знаем! Просто формула нравится – давайте ее вобьем». Ну, что с них взять?

Вот и все отличия. Однако не все так плохо, как казалось. Это не значит, что «ad-hoc» – это сам по себе совершенно нерабочий метод. Подгонять параметры «левой пяткой» с оглядкой на метрики качества все же можно.

У вас и у нас не тот масштаб, что у Google: меньше оценок и документов, не такая нагрузка. Все суммарно дает отличие в несколько порядков. Даже реально подобранная «левой пяткой» формула может вполне неплохо работать. Но чтобы она начинала работать лучше, вам все равно надо измерять качество. Не надо бояться – до масштаба Google все равно не дорастем, но в своей деревне можем вполне хорошо и успешно справиться.

Живой пример

Это результаты, которые дает решение, основанное на Lucene. Научные бумаги сложно читать – все в них крайне запутано. Никогда не поймешь, что имел в виду автор, что он написал, чтобы диссертацию сдать. Постоянно этот конфликт!

Тем не менее, смотрим на график. Физический смысл графика: чем выше линия, которую рисует то или иное решение, тем лучше. Это как раз точность результатов поиска, количество релевантных результатов поиска на той или иной глубине погружения в набор результатов (англ. result set). Она далеко не на первом месте, но, слава Богу, и не на последнем.

Соревновались они при этом с коммерческими решениями – с тем же Yandex, по-моему, тоже.

Как мы это делаем?

Как и положено – «левой пяткой». У нас есть несколько встроенных функций ранжирования: API-метод такой. Можно выбирать его «на лету» буквально в одну строчку. Для каждого запроса брать свой. Есть одна «наколка» техническая: метод ранжирования работает только в том случае, если вы включили режим синтаксиса запросов, поэтому через API надо вызывать еще вот такой метод.

Чего можно хотеть от Sphinx?

Какие рамки рассмотреть, если вы хотите быстро и просто внести однострочное изменение в код приложения и, может быть, улучшить качество.

С качеством у нас связано ровно 3 ранкера – все они уже перечислены. Они, как я и говорил, «пробиты» в код (hardcode). Других встроенных ранкеров, которые вы можете включить в одну строку и которые при этом заранее есть «в коробке», может быть, уже и не будет.

Пункт № 3. Появился мега-функционал, который мы давно сделали и выпустили в релизе.

Это вещь под названием «expression ranker». Выглядит она буквально вот так. Вот синтаксис, с помощью которого ей можно воспользоваться через SphinxQL-интерфейс. Подсвечена строчка, в которую вы забиваете свою формулу для ранжирования со всеми факторами, которые вам Sphinx посчитал и показал. Считаете релевантность, как можете и хотите. 

Кстати, формула, которая туда «вбита» сейчас – это та самая примитивная формула из двух факторов, которую использует Sphinx. Два фактора – это много лучше, чем один, который использует чуть ли не каждый первый поисковик.

Да, этим настолько просто пользоваться. Действительно, это очень простая формула ранжирования по умолчанию. Однако формулы, которые вы можете делать, могут быть гораздо более сложными. Показывать два фактора через этот интерфейс было как-то совсем стыдно, поэтому мы создали много разных факторов, которые сами придумали, да и пользователи попросили. Делать новые факторы нам нетрудно, и вам будет нетрудно их использовать. Если каких-то не хватает, то обращайтесь.

Этот слайд про технические подробности, думаю, не буду его рассматривать. Лучше задайте мне потом вопросы.

Наш самый сложный встроенный ранкер выглядит так. Концепт при этом все равно прост, как дрова. Но формула немного мутная. Смысл – точное совпадение полей – мы «бустим» на самый верх. Более точное совпадение фразы мы «бустим» в связи со степенью совпадения фразы. В самом конце используем стандартный фактор ВМ25, потому что нельзя игнорировать 30 лет истории. 

Я совершенно уверен, что теперь вы можете сделать поиск значительно лучше, чем в Lucene. Ранжирование значительно лучше, чем встроенное в Lucene в Sphinx, неважно где. Интерфейс доступен, факторы описаны, экскурс в теорию был. Дерзайте! Те, кому интересно этим заниматься, имеют все возможности и удобства.

Что еще можно делать с качеством поиска, кроме расчета релевантности?

Это очередная шокирующая истина, на самом деле. Качество поиска, вообще говоря, это не только и не столько релевантность. Мы ищем магическую функцию, которой считаем числа, переставляем результаты, которые уже видит пользователь.

Чудесной релевантностью дело же не ограничивается. Еще желательно корректировать опечатки. Еще есть такое понятие, как «занудность» поиска. Классическая ошибка любой поисковой формы: «А давайте поищем все слова, гы-гы». – «Ой, ничего не нашлось». – «Ну, давайте покажем 0 результатов». Прекрасно!

Что мешает в случае, если вы нашли 0 результатов, релаксировать требования и все ключевые слова, введенные пользователем? Ваш электронный магазинчик конечной целью имеет «хоть что-то продать». Это не обязательно должен быть тот товар, в котором все ключевые слова совпали с запросом. Что вам мешает убрать одно слово из запроса и показать другой набор результатов?

Ничего не мешало, но это мало кто это делает. Amazon делает, и у них все в жизни хорошо.

Стоит поднять еще тему морфологии. Она, как ни удивительно, на практике не сильно проблемна. Серьезные требования к морфологии возникают далеко не сразу, но иногда поддерживать морфологию полезно.

Существуют еще синонимы, расширение запросов, правильная индексация, номера моделей и прочие фокусы, связанные с вертикальным поиском.

Также можно делать анализ запросов типа «двухкомнатная квартира в Бибирево» и «натягивать» их на фильтры. Делается анализ полнотекстовой части, из нее выбрасываются ключевые слова, происходит натягивание на «фильтры», которые есть в базе.

Очередная шокирующая истина. Придется немного поработать руками, как ни печально это для веб-разработчиков. Но реализовать все это можно – технологии позволяют: и Sphinx, и, думаю, Lucene и Solr, и новомодный Elastix. Любая другая вменяемая технология позволит вам это все сделать с тем или иным количество ручной работы. Скорее всего, как ни странно, много работать не придется.

Как бороться с опечатками? У нас есть демонстрация по этой теме.

Бороться с занудностью можно с помощью оператора кворума. В переводе на русский: взяли запрос в кавычки, дописали некоторое количество слов. Все. Запрос из «давайте поищем все слова» стал куда менее нудным, и найдется что-то более интересное.

Можно всячески анализировать запросы. Для этого у нас есть полезные и удобные инструменты. Образно говоря, это кубики, из которых вы можете уже что-то свое построить.

Бороться с морфологией того или иного языка, номерами моделей тоже можно. Для всего этого уже есть функционал: надо читать документацию и не стесняться экспериментировать.

Вот, в общем-то, и все. Лимит времени совсем исчерпан, поэтому подробности уже точно будут в кулуарах.

У нас кое-что есть про релевантность, с одной стороны, и про нерелевантность, с другой стороны. Пользоваться можно вот так. Дерзайте!

Времени уже нет, наверное, даже на полвопроса. Или на полвопроса есть?

Вопросы и ответы

Реплика из зала: В формуле ранжирования можно использовать атрибуты документов?

Андрей Аксенов: Конечно. Любые и сколько угодно – и математические функции, и даже UDF можно написать и подгрузить «на лету». 

Это мое проклятье!

Реплика из зала: Привет, Андрей. Как размечать данные хорошо?

Андрей Аксенов: В смысле?

Реплика из зала: В выборке поиска.

Андрей Аксенов: Как хорошо размечать данные в выборке поиска… Проблема не в том…

Реплика из зала: Как пользователя заставить проставить оценки?

Андрей Аксенов: Ты никак не заставишь пользователя проставить оценки.

Реплика из зала: А ты не думал, что ты нерелевантен со своими оценками?

Андрей Аксенов: Ты этим должен начать хоть как-то заниматься сам. Пользователя ты можешь заставить (это, кстати, интересная тема) хоть как-то размечать, когда это пользователю зачем-то нужно.

Таких случаев почти не бывает, но в моей практике один был. Тогда пользователь был буквально заинтересован собственным доходом, и ему надо было проставить оценки качеству поиска. Была интрига. Про этот случай я расскажу в кулуарах.

Нерелевантные запросы. Почему это важно? Релевантность что это такое

Релевантность — параметр, указывающий на то, насколько результат выдачи поисковой системы соответствует требованиям пользователя, который ввел запрос.

Релевантность высчитывается алгоритмами поисковых систем и представляет собой отношение количества ключевых слов на странице ресурса к общему числу слов. Каждой странице присваивается свой процент вхождений ключевых слов в тексте. Следует придерживаться золотой середины: небольшое количество пройдет незамеченным для поисковиков, а большое количество будет расценено как спам с последующим наложением фильтра.

Характеристика

С активным развитием Интернета и стремительным увеличением сайтов возник вопрос о качестве результатов выдачи. В ответ на это поисковые системы внедрили принцип релевантности запроса, обрабатывающий сайты и предоставляющий пользователям их наиболее приемлемые варианты.

На первом этапе релевантность страниц строилась на основе мета-тегов, плотности ключевых слов, частотности ключевиков в заголовках, способах оформления контента и т.д. С появлением дорвеев, соответствующих этим критериям, необходимо было внедрить и внешние факторы релевантности.

Ниже представлена формула, характеризующая критерии релевантности: R=PR*(T+L).

R — релевантность запроса,

T — уровень текстовой релевантности, насколько внутренние критерии соответствуют требованиям поисковиков,

L — уровень ссылочной релевантности, насколько тексты входящих ссылок соответствуют поисковому запросу,

PR — ранг ресурса, не зависит от запроса.

Эта формула — лишь условное обоснование эффективности алгоритмов ранжирования, которое демонстрирует полную картину критериев релевантности.

Внешние критерии релевантности

Внешние критерии релевантности представлены степенью цитируемости (ссылочная популярность). Релевантность сайта зависит от того, сколько сайтов на него ссылается. Чем больше ссылающихся сайтов, тем выше авторитет сайта, и тем качественней его контент.

Поисковые системы имеют свои собственные алгоритмы релевантности, но все они работают по одним и тем же принципам, по сути, это обработанная и усовершенствованная версия самого первого алгоритма (PR), разработанного основателями Google, которая характеризовала только количество внешних ссылок.

Самым первым алгоритмом релевантности считается ИЦ (показатель авторитетности страниц) Апорта, разработанный в 1999 г. ИЦ определял только самую весомую внешнюю ссылку.

В Яндексе есть свой собственный индекс цитирования, ВИЦ, релиз которого состоялся весной 2001г. ВИЦ присваивается каждой странице. После 2002г. из-за манипуляций вебмастеров с ВИЦ индекс цитирования был закрыт для общего доступа. Раньше такая услуга предоставлялась в Яндекс. Баре. На сегодняшний день можно просматривать только тИЦ, индекс цитирования для сайтов в каталоге Яндекса.

Осенью 2002г. индекс популярности появился у Рамблера, помимо ссылок, он определял и частоту посещаемости страниц сайта, которую можно было узнать из счетчика Top 100.

Внутренние критерии ранжирования

Самым весомым критерием считается частота ключевого слова на странице. Поисковики способны выделить ключевое слово в тексте. Сайт является релевантным при условии того, что запрос пользователя совпадает с ключевым словом и его формой на сайте.

Положение ключевика также влияет на релевантность сайта, особенно если ключевое слово находится в заголовке. А если запрос окажется идентичным заголовку текста, то поисковая система непременно поставит эту страницу выше других.

К внутренним критериям релевантности относят:

  1. Положение ключевого слова на странице, например, в мета-тегах.
  2. Близость ключевых слов. Не последнюю роль может играть ситуация, когда запрос приравнивается к устойчивой фразе.
  3. Положение в начале страницы. Чем выше находится ключевое слово, тем большим весом оно обладает.
  4. Синонимы ключевиков. Чем больше в тексте форм и синонимов ключевых слов, тем лучше: это свидетельствует о том, что тематика сайта соответствует изначально заданной тематике.

Релевантность — (от английского relevant – относящийся к делу) – в общем смысле это соответствие документа ожиданиям пользователя. Таким образом, релевантность поиска — это степень удовлетворения пользователя показанными в ответ на его запрос поисковыми результатами. В идеале, страница выдачи должна полностью удовлетворять информационную потребность пользователя в независимости ее полноты и точности.

У понятия релевантность сайта есть синоним ревалентность. Фактически этот термин означает то же самое, но в несколько более узком смысле. Здесь имеется в виду насколько запрашиваемая информация соответствует полученному результату. Дальше по тексту вам будут встречаться слова релевантность и ревалентность. Воспринимайте их как идентичные друг другу значения.

Согласно определению, когда посетитель Яндекса или Гугла набирает свой вопрос, поисковая система пытается оценить различные документы из своего индекса и выбрать самые подходящие для ответа. Таким образом, система вычисляет меру соответствия — степень совпадения документа и поискового запроса. Соответственно, если они совпадают, то значение меры самое большое (максимальное), а если же нет — равно нулю.

По степени релевантности документов в результатах выдачи судят об эффективности работы любой поисковой системы. Если пользователь получит на свой запрос абсолютно неподходящий для него ответ, то есть большая вероятность того, что он больше не станет пользоваться таким ресурсом. Поэтому именно подбор самых релевантных документов для свой выдачи — основная задача поисковика. Это влияет и на популярность поисковой системы, и на ее прибыль.

Насколько релевантен тот или иной документ в сети Интернет, определяется специальным поисковым алгоритмом. У Яндекса он один, у Гугла он другой, но общая схема его работы у них одинаковая. Также и у других поисковиках определение релевантности свое, но имеющее общие корни.

Например, в поисковой системе Яндекс работает группа специально обученных людей – асессоров, которые ежедневно посещают сотни сайтов по определенным поисковым запросам. Они оценивают юзабилити, контент, соответствие страницы запросу и другие характеристики. После этого все данные вносятся в самообучающийся алгоритм Матрикснет. И уже он, опираясь на эти данные, автоматически определяет релевантность и полезность для других подобных сайтов. Можно обмануть робота, но человека (в частности сотрудника ПС) – вряд ли…

Внутренние критерии релевантности

Наиболее значимым внутренним критерием релевантности являются ключевые слова, а именно их частота в тексте. Поисковые системы способны высчитывать этот параметр и при частом повторении какого-либо словосочетания считать его за ключевую фразу. Если при пользовательском запросе найденные фразы на странице соответствуют его форме и являются ключевыми, то есть часто употребляемыми, сайт будет считаться релевантным.

На ключевые слова большое значение оказывает и их месторасположение. Прежде всего это их наличие в различных заголовках. Если запрос пользователя совпадает с названием документа, вероятность того, что поисковая система оценит эту страницу больше других, станет выше. В качестве дополнительных факторов, влияющих на вес ключевых слов, также выступают:

  • Близость к началу страницы. Чем ближе к началу страницы находится ключевое слово, тем оно значимее.
  • Наличие ключевых слов в некоторых местах страницы. К примеру, в заголовках, мета-тегах, тегах оформления текста.
  • Близость ключевых слов друг к другу. Имеет значение, когда в роли поискового запроса выступает какая-либо фраза, особенно устойчивое словосочетание.
  • Наличие синонимов ключевых слов. Поисковые системы часто обращают внимание на присутствие в текстах других форм ключевых слов, свидетельствующих о том, что в документах действительно идёт речь по данной тематике.

Основные виды релевантности поиска, о которых стоит узнать

Формальная — лежит в основе принципов ранжирования поисковых систем. Через специальные алгоритмы сравнивает вид поисковых запросов и документов посредством индекса специальной машины для поиска. Человек в этом процессе участия не принимает. Полностью автоматизированная и роботизированная система выдает готовое решение.

Пертинентность — уникальное состояние, когда информационные потребности пользователей интернета полностью удовлетворены. Каждая поисковая система стремится приблизиться к этому состоянию.

Внешние критерии релевантности

В основе внешних критериев релевантности лежит принцип цитируемости или ссылочной популярности. Данный фактор подразумевает то, что релевантность сайта может определяться его популярностью в сети Интернет, то есть количеством других ресурсов, ссылающихся на рассматриваемую страницу. Чем выше их число, тем больше авторитетный вес сайта, а, следовательно, изложенная на нём информация является более качественной.

Каждая из поисковых систем использует свой алгоритм определения уровня цитируемости, однако все они имеют сходный механизм действия и по сути выступают модификацией первого в мире алгоритма, учитывающего количество внешних ссылок, PageRank, разработанного американскими студентами Сергеем Брином и Ларри Пейджем, основавшими поисковую систему Google.

В системе Яндекс аналогом PageRank является ВИЦ – взвешенный индекс цитирования, который был введён весной 2001г. Как заявляли представители компании, ВИЦ высчитывается по той же схеме, что и PageRank, и присваивается каждой странице в отдельности. До 2002г. ВИЦ можно было посмотреть с помощью «Яндекс-Бара», однако после попыток оптимизаторов искусственно увеличить показания его значение было скрыто. Теперь веб-мастерам доступна только информация о ТИЦ, использующемся для сортировки ресурсов в каталоге Яндекса.

С осени 2002г. коэффициент популярности стала использовать и система Рамблер, которая учитывала не только количество ссылок, но и данные о посещаемости страниц, получаемых от счетчика Top100.

Однако самой первой системой, применившей подобный алгоритм, является «Апорт», использующий показатель авторитетности страниц (ИЦ) с 1999г. В отличие от PageRank, ИЦ учитывает всего одну наиболее весомую ссылку со всех страниц ссылающихся сайтов.

Самые удобные ресурсы для проверки релевантности

К счастью, сегодня в интернете много ресурсов, с помощью которых нетрудно проверить уровень релевантности прямо в режиме онлайн. Перечислим три наиболее популярные из них:

  • Majento;
  • Мегаиндекс;
  • PR-CY.ru.

Чтобы получить нужную информацию на каждом из перечисленных сайтов достаточно ввести адрес страницы проверки и ключевое слово.

Кардинальных различий между перечисленными сервисами не существует. Относительно проверки релевантности все происходит примерно одинаково. Различия заметны только общем функционале, но это уже не относится к теме статьи.

Что делать, чтобы релевантность росла?

Следуйте этим семи советам и ваши статьи максимально приблизятся к ТОПу поисковой выдачи, а, возможно, и войдут в него:

Поместите основной ключевой запрос в тег Тайтл в прямой форме без изменений.

Ключевой запрос можно также вставлять в тег дескрипшен. Именно он «продает» вашу статью и высвечивается в поиске вместе с тайтлом. Здесь допускаются ключи и в прямом и в разбавленном вхождении.

Этот же запрос нужно вставить в главный заголовок, но точное вхождение необязательно и даже нежелательно. Лучше в разбавленном виде.

Основной запрос также целесообразно включить в первый абзац. Причем максимально близко к началу. Но это не значит, что первое предложение нужно начинать с главного запроса. Делать этого точно не стоит.

Работайте с контентом. Если он не отвечает смыслу главного поискового запроса, о релевантности можно будет забыть. Нелогично оптимизированная статья только навредит сайту. Посетитель не получит нужной информации и очень быстро уйдет на другой ресурс.

Поисковики любят разнообразие в статьях. Поэтому списки, видео, картинки, таблицы, схемы, графики, а также ссылки похожие материалы приветствуются.

Последний пункт самый сложный по реализации, но один из самых результативных по росту релевантности. Если на страницу ссылаются другие сайты схожей тематики, это существенно повысит ее позиции в поисковой выдаче.

Используйте этот список как чек-лист при оптимизации любой страницы и релевантный контент быстро выведет ее на первые позиции поисковой выдачи. Дополнительно рекомендую посмотреть чек лист seo оптимизации.

Почему поиск иногда выдает нерелевантные страницы?

Черное и серое SEO-продвижение медленно, но уверенно уходит в прошлое. Несмотря на этот факт услуги накрутки все еще пользуются огромным спросом в сети. Пройдет еще немного времени и возможности искусственно повысить релевантность страниц сайта исчезнут. В них и сейчас остается совсем немного смысла.

Один из главных вопросов релевантности сегодня лежит в плоскости несовершенства работы поисковых роботов и алгоритмов. Некоторые факторы агрессивного продвижения до сих пор сходят с рук оптимизаторам, которые ведут себя непрофессионально. К сожалению, сайты с минимумом качественного контента и большим количеством «правильных» ссылок сегодня до сих пор в ТОПе большинства популярных направлений. Эта тенденция особенно заметна выражена в тематике развлечений, которая не подвергается строгому контролю поисковиков.

Минимальная конкуренция

Другими словами, из 30 очень плохих ресурсов выбирают 10 не таких ужасных и отправляют их в ТОП. Поисковые роботы считают, что лучше найти хоть какую-нибудь страницу по теме, чем сказать посетителю, что результат неизвестен. В результате в тематиках с низкой конкуренцией первые строки выдачи занимают даже те сайты, где присутствуют всего несколько слов из нужных запросов.

Если специалист возьмется продвигать сайт в тематике с низкой конкуренцией, шансы вывести ресурс в ТОП будут очень и очень высокими. Детальнее о конкурентности запросов.

Релевантный вывод

Всегда раскрывайте в тексте тему основного ключевого запроса, по которому оптимизируете статью. Делайте содержание, заголовки, подпункты и небольшие абзацы. В легкой и понятной структуре легко разберется даже читатель, который зашел на сайт впервые. Даже если время пребывания посетителя на ресурсе всего 2-3 минуты, это становится плюсом для сайта. За несколько минут вполне реально предоставить посетителю необходимый минимум интересующей его информации.

Приветствую, мои уважаемые читатели и подписчики блога. В данной статье подробно расскажу вам, в чем смысл этого понятия без использования заумных фраз и научной стилистики. На данный момент интернет заполнен значительным объемом бесполезной и искаженной информации. Масса безграмотных авторов наполняют свои работы большим количеством ключевых фраз, чтобы поисковая система нашла их творения на страницах сайтов. Но загвоздка заключается в том, что полезного контента, который бы раскрывал смысл ключевого слова, являющегося поисковым запросом, просто нет. Чтобы уменьшить число сайтов с таким бесполезным содержанием, было введено понятие релевантности.

Релевантность что это такое

Релевантность в целом – это характеристика, которая выражает соответствие чего-либо, желаемого полученному. Данное понятие в интернете является показателем, который характеризует полезность информации, относительно запроса, отправляемого в систему. Существует еще характеристика релевантности статьи, она описывает соответствие заголовка тексту, который располагается под ним. Одним словом, это то что наиболее подходит по запросу пользователя среди всей той информации что будет ему выдана.

Данный тезис станет куда прозрачнее и яснее, если посмотреть на несколько примеров, приведенных ниже.

Релевантность что это простыми словами на примерах

Допустим, Вы не знаете, как приготовить греческий салат. Очевидно, что в эру компьютерных технологий вы прибегнете за помощью к всемирной паутине, а именно, к какому-либо онлайн сервису для поиска. Вы вводите запрос, например, в Яндекс: «рецепт греческого салата», после чего вам предлагается огромный список ссылок с различной информацией, связанной с приготовлением этого блюда. После чего, Вы переходите по одной из них, и там четко и ясно описан рецепт приготовления греческого салата. Перед Вами релевантная страница, где текст полностью соответствует указанному запросу.

Для того чтобы окончательно разобраться что это такое, можно рассмотреть еще один пример:

Вам потребовалось починить свой автомобиль, Вы уже знаете, что сломалось, но как произвести ремонт остается загадкой. Как и в прошлом примере, Вам приходиться обратиться за помощью к поисковику. Вы рассматриваете предоставленные ссылки по указанному запросу и останавливаете свой выбор на самой привлекательной по Вашему мнению. Но перейдя по ней, открывается сайт, на котором предлагают купить запчасти, совершить техобслуживание, и множество других услуг, которые Вам совсем не интересны. Такая целевая страница не является релевантной.

Как поисковые системы вычисляют релевантность страницы

Раньше, для того чтобы определить этот показатель, поисковые системы анализировали число ключевых фраз на предоставленной странице. Многие люди, чтобы поднять свою статью в списке выданных поисковиком материалов, старались занести в нее как можно больше ключей в той форме, которая указана в запросе. В результате предоставленная информация зачастую не являлась релевантной, а текст был настолько изуродован, что даже читать его пропадало желание.

Через некоторое время поисковые системы кардинально изменили подход к определению релевантности. За чрезмерное употребление ключей теперь предусмотрен блок. На сегодняшний день Google, Yandex, Ramblerи другие подобные сервисы используют множество сложных алгоритмов для вычисления такой полезной характеристики.

Самым действенным и одновременно простым способом для вычисления этого показателя использует Гугл. Особые программы анализируют действия человека, а в частности время, на которое он остановился на открытой странице. Если перейдя по ссылке, пользователь не увидел ничего соответствующего его запросу, то он сразу же ее закрывает. Соответственно, время, на которое он там задержался, составит всего пару секунд, но если на этом сайте находится исключительно полезная и интересная ему информация, то, скорее всего, потребуется больше времени на ее изучение.

Чтобы узнать релевантную страницу нужному поисковому запросу, к примеру «релевантная страница» следует в сроке поиска Яндекса прописать следующее:

site: www.сайт релевантная страница

После этого вы получите список страниц, наиболее подходящих (релевантных) вашему запросу и самая точная будет первая, остальные менее подходящие, но их можно использовать как доноры ссылок .

Но время посещения – это не единственный критерий, используемый для определения релевантности. Бесчисленное множество программ и сервисов анализируют выданную по запросу информацию относительно:

  • Объема символов и ключевых фраз. Программа анализирует общий объем символов текста и количество ключевых слов в нем. Если количество превышает допустимое, то сайт блокируют. Нормальным содержанием ключей в тексте считается от 3% до 7%.
  • Числа посещений. Программа считает, сколько пользователей посетило страницу за определенный промежуток времени. Если в дальнейшем число посещений уменьшается, то это означает, что она не является релевантной.
  • Вхождение заголовка в смысл текста. Программа проверяет каждое слово в тексте и определяет, насколько оно соответствует указанному заголовку. Если слова даже близко не относятся к содержанию заголовка, то статья удаляется или дорабатывается.

И это только самые распространенные и популярные характеристики.

Заключение

Итак, релевантность, что это простыми словами? Это залог успеха в поисковых сетях. Помимо этого она может способствовать значительному увеличению прибыли от сайта. Так как если размещенная статья действительно полезна для читателя, то он точно не будет единственным. Качественные тексты до сих пор достаточно сложно найти на просторах всемирной паутины. Если в данной статье Вы нашли ответ на вопрос: «Что такое релевантность», то уже можно предположить, что она будет находиться на первых страницах выдачи.

Хорошая релевантность значительно увеличивает приток пользователей. Для блога или информационного сайта, который постоянно обновляется, это очень важно. Сейчас блоги ведут в основном профессионалы, исключительные мастера своего дела, убивая на него очень много времени. Но иногда создатели предпочитают заказывать статьи для своих творений у других людей. Временами это приводит к тому, что загружаемый контент написан в поверхностном изложении и совсем не интересен для читателя. Чтобы избежать таких ситуаций, необходимо грамотно подходить к вопросу о выборе писателя, нужно узнать, имеет ли он определенные знания в области, соответствующей тематике вашего блога.

Надеюсь материал был полезен и не забываем подписаться на рассылку новостей блога. До скорых встреч, а за репост статьи +100 к вашей карме -))).

С уважением, Галиулин Руслан.

Доброго времени суток, дорогие читатели! Думаете, выбиться в топ поисковой выдачи и увеличить трафик минимум на 30 % нереально? Тогда вам надо узнать, что такое релевантность и научиться ею пользоваться. О том, как это сделать и отличить нерелевантный контент от релевантного, вы узнаете далее.

Релевантность (англ. relevant – уместный, подходящий по смыслу) – это соответствие содержимого страницы поисковому запросу. Это означает, что она влияет на позицию сайта в результатах выдачи.

Значение слова в общих чертах – совпадение результата и ожиданий.

Теория релевантности: “Полезный контент удовлетворяет потребность в информации”.

Пример. Я ввожу в поиск “Как клеить обои самостоятельно”. Через секунду открывается список ссылок, которые должны отвечать запросу. Релевантным материалом считается мастер-класс поклейки обоев, а нерелевантным – выбор настенного покрытия, услуги разнорабочих.

Если искать в интернете “наполеон торт”, то правильным ответом будет кулинарная страница с рецептами, а биография французского полководца – неуместным.

Нерелевантный трафик – это посетители, которые не совершают целевые действия. Они попали на сайт случайно.

Как поисковая система проверяет релевантность?

Раньше поисковая система проверяла качество страницы по тексту – высчитывала . Метод был не защищен от накрутки. Хитрые сеошники спамили нужными словами, в итоге результаты поиска засорялись, а пользователи оставались недовольными.

Технологию определения релевантности я делю на два этапа.

Первый этап. Сотрудники поисковой системы – асессоры, проверяют страницы вручную по руководству. Хорошие сайты они вносят в список индексации поисковыми роботами. Их алгоритмы отличаются для разных категорий сайтов. Например, если у интернет-магазина есть раздел “Доставка”, “Оплата”, ему ставят плюсик.

Какую оценку могут дать сайту асессоры:

  • отвечает всем критериям,
  • релевантная страница с техническими недочетами,
  • материал частично совпадает с запросом,
  • нерелевантный контент или спам.

Второй этап. Машинное обучение – создание алгоритмов на основе примеров.

Допустим, 1 млн. человек отправили список любимых фильмов системе. Это примеры. Искусственный интеллект находит то, что их объединяет. Выясняет, что люди обожают кино со знакомыми актерами. В итоге, если вам нравится “Терминатор” с Арнольдом Шварценеггером, вам предложат посмотреть “Бегущего человека” с этим же актером.

Алгоритмы загружаются в компьютеры, которые занимаются индексацией.

Для автоматической проверки Яндекс использует технологию машинного обучения – Матрикснет. В него можно вносить новые алгоритмы, сложные формулы индексации без снижения скорости поиска.

Упрощенная формула: Relevant = PageRank или тИЦ * (релевантность текста + уровень ссылочного ранжирования).

Перечислим внутренние показатели, влияющие на релевантность:

  1. Частотность ключей. Плотность слова более 4 % считается переспамом.
  2. Наличие синонимов.
  3. Тег title. Должен выглядеть естественно и содержать главный ключ.
  4. Заголовок и подзаголовки. Важно наличие ключей, отсутствие ошибок и удобочитаемость.
  5. Вхождение ключей. Их нельзя вписывать криво, сохраняйте читабельность. Например, плохо: “сшить легкая юбка трикотаж”. Хорошо: “как сшить легкую юбку из трикотажа”.
  6. Атрибуты тега img. Не повторяются, естественная словоформа.
  7. Внутренняя и тематические ссылки.
  8. Наличие .
  9. Юзабилити. Страницы быстро загружаются, удобная навигация на сайте.
  10. Строение URL.
  11. Дата последнего изменения страницы.
  12. Файлы robots.txt и sitemap.xml.
  13. Структура статьи. Читатель сразу находит нужную информацию.

49 % посетителей закрывают сайт, если он не загрузился за 5 секунд. А поведенческие факторы здорово сказываются на качестве продвижения.

Уровень релевантности зависит и от внешних факторов:

  • внешней перелинковки,
  • рейтинга сайтов-доноров,
  • авторитетности ссылочной массы – PageRank или тИЦ,
  • количества посетителей,
  • источников трафика,
  • длительности просмотра страницы (не менее 40 секунд),
  • показателя отказов,
  • конверсии,
  • региональности,
  • прокрутки страницы.

Объем статьи – условный фактор. Если вам удалось ответить на вопрос пользователя, используя всего лишь 400 символов, зачем лить воду?

Классификация

Стадии релевантности:

  • формальная – проверка проведена с помощью машинных алгоритмов;
  • содержательная – асессоры читают, просматривают содержимое и решают, соответствует ли оно потребности пользователя;
  • пертинентная – контент полностью решает проблему, отвечает на вопрос пользователя.

Последний уровень – предел мечтаний вебмастера и SEO-специалиста.

Что происходит с нерелевантным материалом?

Когда появляется годный контент по запросу, поисковик избавляется от мусора. Сайт с нерелевантным материалом сначала понижают в результатах поиска, а при обнаружении черных, серых методов оптимизации – перестают индексировать. Говоря простыми словами, вашу страницу удаляют из поиска.

3 лучших инструмента для анализа релевантности

Не нужно гадать на ромашке, чтобы знать, как оценит ваш материал поисковик. Популярные онлайн-сервисы проверяют текст или страницу на релевантность за 10 секунд. Подробная статистика показывает сильные и слабые стороны вашего контента.

Я привыкла пользоваться Istio и Megaindex. Они ни разу не подводили меня.

Istio

Istio бесплатно и без регистрации показывает релевантность по отдельным словам. Вдобавок вы узнаете тошноту, водность, орфографические ошибки, объем текста.

Хотите проверить материал до публикации? Копируйте текст, вставляйте в рабочую область. И кликните на кнопку “Анализ текста”.

Загружайте статью прямо со страницы сайта, кликнув “Расширенная форма”.

Вставляете URL и выбираете “Добавить весь текст”.

Хотите знать, насколько ваш контент релевантен? Нажмите “Выделение ключей”, чтобы узнать результаты.

По умолчанию мы видим процент релевантности без стоп-слов. Советую посмотреть результаты с их учетом. Они не должны перекрывать ключи.

Вот такие результаты анализа показал сервис. А что получилось у вас? Пишите в комментариях.

MegaIndex – это 12 инструментов, которые глубоко анализируют сайт, делая его лучше. Чтобы начать пользоваться благами сервиса, нужно зарегистрироваться. Авторизации через соцсети нет, придется регистрироваться по старинке через e-mail.

Заходите на главную страницу , кликаете “Регистрация” в правом верхнем углу.

Вводите продвигаемый запрос и адрес страницы. Нажимаете “Проверить” и ожидаете результатов.

Нам не хватило 25 %. То, что мы упустили, можно посмотреть, кликнув на любой из критериев в правом списке или внизу страницы.

Мы видим, что наш контент соответствует большинству требований.

А теперь попробуйте узнать релевантность страниц своего сайта. Результатами делитесь в комментариях.

PR-CY

PR-CY уступает МегаИндексу. Нет подробного разбора ошибок. Новичок не поймет, что исправлять. Зато релевантность оценивается по трем частям текста отдельно: тайтлу, заголовку, подзаголовкам.

Регистрация не нужна. Просто выбираете раздел “Анализ контента”, вводите ключевые слова и ссылку.

Почему в результаты поиска попадают нерелевантные страницы?

Эффективность черных и серых методов SEO снижается с каждым обновлением поисковых алгоритмов. Но пока они дают результат, ими продолжают пользоваться. Иногда, перерыв кучу ссылок в надежде найти нужную информацию, сталкиваешься с дорвеями, которые переадресовывают непонятно куда.

Когда я искала отзывы о роддоме в моем районе, часто сталкивалась с подозрительными сайтами. Описание и заголовок содержали нужную информацию, но после перехода открывались страницы с акциями, онлайн-казино. Так ведь можно и вирус подхватить.

Проблема нехватки информации

В сети еще остались низкочастотные запросы без релевантного контента. Поисковик стремится отвечать на любой вопрос. Показать: “По вашему запросу ничего не найдено” – позор для него. Нехватка качественного контента заставит выдавать информацию хоть на 1 % совпадающую с запросом.

Попробуйте ввести в поисковую строку любую ерунду. Вам откроется список ссылок. Правда, вы не всегда найдете то, что запрашивали.

Накрутка посетителей

Поисковые алгоритмы еще далеки от совершенства, поэтому черная оптимизация до сих пор работает в некоторых нишах. Плохие SEO-специалисты: спамят, закупают ссылки, создают страницы для автоматической переадресации. Такие методы чаще прокатывают в развлекательной тематике, где нет жесткого контроля.

Как повысить релевантность: улучшаем контент и сайт

Будем честными, всем хочется попасть в топ поисковой выдачи, и релевантность – главный способ пробиться туда.

Как повысить релевантность?

  1. Правильно составить title. В первой части – главный ключ. Сохраняйте естественную словоформу. Например, “Дерматит у кошек лечение” лучше вписать как “Лечение дерматита у кошек: 10 проверенных способов”.
  2. Структурировать статью. Разбейте материал на подзаголовки
  3. Следить за уникальностью. Не менее 95 % по Etxt Антиплагиат , Advego , или Text.ru .
  4. Не увлекаться ключами, разбавлять текст по смыслу. Нормальный уровень академической тошноты – 7,5 % по тексту и 2,5 % – по слову.
  5. Прописывать латиницей в URL основной ключ. Например, “Как придумать заголовок” в адресе http://…kak-pridumat-zagolovok/.
  6. Добавлять синонимы и тематические слова. вытесняет SEO. Пишете статью о похудении народными средствами? Не забудьте слова, задающие направление тексту: потеря веса, лишние килограммы, народная медицина, в домашних условиях – они придутся очень кстати.
  7. Не выделять жирным все подряд. Поисковый робот подумает, что вы спамите.
  8. Вставлять 3 – 4 ссылки на другие статьи сайта, близкие по смыслу.
  9. Следить за оформлением. Статья с изображениями, таблицами, списками легче читается, чем непробиваемая стена из слов. Это положительно скажется на поведенческих факторах.
  10. Добавлять ключи в атрибут картинки .
  11. В мета-теге keywords указать 3 – 5 ключевых фраз, по которым продвигаетесь.
  12. Равномерно распределять дополнительные ключи по тексту, склонять и разбавлять их. На 1 000 символов не более 5 ключевых фраз.
  13. Избегать грамматических, смысловых ошибок.
  14. Следить, чтобы в первом абзаце присутствовал главный ключ.

Технические моменты, над которыми стоит поработать:

  1. Выбор доноров для внешней перелинковки с высоким рейтингом.
  2. Качество, скорость загрузки хостинга.
  3. Наличие зеркал у сайта, если возникнет перегрузка сервера.

Без соблюдения этих критериев контент не станет популярным.

Заключение

Релевантность – это талант копирайтера раскрывать смысл поискового запроса в статье. Посетитель заходит на сайт и понимает: “Вот оно!” Научитесь лаконично излагать свои мысли и читатели за вами потянутся, а вместе с ними и заказчики. Ускорить обучение и повысить его качество помогут наши . Записывайтесь, пока цена не выросла.

А у вас получается писать релевантные статьи? Жду ваших ответов в комментариях.

Не становится от этого проще. Все потому, что каждый день на веб-просторах появляются тысячи новых сайтов. А количества мусора, который регулярно постят в сеть, уже и не сосчитать.

Релевантность

Релевантность — это термин, обозначающий степень соответствия поискового результата ожиданиям пользователя. Другими словами, если пользователь нашел то, что искал, найденный материал называется релевантным. Если же нет, его называют нерелевантным.

Коротко о главном

Любая современная поисковая система имеет свои алгоритмы оценки релевантности, причем анализируется не весь сайт в целом, а каждый материал, который был выложен на его просторах. Как результат, подстраиваясь под требования, например, поисковой никто не сможет гарантировать ту же степень соответствия выдачи в Google. Сегодня перед тем, как повысить релевантность, приходится тратить много времени на анализ существующего контента. Только после этого можно приступать к практическим действиям.

Как определяется релевантность?

Степень релевантности определенной информации и предложенного запроса определяется с помощью инновационных поисковых алгоритмов. В них входит отношение всех ключевиков к общему объему статьи, опубликованной на странице. При создании страницы каждая поисковая машина определяет свой оптимальный процент вхождения. А как повысить релевантность таким образом, чтобы подняться в выдаче? Многие предпочитают придерживаться пятипроцентного соотношения ключей к суммарному объему текста. Но бывает и так, что авторы контента сталкиваются с трудностями. Главная проблема любого веб-мастера заключается в том, что любое отклонение от этого соотношения может привести к отодвижению страницы в «игнор». Кроме того, сильное преувеличение процента вхождений приведет к тому, что поисковая система полностью заблокирует выдачу, определив контент как нежелательный для просмотра (спам).

Изначально релевантность информации определялась по ряду внутренних критериев, например, частоте ключей в заголовках, плотности ключевых фраз в тексте, мета-тегах, элементах оформления текста и так далее. Так как вскоре появились сайты, которые используются для перенаправления на продвигаемый ресурс, появилась необходимость в модернизации параметров поиска для соответствия релевантности.

Увеличение релевантности

Увеличение релевантности — дело не очень сложное. Но оно требует много времени, и к этому надо всегда быть готовым. Существует ряд рекомендаций, позволяющих повысить релевантность страницы или сайта в целом.

Как повысить релевантность?

Поисковый запрос и релевантность

Для того чтобы на сайт направлялись пользователи с поисковой системы, ему будет мало одного только присутствия в выдаче. Необходимо максимально сильно стремиться попасть на самую вершину выдачи.

Критерии, которые оказывают влияние на положение ссылки сайта на страницах выдачи в поисковых системах, условно разделяются на две большие категории:

  • текстовые;
  • нетекстовые.

Уже по названию ясно, что текстовые критерии являют собой характеристики текстовой составляющей сайта. При этом нетекстовые критерии необходимы для того, чтобы оценить связи страницы. Текстовая информация, опубликованная на страницах, не играет никакой роли. Текстовые критерии, по которым проверяется релевантность слов, учитываются еще на этапе создания как статей, так и сайта в целом. Нетекстовые материалы доступны для обработки уже после того, как веб-сайт выложили в интернет-сеть и подали на индексацию.

Индексирующие поисковые машины

При работе с индексирующими поисковыми машинами важно помнить о том, что поиск в системе начинается только после того, как будут введены и подтверждены поисковые запросы. Это может быть слово, группа слов, фраза, словосочетание и так далее.

Очень часто при вводе фраз возникает разрыв. Поисковик никоим образом не отвечает за то, что думает пользователь в момент ввода текста. Пользователь, в свою очередь, не видит никакой разницы между понятиями «неправильного» и «правильного» запросов.

Как результат, перед тем как создавать определенный веб-сайт, необходимо предварительно ознакомиться с тем, в какой форме чаще всего пользователи запрашивают информацию, которая интересует их в сети. На территории Рунета есть всего лишь один источник, который позволяет получить достоверные поисковые запросы — «Яндекс.Директ».

Проверка релевантности страницы

Конечно, определением приблизительной степени релевантности страниц можно заняться и своими силами, просто прочитав материал. Но что делать, если на сайте не одна страница текста, а тысячи или даже больше — десятки тысяч? Самостоятельная проверка отнимет слишком много времени и сил. Для облегчения труда были созданы специальные онлайн-сервисы, позволяющие проверить релевантность в течение нескольких секунд. Далеко не каждый владелец сайта предпочитает обращаться за помощью к ним, поскольку иногда и так понятно, что написанные посты имеют высокую степень соответствия поисковым запросам. Тем не менее, лучше лишний раз развеять все сомнения и вздохнуть с облегчением.

Наиболее простой метод получения точной степени релевантности является pr-cy — специализированный российский инструмент, предназначенный для высокоточного анализа контента. В информации, поданной на данном инструменте, указывается все необходимое: количество ключей, релевантность, плотность вхождений и так далее. Сервис удобный, но не настолько, как его конкурент — MegaIndex. Он предназначается для продвижения сайтов, но в его функционале имеется большое количество бесплатных инструментов, которые пригодятся оптимизатору. Информация анализируется в двух одновременно — Яндекс и Google. Тем не менее, данным сервисом гарантируется точная проверка релевантности с минимальной погрешностью.

Выводы

Релевантность — вот на что нужно ориентироваться любому оптимизатору и владельцу сайта. Предоставив пользователям контент, соответствующий их ожиданиям, вы добьетесь, что популярность проекта будет стабильно расти. Тогда вы сможете не только хорошо и качественно продвигать свой сайт, но также прилично на нём зарабатывать. Нужно просто начать работать, а в дальнейшем придёт как опыт, так и уверенность в себе. Удачи в начинаниях.

Рекомендуем также

Узнаем как повысить релевантность? Поисковые запросы. Проверка релевантности

Несмотря на то что современные поисковые системы стараются максимально адаптироваться под пользователей, поиск информации в интернет-сети не становится от этого проще. Все потому, что каждый день на веб-просторах появляются тысячи новых сайтов. А количества мусора, который регулярно постят в сеть, уже и не сосчитать.

Релевантность

Релевантность — это термин, обозначающий степень соответствия поискового результата ожиданиям пользователя. Другими словами, если пользователь нашел то, что искал, найденный материал называется релевантным. Если же нет, его называют нерелевантным.

Коротко о главном

Любая современная поисковая система имеет свои алгоритмы оценки релевантности, причем анализируется не весь сайт в целом, а каждый материал, который был выложен на его просторах. Как результат, подстраиваясь под требования, например, поисковой системы «Яндекс», никто не сможет гарантировать ту же степень соответствия выдачи в Google. Сегодня перед тем, как повысить релевантность, приходится тратить много времени на анализ существующего контента. Только после этого можно приступать к практическим действиям.

Как определяется релевантность?

Степень релевантности определенной информации и предложенного запроса определяется с помощью инновационных поисковых алгоритмов. В них входит отношение всех ключевиков к общему объему статьи, опубликованной на странице. При создании страницы каждая поисковая машина определяет свой оптимальный процент вхождения. А как повысить релевантность таким образом, чтобы подняться в выдаче? Многие предпочитают придерживаться пятипроцентного соотношения ключей к суммарному объему текста. Но бывает и так, что авторы контента сталкиваются с трудностями. Главная проблема любого веб-мастера заключается в том, что любое отклонение от этого соотношения может привести к отодвижению страницы в «игнор». Кроме того, сильное преувеличение процента вхождений приведет к тому, что поисковая система полностью заблокирует выдачу, определив контент как нежелательный для просмотра (спам).

Изначально релевантность информации определялась по ряду внутренних критериев, например, частоте ключей в заголовках, плотности ключевых фраз в тексте, мета-тегах, элементах оформления текста и так далее. Так как вскоре появились сайты, которые используются для перенаправления на продвигаемый ресурс, появилась необходимость в модернизации параметров поиска для соответствия релевантности.

Увеличение релевантности

Увеличение релевантности — дело не очень сложное. Но оно требует много времени, и к этому надо всегда быть готовым. Существует ряд рекомендаций, позволяющих повысить релевантность страницы или сайта в целом.

Как повысить релевантность?

  • Плотность ключевых слов. Не обязательно расставлять ключевые фразы близко друг к другу. Для одного КС вполне достаточно поместить 2-3 точных запроса. Приблизительно столько же — в разбавленном виде. Иногда требуется и меньше вхождений, это уже зависит от величины редактируемого контента. Как правило, чем больше материал, тем выше количество вхождений.
  • Естественность. Несмотря на то что ключевые фразы в определенных случаях могут показаться сложными в восприятии, крайне важно, чтобы фраза из запроса имела максимально естественный вид в материале. Перед тем как повысить релевантность, помните о том, что материалы для публикации, прежде всего, создаются для новых гостей, а не для роботов.
  • Использование подзаголовочных тегов. Теги h2, h3 и h4 состоят из заголовков 1-го уровня и ряда подзаголовков (2, 3). Есть и теги для более мелких подзаголовков, но чаще всего хватает h3 и h4. Внутри прописанных тегов ставятся тематические заголовки, причем они должны содержать ключи. Если нельзя правильно вписать ключ, лучше не вставлять его вообще, иначе релевантность запросов будет нарушена.

  • Ключевые слова в заголовке. Как было сказано выше, для достижения оптимальной релевантности необходимо прописывать ключевики в заголовках. Делается это так, как пользователь чаще всего вводит поисковый запрос. После ключа или до него дополнительно ставятся другие слова, наиболее подходящие по смыслу. В идеале заголовок заставит кликнуть по нему, заинтересовав читателя.
  • Разбавление и склонение ключевых фраз. Внутри ключевиков размещайте другие фразы, старайтесь склонять слова или использовать предлоги.
  • Выделение ключевых фраз подчеркиванием, жирным или курсивным шрифтом. Совершенно не обязательно выделять все ключевые фразы, расставленные в тексте. Вполне хватит и пары-тройки выделений, которые требуют обязательного обращения внимания к себе. Самое главное — всегда знать меру. С помощью тегов можно выделять ряд дополнительных фраз, на которые читателю следует обратить предельное внимание. Ведь реальная польза и максимальная естественность — превыше всего для любого читателя.
  • Составление описаний. Корректно подготовленный description непременно добавит много новых пользователей сайта, направленных с поисковой системы. В «Гугле» используется сниппета (текстовый блок с описанием, который находится под заголовком сайта в выдаче). В некоторых системах управления контентом есть специальные плагины, позволяющие существенно помочь при составлении правильных описаний. Перед тем как повысить релевантность, помните: в description нужно проставлять ключи, но и здесь надо знать меру. В противном случае — спам-фильтры, бан.

Поисковый запрос и релевантность

Для того чтобы на сайт направлялись пользователи с поисковой системы, ему будет мало одного только присутствия в выдаче. Необходимо максимально сильно стремиться попасть на самую вершину выдачи.

Критерии, которые оказывают влияние на положение ссылки сайта на страницах выдачи в поисковых системах, условно разделяются на две большие категории:

  • текстовые;
  • нетекстовые.

Уже по названию ясно, что текстовые критерии являют собой характеристики текстовой составляющей сайта. При этом нетекстовые критерии необходимы для того, чтобы оценить связи страницы. Текстовая информация, опубликованная на страницах, не играет никакой роли. Текстовые критерии, по которым проверяется релевантность слов, учитываются еще на этапе создания как статей, так и сайта в целом. Нетекстовые материалы доступны для обработки уже после того, как веб-сайт выложили в интернет-сеть и подали на индексацию.

Индексирующие поисковые машины

При работе с индексирующими поисковыми машинами важно помнить о том, что поиск в системе начинается только после того, как будут введены и подтверждены поисковые запросы. Это может быть слово, группа слов, фраза, словосочетание и так далее.

Очень часто при вводе фраз возникает семантический (смысловой) разрыв. Поисковик никоим образом не отвечает за то, что думает пользователь в момент ввода текста. Пользователь, в свою очередь, не видит никакой разницы между понятиями «неправильного» и «правильного» запросов.

Как результат, перед тем как создавать определенный веб-сайт, необходимо предварительно ознакомиться с тем, в какой форме чаще всего пользователи запрашивают информацию, которая интересует их в сети. На территории Рунета есть всего лишь один источник, который позволяет получить достоверные поисковые запросы — «Яндекс.Директ».

Проверка релевантности страницы

Конечно, определением приблизительной степени релевантности страниц можно заняться и своими силами, просто прочитав материал. Но что делать, если на сайте не одна страница текста, а тысячи или даже больше — десятки тысяч? Самостоятельная проверка отнимет слишком много времени и сил. Для облегчения труда были созданы специальные онлайн-сервисы, позволяющие проверить релевантность в течение нескольких секунд. Далеко не каждый владелец сайта предпочитает обращаться за помощью к ним, поскольку иногда и так понятно, что написанные посты имеют высокую степень соответствия поисковым запросам. Тем не менее, лучше лишний раз развеять все сомнения и вздохнуть с облегчением.

Наиболее простой метод получения точной степени релевантности является pr-cy — специализированный российский инструмент, предназначенный для высокоточного анализа контента. В информации, поданной на данном инструменте, указывается все необходимое: количество ключей, релевантность, плотность вхождений и так далее. Сервис удобный, но не настолько, как его конкурент — MegaIndex. Он предназначается для продвижения сайтов, но в его функционале имеется большое количество бесплатных инструментов, которые пригодятся оптимизатору. Информация анализируется в двух поисковых системах одновременно — Яндекс и Google. Тем не менее, данным сервисом гарантируется точная проверка релевантности с минимальной погрешностью.

Выводы

Релевантность — вот на что нужно ориентироваться любому оптимизатору и владельцу сайта. Предоставив пользователям контент, соответствующий их ожиданиям, вы добьетесь, что популярность проекта будет стабильно расти. Тогда вы сможете не только хорошо и качественно продвигать свой сайт, но также прилично на нём зарабатывать. Нужно просто начать работать, а в дальнейшем придёт как опыт, так и уверенность в себе. Удачи в начинаниях.

Что такое карта релевантности?


Карта релевантности является одни из наиболее важных документов для качественного продвижения сайта, так как именно в этой карте четко и понятно прописано, какие ключевые слова из семантического ядра использовать для конкретной страницы во время продвижения.

Собранные запросы разбиваются на группы и распределяются по страницам сайта исходя из того, как в будущем будет продвигаться страница. Не рекомендуется использовать более 5 ключевиков на страницу, причем к ВЧ должны относится максимум 2 ключа. Естественно, что для продвижения главной страницы рекомендуется брать наиболее частотные ключи – задача главной привести на сайт максимум посетителей. Внутренние страницы рекомендуется продвигать по более узким запросам.

Всю эти информацию обычно собирают в специальный документ, который получил название карта релевантности. То есть, карта релевантности – это, по сути, составленный на основе ключевых запросов из семантического ядра и структуры сайта план по оптимизации сайта контентом.

Вот как это выглядит:

КР включает в себя следующие пункты:

1. Поисковая фраза. Представляет собой запрос из СЯ, который будет переводить пользователей на искомую страницу. Рекомендуется использовать от 3 до 5 поисковых фраз для одной страницы.
2. Частота запроса. Этот пункт определяется через сервис Яндекс.Вордстат, причем обращать внимание следует не только на базовую частоту, но и на частоту с оператором «!». 
3. Релевантная страница. Это страница в Яндексе, релевантная вашему запросу из СЯ. Можно проверять как вручную, так и в автоматическом режиме с использованием онлайн-сервисов. Вручную будет очень долго и не факт, что намного качественнее, поэтому лучше обратитесь к специализированным сервиса. 
4. Title и Description, модернизированный с учетом СЯ. Обязательно включение ключевых слов в тэги по следующему принципу: ВЧ запросы ближе к началу, НЧ – к концу.
5. Заголовок h2, в который также включается один из наиболее важных поисковых запросов. Обязательно делайте его читабельным и привлекательным для пользователя, чтобы он облегчил поиск информации на странице и заранее расположил к контенту. 
6. Атрибут alt для тега img, а также описание картинки или фотографии с необходимыми ключевыми словами. Описание не только помогает роботу ПС понять, что изображено на страничке, но и играет дополнительную роль в продвижении. 

Для чего нужна карта релевантности?

Этот документ один из самых важных для продвижения сайта. В нем представлена четкая структура сайта, с указанием ключевых слов из семантического ядра для продвижения. К нему постоянно обращаются и SEO-специалисты, и копирайтеры при выполнении работ по продвижению сайта. Можно сказать, что карта релевантности служит неким контент-планом: копирайтеры видят, под какие запросы необходимо писать тексты для той или иной страницы. Также благодаря этой таблице можно избежать дублирования запросов.

Карта релевантности состоит из небольшого количества пунктов, но получается достаточно громоздкой и массивной. Но при правильном составлении вы сможете легко манипулировать позициями ключей и усиливать при необходимости ту или иную позицию, если страница не будет показывать рост в выдаче. В любом случае, приступать к продвижению без составления КР браться не следует.

Релевантность и продвижение сайта | AllForJoomla apps

Релевантность страниц сайтов (текст, ссылочная масса) — является одним из важнейших деталей продвижения в поисковых системах. Что же такое релевантность и каким образом данный показатель может повлиять на развитие сайта?

Поисковые запросы. Обращаясь к поисковым системам, пользователи зачастую используют определенные запросы, благодаря которым поисковая система определяет желания посетителя. Из-за того, что пользователь не всегда может правильно выразить свои желания при помощи поискового запроса, он получает нерелевантность выдачи. Хотя поисковик будет считать, что корректно ответил на введенные запросы.

Желания пользователей. Если вы решили воспользоваться поисковой системой для того, чтобы найти варианты ответов на интересующие вас вопросы, то должны иметь некоторые представления о нужных результатах. Если таковой результат не получен, поисковая машина продолжает поиск.

Результаты выдачи поисковых систем. Поисковики, как правило, сортируют релевантные документы, которые были найдены таким образом, чтоб пользователь мог, как можно быстрее, найти нужный документ.

Поиск. Ни одна поисковая система не владеет ожиданиями или желаниями пользователей. Однако же, поисковая система имеет конкретные запросы, по которым и выполняется поиск.

Выбор результатов. Пользователь не обязательно выбирает первый результат из всего списка. Но поисковая машина считает, что именно этот результат, который находится первым в списке, является самым подходящим. И, в итоге получается, что самый первый результат является нерелевантным, по сведениям пользователей.

То есть главная задача поисковиков — это, непосредственно поиск какой-либо информации, релевантной запросам пользователя. Релевантность означает оптимальное соответствие желаемой информации и получаемой информации в действительности.

Теперь давайте рассмотрим, насколько релевантны те страницы, которыми мы можем управлять. При продвижении и оптимизации сайта, множество специалистов пренебрегают методом релевантности и допускают ошибку.

Итак, самые важные для оптимизации и раскрутки, являются несколько видов релевантности страниц веб-сайта:

1) Внешняя ссылочная релевантность

2) Внутренняя ссылочная релевантность

3) Релевантность текста.

Когда выполняется оптимизация веб-сайта под определенный запрос, очень важным аспектом является учет всех трех видов релевантности.

В то же время, не стоит забывать и о том, что не только какая-то определенная страница вашего ресурса должна быть релевантна запросу. Есть еще и конкретная область релевантности, которая включает в себя сбор большинства страниц всего сайта. Конечно же, среди страниц, которые попали в данное поле, существует градация релевантности.

Предоставление соответствующих ответов на запросы к базам данных электронной коммерции

  • Агравал С., Чаудхури С., Дас Г., Гионис А.: Автоматическое ранжирование результатов запросов к базе данных. В: Труды CIDR, стр. 171–183 (2003 г.)

    Google ученый

  • Чаудхури С., Дас Г., Христидис В., Вейкум Г.: Вероятностное ранжирование результатов запросов к базе данных. В: Труды VLDB, стр. 102–111 (2004)

    Google ученый

  • Кули Р., Сривастава Дж., Мобашер Б.: Интеллектуальный анализ в Интернете: обнаружение информации и шаблонов во всемирной паутине. В: Труды ITCAI, стр. 121–130 (1997)

    . Google ученый

  • Хачани, Н., Оунелли, Х.: Основанный на знаниях подход к гибким запросам баз данных. В: Труды DEXA, стр. 420–424 (2006)

    Google ученый

  • Итикава Т., Хиракава М.: ARES: реляционная база данных с возможностью гибкой интерпретации запросов.IEEE Transactions on Software Engineering 12(5), 624–634 (1986)

    Google ученый

  • Килинг, В.: Основы предпочтений в системах баз данных. В: Труды VLDB, стр. 311–322 (2002)

    . Google ученый

  • Meng, X.F.: Предоставление гибких запросов к веб-базам данных. В: Ловрек И., Хоулетт Р.Дж., Джейн Л.К. (ред.) KES 2008, часть II. LNCS (LNAI), том.5178, стр. 601–606. Springer, Heidelberg (2008)

    CrossRef Google ученый

  • Ма, З.М., Мэн, X.Ф.: Основанный на знаниях подход к ответам на нечеткие запросы к базе данных. В: Ловрек И., Хоулетт Р.Дж., Джейн Л.К. (ред.) KES 2008, часть II. LNCS (LNAI), том. 5178, стр. 623–630. Springer, Heidelberg (2008)

    CrossRef Google ученый

  • Рабитти, Ф.: Поиск мультимедийных документов по неточной спецификации запроса.В: Bancilhon, F., Tsichritzis, D.C., Thanos, C. (eds.) EDBT 1990. LNCS, vol. 416, стр. 202–218. Springer, Heidelberg (1990)

    CrossRef Google ученый

  • Su, W.F., Wang, J.Y., Huang, Q.: Ранжирование результатов запроса в веб-базах данных электронной коммерции. В: Труды CIKM, стр. 575–584 (2006)

    . Google ученый

  • Тахани, В.: Концептуальная основа обработки нечетких запросов: шаг к очень интеллектуальным системам баз данных.Управление обработкой информации 13, 289–303 (1997)

    CrossRef Google ученый

  • Заде, Лос-Анджелес: Нечеткие множества. Информация и контроль 8(3), 338–356 (1965)

    МАТЕМАТИКА перекрестная ссылка MathSciNet Google ученый

  • Соответствующие запросы — Как обсудить

    Соответствующие запросы

    Если вы хотите улучшить SEO, важно учитывать релевантные условия поиска, такие как ВРЕМЯ.поисковые запросы, которые ваши целевые пользователи будут использовать в поисковых системах. Один из способов узнать, на какие ключевые слова ориентироваться, — это провести исследование ключевых слов. Это поможет вам определить, насколько популярны эти запросы и насколько сложно их ранжировать. Обычно считается, что существует три разных типа поиска: навигационный, информационный и транзакционный. Навигация — это поисковый термин, используемый для поиска определенного веб-сайта, например Facebook. Информационные запросы охватывают широкие темы, для которых можно считать релевантными тысячи результатов поиска.Запросы на транзакцию указывают на намерение завершить транзакцию, которая обычно представляет собой покупку. Например, поиск определенного продукта будет считаться запросом на транзакцию. В этих трех группах находятся поисковые запросы, релевантные вашей целевой группе.

    Буквальные значения релевантных запросов

    Релевантные:
    Значения релевантных:
    1. Непосредственно связаны, связаны или связаны с предметом.

    2. В настоящее время не устарел.

    Соответствующие приговоры
    1. Его мать предоставила соответствующую справочную информацию о его здоровье.

    Запросы:
    Значение запросов:
    1. Один вопрос, один опрос (США), один опрос (Великобритания).

    2. Знак вопроса.

    3. Инструкции отправлены в базу данных.

    4. Задать вопрос.

    5. Спрашивай, спрашивай.

    6. Вопрос или вопрос.

    7. Передайте ряд операторов в базу данных, чтобы извлечь из нее информацию.

    8. Как отправить личное сообщение (пользователю IRC).

    9. Отправить петицию.

    Предложения вопросов
    1. Учитель ответил на вопрос ученика о биосинтезе.

    2. Администратор базы данных включил ведение журнала запросов в целях отладки.

    Справочный центр Google Search Appliance

    Обслуживание > Внешние интерфейсы > Связанные запросы

    Используйте страницу Serving > Related Queries для выполнения следующих задач:

    Вы используете связанные запросы, чтобы связать альтернативные слова или фразы с заданными условиями поиска.Когда пользователь вводит указанный поисковый запрос, альтернатива появляется как предложение. Пользователь может щелкнуть предложенную альтернативу, чтобы начать новый поиск.

    Например, если пользователь ищет «Марк Твен», в результатах поиска может быть предложено «Сэм Клеменс». Связанные запросы появляются на странице поиска после слов «Вы также можете попробовать», если вы не измените текст с помощью таблицы стилей XSLT.

    Связанные запросы отображаются как предложения на странице результатов поиска только тогда, когда пользователь выполняет поиск точно по указанному вами критерию поиска.В следующей таблице приведены примеры условий поиска и связанных запросов.

    Поисковый запрос

    Связанный запрос

    НАТО Организация Североатлантического договора
    Организация Североатлантического договора НАТО
    Марк Твен Сэм Клеменс
    Сэм Клеменс нет

    Связанный запрос не относится к части поискового запроса.Например, если вы связываете связанный запрос «Сэм Клеменс» с поисковым запросом «Марк Твен», а пользователь ищет «рассказы о Марке Твене», результаты поиска не предлагают «рассказы о Сэме Клеменсе».

    Связанные запросы работают только в одном направлении. Если вы укажете, что термин B является связанным запросом для термина A, на странице результатов отображается предложение попробовать термин B после того, как пользователь выполнит поиск термина A. Если пользователь ищет термин B, предложение не появится. Чтобы создать взаимные ассоциации, вы указываете два запроса, чтобы каждый термин был связанным запросом для другого.

    Примечание: Если вы изменяете или создаете новые поисковые запросы, ожидайте задержки перед обновлением конфигурации.

    Для использования связанных запросов:

    1. Щелкните Обслуживание > Внешние интерфейсы .
    2. Щелкните ссылку Редактировать рядом с внешним интерфейсом коллекции, который вы хотите изменить.
    3. Перейдите на вкладку Связанные запросы .
      На этой странице вы можете просматривать, редактировать, создавать, а также импортировать и экспортировать связанные запросы.

    Перед запуском этих задач

    Прежде чем добавлять связанные запросы или работать с ними, определите внешний интерфейс, где вы хотите его использовать: если вы используете только default_frontend, определите, хотите ли вы использовать в нем связанные запросы. Если вы хотите добавить связанные запросы только для определенной группы конечных пользователей, вы должны создать внешний интерфейс для этой группы конечных пользователей. Чтобы создать внешний интерфейс, используйте страницу Serving > Front Ends .

    Добавление новых связанных запросов

    Когда вы добавляете связанный запрос, вы вводите условие поиска и укажите связанный запрос, который вы хотите предложить пользователям.Условия поиска и связанные запросы могут быть словами или фразами.

    Чтобы добавить новые связанные запросы:

    1. Щелкните ссылку Добавить Связанные запросы (по умолчанию).
    2. В поле Search Term введите поисковый запрос.
    3. В поле Связанный запрос введите предлагаемый связанный запрос.
    4. Нажмите кнопку Сохранить новые связанные запросы . Откроется страница Просмотр связанных запросов .

    Редактирование связанных запросов

    Для редактирования связанных запросов:

    1. Щелкните ссылку Редактировать Связанные запросы .
    2. Для поиска похожих запросов на этой странице введите полное или частичное соответствующий запрос в поле поиска и нажмите кнопку Search .
      Отображаются все связанные запросы, содержащие строку поиска.
    3. Щелкните ссылку Показать все Связанные запросы , чтобы отобразить все доступные связанные запросы.
    4. Чтобы удалить связанный запрос, установите флажок слева от связанного запроса.
    5. После внесения всех изменений нажмите кнопку Сохранить изменения .

    Просмотр связанных запросов

    Для просмотра связанных запросов:

    1. Щелкните ссылку Просмотр связанных запросов .
    2. Для поиска похожих запросов на этой странице введите полное или частичное соответствующий запрос в поле поиска и нажмите кнопку Search .
      Отображаются все связанные запросы, содержащие строку поиска.
    3. Щелкните ссылку Показать все связанные запросы , чтобы отобразить все доступные связанные запросы

    Удаление связанных запросов

    Чтобы удалить связанные запросы:

    1. Щелкните ссылку Изменить связанные запросы .
    2. Установите флажок для соответствующего запроса в столбце Удалить .
    3. Щелкните Сохранить изменения .

    Импорт или экспорт связанных запросов

    Вы можете импортировать связанные запросы из URL-адреса или из файла формата .csv. Вы можете создать файл .csv в редакторе электронных таблиц, например в электронных таблицах Документов Google, введя условие поиска в первом столбце и связанный с ним запрос во втором столбце. Добавьте по одному связанному запросу на строку. Поскольку связанные запросы перезаписываются, когда создается новый связанный файл запроса. импортируется, экспортируйте текущую версию перед внесением изменений.

    Чтобы импортировать связанные запросы с URL-адреса:

    1. Щелкните ссылку Импорт/экспорт связанных запросов .
    2. Введите URL в поле URL.
    3. Щелкните Импортировать связанные запросы сейчас .

    Чтобы импортировать связанные запросы из файла:

    1. Щелкните ссылку Импорт/экспорт связанных запросов .
    2. Щелкните Обзор.
    3. Выберите файл.
    4. Щелкните Открыть .
    5. Щелкните Импортировать связанные запросы сейчас .

    Чтобы экспортировать связанные запросы из этой системы в локальный файл:

    1. Нажмите Экспорт связанных запросов сейчас .
      Отображается мастер загрузки файлов.
    2. Сохраните файл с расширением .csv, который можно открыть в Microsoft Excel.

    Для получения дополнительной информации

    Подробную информацию о связанных запросах см. в разделе «Использование связанных запросов для предложения альтернативных поисков» статьи «Создание условий поиска: рекомендации», ссылки на которую можно найти в справочном центре Google Search Appliance.


    Связанные запросы | САС

    Связанные запросы


    Teragram Related Queries — это функция, предлагающая связанные поисковые подсказки, которая быстро становится общепризнанным стандартом в современных поисковых приложениях. Например, если кто-то ищет «обувь», система может предложить следующие похожие поисковые запросы: «Кроссовки для бега, Кожаная обувь, Замшевая обувь, Теннисная обувь, Обувь Nike» и другие. Эту функцию можно использовать, чтобы предлагать более конкретные поисковые запросы для ваших текстовых или электронных поисковых систем.Поисковые системы каталогов и электронной торговли используют эту функцию, чтобы увеличить трафик, улучшить продажи и информировать клиентов о рекламных акциях более широкого спектра продуктов.

    Teragram Telated Queries использует неявный интеллект большой запрашивающей аудитории; он создает связанные запросы, которые будут направлять и улучшать поиск для всех пользователей. Связанный поиск — это программный пакет, который позволяет любой системе проводить необходимые статистические корреляции между прошлыми запросами из больших несортированных журналов запросов.Это позволяет точно генерировать связанные поиски для любого будущего запроса. Это ценный процесс интеллектуального анализа данных, который является быстрым, простым в использовании и критически контролируемым. Связанные поиски могут быть мгновенно возвращены из любого приложения с помощью надежного внутреннего интерфейса Teragram. В дополнение к статистическому анализу журналов программное обеспечение Teragram’s Related Queries использует данные, созданные вручную, что позволяет осуществлять заранее определенный поиск рекламных ссылок или других специальных рекламных акций.

    Использование связанного поиска от Teragram состоит из двух отдельных этапов.Во-первых, компилятор, предоставляемый Teragram, будет статистически обрабатывать необработанный журнал запросов для создания сжатой структуры данных, известной как классификатор Teragram. Классификаторы Teragram эффективны и быстры, и этот классификатор будет настроен с использованием набора входных данных для производства связанных поисков. На втором простом этапе данные классификатора затем становятся доступными для вызывающего приложения через API классификатора Teragram (интерфейс прикладного программирования). Теперь любое поисковое приложение может мгновенно генерировать связанные поиски для новых входных данных запроса.

    Запросы на переписывание  | Программируемая поисковая система  | Разработчики Google

    На этой странице описывается, как изменить или ответить на запросы ваших пользователей, чтобы предоставить результаты поиска, которые являются более релевантными или удовлетворяют требованиям вашего сайта.

    1. Обзор
    2. Добавление поисковых запросов с уточняющими метками
    3. Расширение поисковых запросов с помощью синонимов
    4. Автозаполнение запросов

    Обзор

    Если вы хорошо знаете свою аудиторию, вы можете примерно предсказать, что они могут искать.Вы можете предвидеть их запросы и помочь им найти более релевантные результаты.

    Программируемая поисковая система

    позволяет вам добавлять условия поиска к запросам ваших пользователей и создавать синонимы запросов ваших пользователей. Первая функция реализуется посредством уточнений, которые ваши пользователи могут применять или игнорировать; в то время как функции синонимов действуют на запросы ваших пользователей, не требуя каких-либо действий пользователя.

    Добавление поисковых запросов с уточняющими метками

    Чтобы предоставить уточняющие ссылки, которые добавляют полезные условия поиска к запросам пользователей, используйте элемент Переписать в XML-файле аннотаций программируемого поиска.Элемент добавляет условия поиска к запросам ваших пользователей, когда они нажимают ссылку уточнения. Элемент Rewrite может содержать до 100 символов, все из которых должны быть строчными, за исключением операторов поиска в верхнем регистре, таких как ИЛИ . Дополнительные сведения об операторах поиска см. в разделе Advanced Search Made Easy. Дополнительные сведения об уточнениях см. в разделе Уточнение поиска.

    В следующем примере показано, как можно использовать Переписать .

    <Система пользовательского поиска>
      Университеты
      <Контекст>
        <Аспект>
          
            <Ярлык name="assignments" mode="BOOST">
              <Переписать>домашнее задание ИЛИ задание
            
          
        
      
     

    В этом примере показано, как помочь пользователям, которые нажимают ссылку уточнения под названием «Домашнее задание».Он добавляет дополнительные условия поиска «домашнее задание» и «задание» к поисковому запросу, который вводят ваши пользователи.

    Уточнение с элементом Rewrite имеет следующую структуру:

    Наверх

    Расширение поисковых запросов с помощью синонимов

    Вы можете расширить поисковые запросы своих пользователей, используя синонимов , которые являются вариантами поискового запроса. Например, поисковый запрос, связанный с финансами, «проценты» может иметь следующие эквивалентные варианты: «доходность», «дивиденды», «купон» и т. д.Если вы создадите синонимы для «интереса» в своей финансовой поисковой системе, вашим пользователям не нужно будет вводить несколько вариантов, чтобы найти информацию, которую они ищут. Программируемая поисковая система будет автоматически искать все сайты, имеющие отношение к «процентам», «доходу», «дивидендам», «купонам» и другим связанным терминам.

    Критерий поиска с определенными вами синонимами автоматически запускает расширение поиска независимо от того, вводит ли пользователь поисковый термин сам по себе или вместе с рядом других слов.Допустим, вы определили «ниндзя» как поисковый запрос с вариантом синонима «убийца». Любой поисковый запрос, включающий слово «ниндзя», например просто «ниндзя» или «конкурс по поеданию хот-догов ниндзя», расширит запрос, включив в него синонимичные варианты. Это как если бы пользователь искал «ниндзя ИЛИ убийца» или «конкурс поедания хот-догов ниндзя ИЛИ убийца».

    Передовой опыт

    Популярные термины запросов, распространенные аббревиатуры (такие как «CD» для «депозитного сертификата») и знакомые аббревиатуры (такие как «munis» для «муниципальных облигаций»), характерные для вашей области специализации или интересов, — отличные кандидаты на использование синонимы.Если ваша поисковая система достаточно популярна и получает много запросов по одним и тем же запросам, вы можете получить данные о своих самых популярных запросах на странице статистики. Перейдите в Панель управления и для вашей поисковой системы и нажмите на ссылку статистика . Популярные запросы перечислены внизу страницы.

    Вам не нужно создавать синонимы для популярных условий запроса. Например, термины «Великобритания», «Великобритания», «Соединенное Королевство», «Соединенное Королевство Великобритании» являются довольно известными вариантами (если не технически синонимами) для большинства пользователей Интернета.В Google уже есть большое количество синонимов для таких терминов, и вам не нужно повторять эту работу. Вместо этого создайте синонимы для общих терминов, которые соответствуют интересам пользователей вашей поисковой системы. Например, в финансовой поисковой системе «облигация» будет отличным кандидатом. Google может не знать, что ищут пользователи: «Джеймс Бонд», «химическая связь», «адгезионная связь» или «эмоциональная связь». Вы, с другой стороны, знаете, что они ищут финансовый инструмент, и можете легко подобрать такие синонимы, как «ценная бумага с фиксированным доходом» и «выпуск».

    Если вы не можете определить, является ли термин общим или уникальным, вы можете протестировать термин и его варианты в поиске Google. Введите условие запроса (например, «Сан-Франциско») в поиске Google, а затем откройте новое окно браузера. В поле поиска Google введите условие запроса, оператор поиска OR и вариант условия запроса (например, «san francisco OR sf»). Сравните две страницы результатов. Если они точно такие же, то Google охватывает синонимичные термины.

    Создание синонимов

    В отличие от других функций программируемой поисковой системы, XML для синонимов создается не в файле контекста и не в файле аннотаций, а в отдельном файле.Как и в случае любого XML-файла, вы можете использовать простой текстовый редактор для создания и редактирования файла синонимов. Просто сохраните текстовый файл с расширением .xml (например, cse_syn_finance.xml ).

    Вот пример файла синонимов:

    <Синонимы>
      <Термин-синоним="акции">
        капитал
        поделиться
      
      <Синоним термин="облигация">
        ценные бумаги с фиксированным доходом
        <Вариант>проблема
        Высокодоходный долг
      
     

    Файл синонимов содержит один элемент и один дочерний элемент, который может иметь несколько одноуровневых элементов, как описано в следующей иерархии:

    • Синонимы (только 1)
      • Термин-синоним (допускается несколько братьев и сестер)
        • Вариант (до 10 для каждого Синоним )

    Критерий поиска создается в значении атрибута дочернего элемента Synonym и определяется каждый из его синонимов в элементе Variant .Поисковый запрос и варианты его синонимов могут состоять из одного слова (например, «печенье») или фраз (например, «печенье с пахтой» или «плакать над пролитым молоком»).

    Ограничения

    В следующей таблице перечислены ограничения для файлов синонимов:

    Артикул Максимально допустимое значение
    Количество условий поиска (элемент термин-синоним ) Несколько условий поиска, если общее количество вариантов не превышает 500 для каждой поисковой системы.
    Количество вариантов ( Вариант элементов) для каждого условия поиска 10

     

    Общее количество вариантов ( Вариант элементов) для поисковой системы 2000
    Размер файла 500 КБ
    Количество файлов Столько, сколько вам нужно, если совокупный размер всех файлов в учетной записи не превышает 4 МБ

    Наверх

    Автозаполнение запросов

    Автозаполнение — это список предлагаемых запросов, которые появляются по мере ввода пользователем в поле поиска.

    Рисунок 1: При вводе всего нескольких символов в поле поиска открывается раскрывающийся список с вариантами для различных поисковых запросов.

    Список необязательных запросов, используемых для автозаполнения, частично определяется содержанием веб-сайта и популярностью термина запроса. Однако вы можете настроить автозаполнение, добавив или удалив из него термины либо в панели управления, либо посредством массовой загрузки в файле XML.

    Включение автозаполнения

    Чтобы включить автозаполнение в поисковых системах с помощью программируемого элемента поиска:

    1. В Панели управления щелкните раздел Автодополнения .
    2. Установите флажок Включить автозаполнение .
    3. Щелкните Сохранить изменения .
    4. Перейдите на вкладку Получить код , скопируйте сгенерированный фрагмент кода и вставьте его на свою веб-страницу.

    Вы можете добавлять или удалять отдельные термины в разделе Автодополнения Панели управления или загружать все термины с помощью XML. Добавляемые термины отображаются над алгоритмически сгенерированными терминами для всех запросов.

    Может пройти до 12 часов, прежде чем условия автозаполнения начнут появляться в вашей поисковой системе.

    Чтобы массово добавить или удалить термины, загрузите XML-файл автозаполнения. Как и любой XML, вы можете использовать простой текстовый редактор для создания и редактирования файла синонимов. Просто сохраните текстовый файл с расширением .xml (например, cse_autocompletion_finance.xml).

    Добавление и удаление условий автозаполнения

    Вот пример файла автозаполнения, который вы можете загрузить.

    <Автодополнения>
      <Автодополнение term="cake" type="1" language=""/>
      <Термин автозаполнения="strawberry.*" тип="2" соответствие="2" язык=""/>
      <Автодополнение term="vanilla" type="2" language=""/>
      <Автодополнение term="apple" type="3" language="">
        
        
      
    
     

    В примере кода «яблоко» включено в список возможных термины автозаполнения, тогда как «ванильный» и любой термин, начинающийся с «клубничный» никогда не будет представлен пользователю как термин автозаполнения. Кроме того, реклама для URL-адреса www.example.com/applepieforsale будет появляться всякий раз, когда пользователи ищут слово «яблоко».

    Файл автозавершения содержит один элемент и один дочерний элемент, который может иметь несколько одноуровневых элементов, как описано в следующей иерархии:

    • Автодополнения (только 1)
      • Автозаполнение (допускается несколько одноуровневых элементов)

    В следующей таблице перечислены имена атрибутов автозаполнения.

    Имя атрибута Описание Значение
    срок Отдельный термин или регулярное выражение для включения или исключения. Термин автозаполнения для включения или исключения. Например, если вы хотите добавить «тени шторма» в список терминов автодополнения, представляемых вашим пользователям, добавьте «тени бури» в качестве значения. Обратите внимание, что использование одного и того же термина в нескольких записях Autocompletion приведет к ошибке.Термин может содержать до 100 символов. Термины, содержащие более 100 символов, будут игнорироваться.
    тип Укажите, должен ли термин быть включен или исключен из автозаполнения. Укажите:
  • 1 — включить термин
  • 2 — исключить термин
  • 3 — добавить акцию в автозаполнение.
  • совпадение Дополнительно. Укажите, хотите ли вы, чтобы термин совпадал точно или с обычным выражение. Укажите:
  • 1 По умолчанию . Полное совпадение.
  • 2 — для регулярного выражения. Только исключенные термины могут использовать регулярное выражение.
  • язык Дополнительно. Укажите язык автодополнения. Оставьте это значение неопределенным, так как программируемая поисковая система по умолчанию использует язык, который вы определили в разделе «Основные» панели управления.

    Чтобы активировать рекламные акции в автозаполнении, добавьте элемент Promotion .

    В следующей таблице перечислены имена атрибутов продвижения. Больше информации об акциях.

    Имя атрибута Описание
    идентификатор Уникальный строковый идентификатор акции для отображения в автозаполнении.
    запросы Набор пользовательских запросов, разделенных запятыми, любой из которых вызовет продвижение.Например, если запросы указаны как apple,orange , продвижение будет запущено, когда пользователь введет любое из следующих действий:
    Название Название акции.
    дата_начала Дополнительно. Дата, когда акция должна появиться впервые.
    дата_конца Дополнительно. Последняя дата, когда должна появиться акция.
    image_url Дополнительно. URL-адрес, указывающий на изображение, которое будет отображаться в рекламной акции.
    описание Дополнительно. Текстовое описание акции.

    Наверх

    10 наиболее актуальных вопросов, которые следует задать интервьюеру

    Если вы когда-либо сталкивались с каким-либо собеседованием, то наверняка слышали эту фразу от интервьюеров: У вас есть какие-либо вопросы? Действительно, интервьюер ожидает, что вы зададите несколько важных вопросов, чтобы определить ваш интерес и рвение к возможности трудоустройства.Более того, задавая соответствующие вопросы интервьюеру, вы не только производите правильное впечатление, но также помогаете узнать некоторые полезные идеи о компании, такие как среда компании , ваши повседневные задачи , будущие возможности и многое другое. Хотя вы должны быть очень обеспокоены и задавать интервьюеру только актуальные и стоящие вопросы для лучших результатов!

    Тем не менее, вы можете спонтанно придумывать различные вопросы во время собеседования, но наличие нескольких вопросов, подготовленных до собеседования, повысит вашу уверенность и даст вам преимущество перед другими кандидатами.Теперь вы, должно быть, думаете, что — Какие важные вопросы следует задавать на собеседовании? Не беспокойтесь, здесь, в этой статье, мы расскажем вам о нескольких наиболее рекомендуемых и актуальных вопросах, которые вы можете задать интервьюеру , чтобы произвести правильное впечатление и повысить свои шансы на успех.

    1. Расскажите, пожалуйста, о культуре и ценностях компании?

    Здесь вы можете начать задавать вопросы. Этот вопрос поможет вам узнать о культуре и основных ценностях компании, что в дальнейшем поможет вам определить рабочую среду организации.Другая цель этого вопроса — сообщить интервьюеру, что вы искренне заинтересованы и обеспокоены этой конкретной вакансией и хотите знать обо всех необходимых аспектах компании для этого профиля работы.

    2. Каковы будут мои основные обязанности на этой должности?

    Этот вопрос поможет вам подробно узнать о вашей должности и о том, каковы будут ваши повседневные задачи в организации по указанному профилю работы.Хотя вы должны иметь в виду, что если ваши повседневные задачи или обязанности четко и подробно упомянуты в описании работы или предоставлены интервьюером заранее, постарайтесь не задавать этот конкретный вопрос.

    3. Что будет самым большим вызовом на этой должности?

    Еще один важный вопрос! Во-первых, это позволит вам узнать о реальной картине должности и других полезных сведениях (которых вы, вероятно, не получите из описания работы) и поможет вам подготовиться к проблемам или вызовам, с которыми вы столкнетесь. лицом к назначенному рабочему месту.Во-вторых, это даст интервьюеру представление о вашей проблеме , связанной с качеством или навыком , когда вы подробно обсудите это.

    4. Какие перспективы карьерного роста по данному профилю?

    Этот вопрос также уместно задать интервьюеру. Это поможет вам узнать о будущих карьерных возможностях и процессах карьерного роста в компании. Этот вопрос также поможет вам сообщить интервьюеру о вашем долгосрочном видении или плане работы в компании .Кроме того, вы должны следить за тем, чтобы не задавать несколько ненужных или нежелательных вопросов, касающихся карьерного роста, таких как – когда я получу прибавку к зарплате или продвижение по службе и т. д.

    5. Есть ли какие-либо возможности профессионального развития для сотрудников?

    Здесь вы можете спросить, продвигает ли компания культуру профессионального развития и предлагает несколько программ развития. Это поможет вам узнать, предлагает ли компания возможности для обучения и роста сотрудников или нет.Это также позволит интервьюеру узнать о ваших целях обучения и профессионального развития . Однако, задавая этот вопрос, вы должны помнить, что он не должен звучать слишком эгоистично или индивидуалистично, так как это может оказать негативное влияние на интервьюера.

    6. Каковы цели компании на будущее?

    Действительно, помимо вопросов о карьерном росте или других возможностях профессионального развития, вы также должны спросить о будущих целях и задачах компании .Это даст интервьюеру представление о вашем интересе и интересе к компании и возможностям трудоустройства. Кроме того, вы также можете превратить этот вопрос в возможность сообщить интервьюеру о вашем предыдущем исследовании компании, поделившись несколькими важными идеями или информацией о компании относительно будущих целей.

    7. Как компания оценивает работу сотрудников?

    Вы можете задать этот вопрос, чтобы показать свое любопытство к должности и свое видение долгосрочной работы в компании.Кроме того, это поможет вам найти дополнительную ценную информацию о профиле работы и карьерном росте в компании, которая поможет в будущем. Вы можете узнать о нескольких ключевых показателях эффективности и других показателях эффективности, над которыми работает компания, ответив на этот конкретный вопрос.

    8. Могу ли я что-нибудь еще уточнить в отношении моей квалификации, резюме и т. д.?

    Помните, что собеседование еще не закончилось, и у вас все еще есть шанс произвести впечатление на интервьюера и продемонстрировать свои навыки и сильные стороны, которые еще не обсуждались.Следовательно, вам рекомендуется спросить интервьюера, можете ли вы предоставить ему что-то еще , что было бы полезно для вашей оценки и принятия окончательного решения. Тем не менее, не хвастайтесь никакими нерелевантными или ненужными навыками с точки зрения конкретного профиля работы.

    9. Какие предложения вы хотели бы дать мне на основе моего выступления на собеседовании?

    Вы можете запросить у интервьюера несколько предложений или отзывов по поводу прохождения собеседования , чтобы произвести правильное впечатление и наладить с интервьюером более тесные профессиональные связи.Это не только покажет интервьюеру ваш оптимизм и позитивный характер, но также поможет вам получить несколько полезных предложений или советов, которые в дальнейшем очень помогут вам на предстоящих собеседованиях или других карьерных возможностях в будущем.

    10. Какие будут дальнейшие шаги в процессе собеседования?

    Хотя этот вопрос можно рассматривать как часть последующего процесса , и вы можете задать его интервьюеру по телефону , продемонстрируйте свой энтузиазм и преданность возможности трудоустройства.Кроме того, это поможет вам узнать о дальнейшем процессе собеседования и соответствующем расписании , чтобы подготовиться соответствующим образом. Тем не менее, вы должны быть очень профессиональны и обязаны, задавая этот вопрос, и не действовать слишком нетерпеливо или нетерпеливо.

    Итак, вот несколько наиболее рекомендуемых вопросов, которые вы можете задать на собеседовании, чтобы оказать положительное влияние на интервьюера. Однако вы можете задать и другие вопросы в соответствии со сценарием интервью.Все, что вы должны иметь в виду, это то, что вопросы должны быть конкретными и иметь отношение к профилю работы!!

    Google будет учитывать прошлые поисковые запросы, чтобы предлагать новые запросы

    В прошлом месяце Google объявила о ряде обновлений для улучшения базовой технологии поиска. Возможности понимания языка, представленные в этом году, позволяют Google учитывать ваши прошлые запросы, чтобы предлагать дополнительные поисковые запросы.

    В прошлом поисковые запросы в значительной степени отделялись друг от друга, поскольку запрос не влиял на то, как Google отображает последующие.Например, если вы искали «рецепты индейки», а затем «нарезку», Google ничего не сделает, чтобы связать или персонализировать второй термин с первым. Скорее, поисковая система просто «использует наиболее распространенную интерпретацию результатов ранжирования».

    Двигаясь дальше, поиск слова «резьба» после запроса, связанного с индейкой, предложит новый поиск «резьбы индейки», который более релевантен, чем просто предложение определения. Эти поисковые запросы, на которые повлияли прошлые поисковые запросы, помечены Google как «Предложенные на основе вашей недавней активности».В целом, это чем-то похоже на то, как Ассистент поддерживает дополнительные вопросы без повторного указания темы или предмета.

    Но с этим изменением мы можем определить, что вы хотите узнать больше о приготовлении и подаче индейки, и предоставим вам полезное предложение в верхней части страницы результатов поиска, чтобы помочь вам найти то, что вы на самом деле искали. для:

    Точно так же Google будет учитывать прошлые поисковые запросы, чтобы предлагать новые запросы (и предложения контента) в рамках исследования темы на основе карусели:

    Допустим, вы ищете фильм для всей семьи.Когда вы ищете праздничные фильмы для всей семьи, такие как «Полярный экспресс» и «Рождественская история», Google может определить, что вы изучаете похожие идеи, и показать список похожих фильмов, чтобы вам было проще найти идеальный вариант.

    В последнем обновлении в списке «Люди также задают» появятся «более актуальные вопросы»:

    До введения этих функций, если вы искали «как сделать веер для салфеток», Google мог помочь вам найти дополнительную информацию, показывая вам похожие вопросы, такие как «Как сделать конусную салфетку?» Благодаря контекстному обучению Google может найти еще более актуальные вопросы в разделе «Люди также спрашивают», например «Как сделать индейку из тканевой салфетки?»

    FTC: Мы используем автоматические партнерские ссылки, приносящие доход. Еще.


    Проверьте 9to5Google на YouTube для получения дополнительных новостей:

    .

    Добавить комментарий

    Ваш адрес email не будет опубликован.