Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA
Например, вы увидели картину, с кричащим человеком. Она вам очень понравилась, и вы решили найти ее в интернете. Но вы не знаете ни имени автора, ни названия самой картины, поэтому вы делаете следующий запрос:
Конечно, полотно не называется «картина, где человек кричит», но поисковик все равно помог нам найти именно то, что мы искали. В этом и есть принцип работы алгоритма «Королёв» – система ищет не только название материала, но и сам текст, размещенный на странице.
Такой же алгоритм работает и в Google, но уже под другим названием RankBrain.
Чем отличается от алгоритма «Палех»
Новый алгоритм «Королев» – это усовершенствованная версия предыдущего алгоритма компании, который носил название «Палех». Он был представлен в ноябре 2016 года и стал первым шагом в сторону семантического поиска. Его основная задача – лучше понять содержание контента на страницах.
В «Палехе» также использовались нейронные сети для поиска информации, но именно в «Королёве» увеличено их влияние на распределение сайтов поиске. Вот в чем отличия этих алгоритмов:
- В «Королеве» встроена система сравнения смыслов запросов. В Яндексе привели пример запросов «ленивая кошка из монголии» и «манул». Целью двух этих запросов является найти информацию о мануле, и новый алгоритм Яндекса «Королёв» удовлетворит оба варианта поиска
- В «Палехе» нейронные сигналы вступали в действие уже на последних этапах распределения информации, и останавливались примерно на 150 первых документах. Из-за такой схемы поиска терялось довольно много документов, особенно сложных , которые могли быть именно теми, что пользователь искал. «Королёв» ранжирует информацию уже на стадии индексирования, что приводит к вычислению 200 тысяч(!) документов.
После выпуска «Королева» поисковик смотрит не только на заголовок страницы, но и на ее содержание, на текст.
В чем суть работы и обучаемости нейронной сети
Яндекс не достиг бы таких высоких показателей без прямой связи с пользователями. Новый алгоритм совершенствуется и обучается с помощью обезличенной поисковой статистики. Система статистики учитывает, с какого запроса пользователь зашел на ту или иную страницу. Если он провёл на ней много времени, тогда вполне резонно предположить, что это именно та страница, которую он искал. Это значит, что поисковик выдал правильный ответ на вопрос пользователя.
Люди являются главными помощниками машин в этом дела. Яндексу нужна реальная оценка качества поиска от своих пользователей, поэтому они создали специальную платформу – Яндекс.Толока. Пользователи сервиса анализируют и оценивают работу поисковой системы. Они помогают компании улучшать качество работы алгоритма и получают за это денежное вознаграждение.
Раньше этим занимались нанятые работники – асессоры, но с ростом рынка спроса их стало катастрофически не хватать. Это и есть основной причиной создания Толоки.
На данный момент численность участников Толоки составляет больше миллиона человек.
С помощью алгоритма «Королев» Яндекс существенно сможет улучшить качество поиска. Люди сами делают свои запросы в Яндексе лучше, и чем больше людей будет привлечено в данный проект, тем меньше неудач в поиске на нас ждет в будущем.
Принцип работы нового алгоритма «Королёв»
Так же как и в алгоритме прошлого поколения «Палех», текст сайта с помощью нейросети преобразуется в смысловые векторы. «Королёв» высчитывает градиенты страниц не в тот момент, когда вы делаете запрос, а намного раньше, на этапе индексирования. Как только сайт проходит индексирование, к нему уже прикрепляются некоторые ключевые слова, которые поспособствуют дальнейшему упрощению поиска информации. Поэтому, когда вы вводите информацию, Яндекс уже выдает семантически схожие страницы.
Также система способна устанавливать связь между данным единичным запросом и другими запросами, которые способствуют попаданию пользователя на эту же страницу.
Влияет ли алгоритм на выдачу и нужно ли предпринимать какие-то действия, чтобы оптимизировать контент под «Королева»
Да, данный алгоритм в некоторой мере изменил поиск в Яндексе. Вот некоторые точные данные о том, насколько сильные есть изменения:
Как видим, изменение не являются феноменально большими. Особые изменение произошли в возрасте документов. В топ-100 поиска свежие документы теперь будут появляться намного чаще.
Оптимизировать статьи под «Королёв» нет смысла, потому что система учится определять смысл текста самостоятельно, а это значит, что в скором будущем в работе оптимизаторов значимость текстовой оптимизации снизится.