Как поисковики опираются на поведенческие данные при ранжировании (на примере Google)

Мы уже так много говорили о поведенческих факторах в нашем блоге, что, вероятно, у наших читателей уже сложилась вполне целостная картина и вряд ли кого-то удивит вопрос: на что при поиске может опираться Гугл или Яндекс, помимо ссылок? С ссылок всё начиналось, однако теперь у поисковых систем есть дополнительные источники данных, которые они в равной мере учитывают при формировании поиска. Сегодня мы приведём отрывки из статьи наших коллег, размещённой в блоге маркетингового продукта WordStream. Элиза Габберт пришла к весьма правильным выводам на основе собственного маркетингового опыта по поводу определения поведенческих факторов. Статья приводится сокращенно. Благодарим аналитический отдел ALTWeb Group за предоставленный материал и выражаем благодарность команде продукта по продвижению за счет поведенческих факторов SERPClick за помощь в переводе.

Мы уже говорили о том, что это пул данных на основе пользовательского поведения. Также приводили эту статью в переводе, которая утверждала, что поисковикам не обязательно обращаться к аналитике: пользовательские данные есть и в логах самого поиска, а также помним этот доклад, из которого можно судить о том, что информация из поисковых логов может определять качество выдачи, а значит, косвенно это подтверждает идею о том, что поисковые системы могут брать информацию из поисковых логов и использовать её как новый формат ранжирования. Автор статьи задаётся вопросом: на что, кроме ссылок, может опираться поисковая система при ранжировании и почему? Или — что было бы, если бы ссылок не было?

Что может быть альтернативой ссылкам и почему?

Задавшись вопросом по поводу того, что могло бы давать дополнительную, точную и уязвимую от внешних воздействий информацию о качестве поиска, автор предлагает мысленно отправиться на 15 лет назад, когда поисковых систем было несколько, а пользовались ими крайне мало.

Лихие девяностые — начало двухтысячных

Yahoo, Altavista, и другие поисковые системы конкурировали между собой, а поискового трафика было крайне мало. Нужно было придумать какую-то разметку для всего многообразия сайтов и попытаться отделить полезные от откровенно плохих. Эта мера была вполне оправдана и вряд ли когда-нибудь ссылочное ранжирование может полностью устареть. Однако по прошествии времени, у поисковых систем появились дополнительные источники информации, которые также можно использовать. Теперь в день можно зафиксировать миллионы запросов, поэтому новые факторы стали так же важны для Гугла как и ссылочное ранжирование. Теперь можно положиться на коллективный разум как огромный источник данных, который далеко не всегда включает в себя данные по ссылкам. Поведенческие факторы могут выступать новым инcтрументом более тонкой оценки качества поиска, который в своей статье автор так и называет: Quality Score.

Далее мы приводим перевод части статьи, в котором автор рассуждает о механизмах работы Quality Score на основе поведенческих факторов.

Какие параметры оценки качества могут применяться для органического поиска?

Алгоритм Гугла учитывает данные из огромного числа источников. (Конечно, доход приносит реклама, но реклама сама по себе существует за счет того, что кто-то приходит в поиск). А как можно ранжировать рекламу? Конечно, не основываясь на стоимости объявления, потому что в этом случае пришлось бы поступиться релевантностью. Поэтому оценка качества послужила для Гугла способом оценки рекламных объявлений по тому же принципу, по которому оценивается качество контента.

Показатель качества для рекламных объявлений Гугл в основном опирается на кликабельность (CTR). Конечно, у Гугла много красивых объяснений на по поводу того, как конкретно они подсчитывают этот показатель, однако мы провели собственное исследование и пришли к выводу, что в первую очередь важна кликабельность объявления на данной позиции по сравнению с ожидаемой кликабельностью на той же позиции. Что касается объявлений, у которых не было шанса быть показанными в топе, Гугл может достаточно быстро протестировать новое объявление и определить его потенциал, для этого может быть достаточно порядка 200 показов.

Мы считаем, что органическая выдача может использовать аналогичный алгоритм, основанный на подсчете поведенческих факторов в гораздо большей степени, нежели чем на оценке ссылочной массы. Решающими в этом случае будут следующие факторы:

Кликабельность
Процент отказов
Время на странице
Социальные сигналы
Количество комментариев
И другие

Гугл может фиксировать поведенческие факторы из аналитики, собственного браузера Chrome (кстати, наиболее используемый на мобильных устройствах браузер), а также из приложений типа Google+. Не так давно Мэтт Каттс упомянул, что Гугл не использует сигналы из Фейсбука или Твиттера в своём алгоритме ранжирования, однако многие подозревают, что создание Google+ было попыткой завладеть собственным источником социальных сигналов.

Показатель качества можно масштабировать. В Гугле только 3 миллиарда запросов в день но при этом 5.6 миллиардов показов рекламных объявлений (не считая ещё 24 миллиардов показов баннеров).

На этом мы вновь отвлечемся от оригинальной статьи и добавим от себя, что в дальнейшем мы вернёмся к теме факторов, дополняющих ссылочное ранжирование. Сюда будут входить две темы. Во-первых, это усиление ссылок — тема, которой посвящён наш продукт PFLink, позволяющий укрепить уже существующие ссылки переходами пользователей и тем самым повысить их важность для поисковых систем. В ближайшее время мы расскажем почему этот метод является эффективным для вебмастеров. Во-вторых, на поведенческие факторы можно воздействовать напрямую при помощи продукта SERPClick, который обеспечивает переходы пользователей на ваш сайт с заданными параметрами долготы сессии, возврата в поиск и другими важнейшими параметрами поведенческих факторов, которые позволяют выводить сайт на первую страницу поиска.
Источник: habrahabr.ru/company/altweb/blog/238861/

Как поисковики опираются на поведенческие данные при ранжировании (на примере Google)

Что может быть альтернативой ссылкам и почему?

Какие параметры оценки качества могут применяться для органического поиска?

Обсуждение