Существует три источника:
- Сбор данных с поисковой выдачи — отсюда можно получить данные о кликабельности сниппета. Очевидно, что если пользователи кликают по сайту, который находится на 3 или 4 месте чаще, чем по тому, который на первом, то он лучше отвечает на запрос (более релевантен) и потому заслуживает перемещения выше в поисковой выдаче. Также яндекс собирает данные по возвратам к выдаче с помощью кнопки «назад» в браузере — чем больше возвратов с сайта, тем он менее релевантен, а более соответствующим запросу будут сайты, которые завершают поиск.
- Яндекс.Метрика — собственный счетчик яндекса достаточно популярен в силу удобства, полноты представляемой статистики и её хорошей визуализации, а также мощного продвижения самим яндексом.
- Яндекс.Бар — надстройка для браузеров, которая предлагает быстрый доступ к сервисам поисковой системы и отображает полезные данные (погоду, пробки, курсы валют и так далее). Существуют вполне убедительные доказательства «шпионской» активности Бара. Он отслеживает и «отсылает в центр» примерно те же параметры, что и Яндекс. Метрика.
Вполне очевидно, что с такими мощными средствами сбора статистики о поведении /ндекс достаточно легко может присвоить каждому мало-мальски посещаемому сайту (и даже каждой странице) коэффициенты и параметры, которые затем используются в формуле ранжирования.