Почему весь ТОП 10 — это «украденный» контент - Google отвечает
Редактор популярного новостного сайта The Verge написал в Твиттере, что новая статья была заменена на первой странице результатов поиска Google другими сайтами, которые ее скопировали. Дэнни Салливан отвечает, почему это происходит.
Скопированный контент, который расстраивает издателей
Скопированный контент, который превосходит оригинал, — это то, что издатели выражали разочарование в течение многих лет.
Некоторые жалобы вызваны недоразумением.
Например, когда человек ищет бессмысленную фразу, например случайно выбранные слова из статьи, Google не знает, что делать с этим ненастоящим поисковым запросом, и на бессмысленную фразу нет ответа.
Так что Google по умолчанию использует текстовый поиск, что означает, что Google возвращает результаты поиска на основе слов в поисковом запросе, совпадающих со словами на веб-странице.
Настоящая проверка того, превосходит ли скопированный контент исходный контент в рейтинге, заключается в том, что скопированный контент превосходит исходный контент по конкурентным ключевым словам, которые на самом деле вводят пользователи.
Должна ли страница ранжироваться дважды, если она находится в топ-историях?
Но эта возникшая ситуация представляет другой сценарий. Что произошло, так это то, что Google не будет ранжировать заголовок статьи в верхней части обычных результатов поиска, если эта веб-страница уже ранжируется в популярных результатах Top Stories в верхней части веб-страницы.
Top Stories – это избранный результат, в котором Google показывает новостные статьи, связанные с поисковым запросом.
Поэтому, если кто-то ищет заголовок, Google обычно показывает статью вверху результатов поиска в разделе «Главные новости».
Но в этом случае исходная статья не отображается в верхней части обычных результатов поиска из-за того, что Google называет дедупликацией — алгоритмом, предотвращающим ранжирование одной и той же страницы дважды.
Итак, вопрос в том, должен ли Google ранжировать одну и ту же страницу дважды, один раз в Top Stories и снова в верхней части обычных результатов поиска?
Вся первая страница состоит из украденного контента
Кто-то из The Verge написал в Твиттере, что помимо раздела рекомендуемых новостей Google в верхней части результатов поиска, поиск заголовка новой статьи привел к тому, что Google показал целую десятку лучших, состоящую только из украденного контента.
Человек написал в Твиттере:
«Эй, Google, я только что искал заголовок, который был опубликован на моем веб-сайте, и ВСЮ ПЕРВУЮ СТРАНИЦУ после новостного окна было о веб-сайтах, крадущих наш контент. Грань не появлялась до второй страницы.
Эта проблема усугубляется».
Эй, Google, я только что искал заголовок, который был опубликован на моем веб-сайте, и ВСЮ ПЕРВУЮ СТРАНИЦУ после окна новостей были о веб-сайтах, крадущих наш контент. Грань не появлялась до второй страницы.
Дэнни Салливан из Google признал, что авторы, выполняющие поиск по заголовку, ожидают увидеть свои статьи в верхней части результатов поиска, а не на второй странице.
Но он также отметил, что поиск по заголовку не обязательно является способом поиска обычными пользователями.
Реакция Дэнни спорна. Можно привести разумный аргумент, что многие люди ищут заголовок статьи, когда хотят найти ее, чтобы поделиться ею с другом или в социальных сетях. Таким образом, есть реальная причина, по которой люди, не являющиеся автором статьи, могут искать название статьи.
Дэнни Салливан из Google написал в Твиттере:
«Мы посмотрим. Я знаю, что поиск по заголовку является обычным делом для писателей, и да, я ожидаю, что это будет показано первым для этого. Но это не отражает того, как большинство людей могут искать этот контент (а как они могут искать, я его нахожу). Но опять же, мы будем стремиться к лучшему».
Поисковые запросы, которые вызывают альтернативные результаты поиска
Следующий твит Дэнни Салливана объясняет, как поисковый запрос с большим количеством терминов, таких как термин заголовка, приводит к тому, что алгоритм Google как бы выбывает и начинает возвращать результаты поиска, которые больше похожи на поиск по ключевым словам в старом стиле, где результаты поиска не основаны на цель поиска или ссылки, но только на основе самих ключевых слов.
Как я упоминал выше, за поиском заголовков стоит цель поиска. Возможно, Google не распознал «поиск, ориентированный на заголовки», как намерение поиска, о котором должен знать алгоритм.
Новостные статьи и дедупликация
Дедупликация — это когда Google пытается предотвратить двойное ранжирование одной статьи в результатах поиска. Дэнни Салливан заявил, что причина, по которой статья может не отображаться в обычных результатах поиска, заключается в том, что она уже находится в топе новостей и находится в верхней части страницы.
Итак, вопрос в том, является ли это ситуацией, когда веб-страница должна ранжироваться дважды, потому что пользователь может захотеть увидеть исходную статью в верхней части результатов поиска, даже если она уже находится в разделе «Главные новости»?
Как только раздел «
Главные новости» исчезнет, новостная статья должна занять первое место в результатах поиска.
Мнение Скромного сеошника
Подобная проблема есть у всех поисковых систем. Скорее всего все дело в том, что уникальность контента не первоочередный фактор, который влияет на позиции сайта. Если мы говорим о том, что каждый фактор и т.д., это плюсик, то сайты которые воруют контент, скорее всего имеют больше плюсиков, чем тот, кто действительно первый опубликовал материал.
Подобная история была у меня когда продвигал сайт Етлиб. Тогда некий автор скопировал материал на Drive2 и по основному запросу стал на первое место, а Етлиб на второе.
Драйв на порядок мощнее был Етлиба и соответственно, поисковые системы поставили именно его на первую позицию: ссылочный вес, социальный отклик, внутренний и внешний поведенческий фактор.