Private Blog Network
ДОМЕНЫ, САЙТЫ, ССЫЛКИ И SEO

Случайное из блога

20.11.2023 15:09

В YaC 2023 четыре серии. Первые три серии посвящены сервисам Яндекса, которые сопровождают нас дома, на улицах городов и в интернете. Четвертая серия – про людей, которые создают то, о чем говорится в предыдущих частях.

25.03.2016 19:20

Сегодня мы продолжим разговор об анализе сайта. Нас интересуют инструменты, которые позволят сделать достаточно быстро и просто бесплатный анализ сайта

09.12.2022 10:50

Перелинковка сайтов - это процесс добавления ссылок на другие сайты в текстах страниц сайта, чтобы улучшить позиции этого сайта в поисковых системах

Что такое дублированный контент и как это исправлять

16 июля 2022, 19:35

Всегда, когда речь заходит о дублированном контенте на сайте, то SEO профессионалы советуют избегать этой ситуации. Дубли контента могут возникать на любых сайтах, независимо от их системы управления, в том числе и WordPress.

Когда вы решаете создать сайт на платформе WordPress, то принимаете мудрое решение, однако это еще не все. Есть много вещей, которые нужно сделать в первый же день.

Проблемы с дублированным контентом могут возникать по многим причинам, и сегодня мы рассмотрим некоторые основные из них и способы их решения. Кстати, если вы хотите чтобы ваши проекты хорошо и стабильно работали, то настоятельно рекомендую вам попробовать стабильный корпоративный хостинг

Что именно подразумевается под дублированным контентом?

Дублированный контент — это ситуация когда на вашем сайте есть определенное содержание, которое может быть доступно по двум, или более, разным URL.

Также есть такое понятие, как внешний дублированный контент – содержимое, которое было скопировано с вашего сайта и размещено на стороннем ресурсе.

Например, на плохо оптимизированном блоге одинаковый контент может находится по двум разным URL.

Вот вам простой пример, при котором поисковые системы будут находить 10 дублей на разных страницах вашего сайта.

При наличии небольшого количества дублей поисковики будут выбирать один из них и делать приоритетным в выдаче. Если же дублей много, то в таком случае на сайт будут накладываться санкции.

Как найти дублированный контент

Здесь мы говорим о дублированном контенте в пределах вашего блога – это главное место, где нужно начать исправлять проблемы.

Находить вручную дубли, когда блог имеет много страниц, довольно нудно и скучно.

Оценивать уникальность содержимого каждой записи

Сделать это можно через специальные программы, которые предоставляют биржи статей. Данный метод займет у вас очень много времени, так как придется проверять каждую страницу отдельно.

Заходите в поисковую систему, выбираете расширений поиск, указываете адрес своего сайта и вбиваете в поиск часть текста страницы, которую нужно проверить на продублированность. Если на странице выдачи появилась одна страница, то все хорошо, если больше – это, скорее всего, указывает на дубли. Чтобы проверить перейдите на страницы с выдачи и проанализируйте: действительно ли содержимое продублировалось или вы написали две похожих статьи.

Заходим в Google и в строку поиска вводим имя вашего сайта в следующем формате «site: 2wordpress. net». Сразу переходите на последние страницы выдачи и проанализируйте их. Там не должно быть в индексе страниц с тегами, архивами, авторами, версиями для печати и т. д.

Если вы обнаружили дубли, то это значит, что пришло время поработать над вашим сайтом в плане оптимизации.

Что вызывает дубли?

Теги и категории

Это первое место, с которого вы должны начать.

В случае, когда вы используете полный вывод содержимого (это когда содержимое статьи от начала и до конца выводиться на главной странице и в других местах, а не пару абзацев как обычно), то стоит скрыть от индексации ваши категории, так как они будут создавать дубли контента.

Теги же я советую скрывать от индексации в любом случае. Дело в том, что они не предназначены для поисковых систем и не несут никакой ценности для них, они рассчитаны на реальных пользователей, которым легче будет ориентироваться по материалах.

Архивы и архивы авторов

В WordPress есть возможность просматривать архивы статей предыдущих месяцев, а также архивы авторов.

Эта особенность полезна для пользователей, однако от поисковых роботов этот раздел следует скрывать, так как в обеих случаях вы будете иметь дело с дублированным контентом.

Вложенные изображения

Вот вам еще одна проблема, которую многие из вас, наверное, не принимают всерьез, пока сами не столкнетесь с ей. Когда вы вставляете картинки в запись, то часто используете разные лайтбоксы, которые открывают изображение поверх контента.

Возможно вы не используете такого, но ведь видели в других блогах, да?

Например, у вас есть статья

В текст статьи вставлена картинка с название «kartinka». Теперь, чтобы картинка всплывала поверх контента плагин проставляет на нее специальную ссылку, в результате чего у нас получается дубль. И это связанно не только с картинками, но и другими элементами, которые касаются этой проблемы.

Чтобы избегать подобных моментов, я советую использовать плагин Yoast SEO, в настройках которого есть такая опция «Redirect attachment URL’s to parent post URL», которая позволяет перенаправлять все ссылки на дочернюю страницу (статью).

Ответы на комментарии ReplytoCom

С этой проблемой блогеры сталкиваются уже очень давно, но сейчас WordPress исправил этот коварный момент. Однако если проверить сейчас результаты поиска, то в выдаче есть много проблемных блогов.

Возможно, люди сидят на старых версиях WordPress, а возможно проблема все еще осталась. Так что вам следует проверить.

Причиной являются древовидные комментарии, которые, на самом деле, важны только для пользователей, так как помогают им в общении с другими пользователями.

Однако при нажатии на кнопку «Ответить» создается полный дубль страницы.

Самым простым решением будет следующая строчка в вашем robots. txt:

Disallow: /*?replytocom

Канонические URL-адреса

Канонические URL-адреса являются важным аспектом в SEO-оптимизации вашего сайта. Дело в том, что ваши страницы могут иметь разную структуру. 

Все эти адреса разные, но ведут они на одну и ту же страницу, таким образом, создавая дублированный контент.

Установив канонический адрес, вы будете перенаправлять поисковые системы на тот URL, с которым они должны связать страницы в своем индексе.

В новых версиях WordPress это предусмотрено по умолчанию. Однако вы можете использовать другие SEO-плагины, чтобы быстро добавить канонический адрес на свой блог.

Убираем дубли в случае воровства контента

Когда какой-то блогер нагло скопировал вашу статью, даже не оставив ссылки на источник, то следует избавиться от такого дубля.

Здесь нам нужно воспользоваться Google DMCA

Google DMCA очень полезен для блогеров и вебмастеров, он позволяет подать жалобу в отношении любого сворованного контента с вашего сайта.

Если это блог создан на BlogSpot, то Google немедленно удалит скопированный контент, если это другой блог или статический сайт, то Google снимет страницу, которая нарушает ваше авторское право, с результатов поиска.

Как скрывать рубрики, теги, страницы от индексации

Практически все вышеперечисленные проблемы можно решить с помощью SEO-плагинов, например, Yoast SEO, All in One SEO Pack, Platinum SEO Pack и другие.

Также используйте для этих целей свой robots.txt

Технологии развиваются

Хочу поделиться еще одной мыслью, что поисковые роботы с каждым годом становятся все умнее, поэтому они уже сейчас способны фильтровать дубли на вашем сайте и просто опускать их из поиска, что никак не повлияет на ранжирование вашего сайта.

То есть, по сути, сейчас эта проблема не так опасна, как пару лет назад

Некоторые веб-мастера советуют новичкам вообще ничего не предпринимать, так как без опыта они могут загнать в noindex не те страницы и навредить сайту куда сильнее, чем простые дубли, которые находятся в «соплях» выдачи.

Мне, например, также наплевать на дубли, однако мне хочется, чтобы в индексе страниц моих сайтов был порядок – сугубо главная страница, записи блога и страницы с информацией, без тегов, категорий, архивов и т. д.