Веб-студия Александра Иванова

Веб-студия Avacym

Дублирующие страницы на сайте

Дублирующими являются веб-страницы, на которых опубликован одинаковый контент.
В большинстве случаев, данное утверждение будет верно, так как появляются такие странички на сайте - по неопытности начинающих вебмастеров или из-за ошибок уже опытных специалистов. Например, если при создании сайта разработчиком уделено мало внимания вопросу приведения URL-адресов страниц к единообразию. Главное правило гласит: на ресурсе должен быть «армейский порядок».

Часто встречающиеся варианты дублирования контента на сайте:

1. Полные дубли страниц

Такой вариант дублирования контента появляется на веб-сайте, как правило, по неопытности разработчика. Роботы поисковых систем к данной ситуации относятся крайне негативно, поэтому стоит обратить на нее особое внимание, несмотря на ее кажущуюся несерьезность.

Особенности полных дубликатов страниц:
• контент дублирован полностью на 100%, HTML-код повторяется целиком;
• эти странички наиболее нелюбимы поисковиками (фильтры систем поиска настроены жестко, применяемые санкции весьма болезненны, вплоть до бана ресурса целиком, например, за выявленный дубликат главной страницы);
• такие дубли легко обнаруживаются (достаточно с помощью инструмента Вебмастер-Яндекс просмотреть список всех проиндексированных web-страниц и выявить из них те, что имеют одинаковые: название и описание);
• они без проблем устраняются (в большинстве случаев, достаточно минимальных знаний).

2. Дубли служебных страниц

Служебный дубль может быть полным или частичным.

Опознание «служебных» дубликатов:
• доля одинакового контента почти стопроцентная;
• основной текст присутствует целиком, а веб-страницы отличаются лишь HTML-обрамлением, а также отсутствием главного меню, дополнительных блоков и подвала.

Разработчик проекта легко найдет такие проблемные странички и примет необходимые меры непосредственно в процессе настройки системы управления контентом (CMS).

Возможные места поиска «служебных» дублей:
• версия для печати (самая распространенная ошибка - это не закрыть данную страницу от индексации, и как результат на сайте появляются две одинаковые странички);
• неудачно реализованная настройка темы дизайна проекта (не через профиль пользователя, а ссылками с GET-параметрами вида «?theme=mega_design_3»);
• веб-странички различных режимов вывода информации (к примеру, сортировка записей по дате публикации).

Чтобы избежать неприятностей связанных с дублированием, следует запретить роботам поисковых систем посещать данные проблемные разделы на сайте.
Первый способ - принудительно запретить индексирование этих веб-страниц.
Второй способ - сделать так, чтобы поисковые роботы вообще не посещали такие странички. Например, смену дизайна сайта можно организовать с помощью формы по запросу «POST» и последующим редиректом, или воспользоваться JavaScript.

3. Частичные дубли страниц

Эта проблема часто встречается на блоговых и информационных ресурсах, а также интернет-магазинах. Как правило, это дублирование отдельных фрагментов текста.

Характерные черты частичного дублирования:
• трудно обнаружить (при автоматизации всех процессов часто можно не заметить данную ошибку);
• мешает правильному ранжированию веб-страниц (возможно применение фильтров с понижением в результатах поисковой выдачи).

Негативное влияние дублирующих страниц на процесс продвижения сайта

Несмотря на то, что многие вебмастера на появление дубликатов страничек не обращают особого внимания, эта ситуация может создать серьезные проблемы при поисковом продвижении сайта.
Роботы систем поиска расценивают дубли веб-страниц как спам, и принудительно в худшую сторону изменяют позиции в поисковой выдаче, как этих страничек, так и ресурса в целом.
При ссылочном раскручивании отдельной web-страницы может возникнуть следующая ситуация. При неудачном стечение различных обстоятельств поисковик оценит дубль как наиболее релевантную страницу, а страничку-первоисточник с другим url-адресом, которая продвигается ссылками, принудительно «опустит» в результатах выдачи. В этом случае финансовые затраты и усилия будут напрасны.

Методы обнаружения на сайте дублирующих страниц:

1. Средствами поисковых систем.
Для этого в строке поиска Google или Яндекс следует ввести команду вида: site:name.ru, где name.ru – доменное имя. Система поиска выдаст список проиндексированных web-страниц сайта, и вашей задачей будет визуально обнаружить возможные дубликаты.
Кроме того, можно воспользоваться инструментами Яндекс-Вебмастер и Google Webmaster Tools для проверки состояния индексации веб-страниц.

2. Поиском по фрагментам текста.
В данном случае необходимо в поисковую строку вставить небольшой фрагмент текста (например, большой абзац целиком) с конкретной веб-странички. Если в результатах выдачи будут отображены две и более позиции на разные страницы проверяемого сайта, то это, скорее всего - дубли.

3. При помощи специальных программ.
Из наиболее распространенных программ для таких целей - Xenu Link Sleuth. Она является бесплатной и ее легко можно найти в интернете. Однако программка англоязычная, но разобраться в ее работе сможет каждый.
Дублирующие страницы на сайте