1. Полные дубли страниц. Такой вариант дублирования контента появляется на веб-сайте, как правило, по неопытности разработчика. Роботы поисковых систем к данной ситуации относятся крайне негативно, поэтому стоит обратить на нее особое внимание, несмотря на ее кажущуюся несерьезность.
Особенности полных дубликатов страниц: • контент дублирован полностью на 100%, HTML-код повторяется целиком;
• эти странички наиболее нелюбимы поисковиками (фильтры систем поиска настроены жестко, применяемые санкции весьма болезненны, вплоть до бана ресурса целиком, например, за выявленный дубликат главной страницы);
• такие дубли легко обнаруживаются (достаточно с помощью инструмента Вебмастер-Яндекс просмотреть список всех проиндексированных web-страниц и выявить из них те, что имеют одинаковые: название и описание);
• они без проблем устраняются (в большинстве случаев, достаточно минимальных знаний).
2. Дубли служебных страниц. Служебный дубль может быть полным или частичным.
Опознание «служебных» дубликатов: • доля одинакового контента почти стопроцентная;
• основной текст присутствует целиком, а веб-страницы отличаются лишь HTML-обрамлением, а также отсутствием главного меню, дополнительных блоков и подвала.
Разработчик проекта легко найдет такие проблемные странички и примет необходимые меры непосредственно в процессе настройки
системы управления контентом (CMS).
Возможные места поиска «служебных» дублей: • версия для печати (самая распространенная ошибка - это не закрыть данную страницу от индексации, и как результат на сайте появляются две одинаковые странички);
• неудачно реализованная настройка темы дизайна проекта (не через профиль пользователя, а ссылками с GET-параметрами вида «?theme=mega_design_3»);
• веб-странички различных режимов вывода информации (к примеру, сортировка записей по дате публикации).
Чтобы избежать неприятностей связанных с дублированием, следует запретить роботам поисковых систем посещать данные проблемные разделы на сайте.
Первый способ - принудительно запретить индексирование этих веб-страниц.
Второй способ - сделать так, чтобы поисковые роботы вообще не посещали такие странички. Например, смену дизайна сайта можно организовать с помощью формы по запросу «POST» и последующим редиректом, или воспользоваться JavaScript.
3. Частичные дубли страниц. Эта проблема часто встречается на блоговых и информационных ресурсах, а также интернет-магазинах. Как правило, это дублирование отдельных фрагментов текста.
Характерные черты частичного дублирования: • трудно обнаружить (часто можно не заметить данную ошибку);
• мешает правильному ранжированию веб-страниц (возможно применение фильтров с понижением в результатах поисковой выдачи).