Replytocom WordPress и в чем их угроза
Добрый день, друзья! Все поисковики мира не любят, когда на сайте находятся статьи близнецы. Разумеется, блогер не будет добавлять посты с одинаковым контентом. Но, подобные статьи могут копироваться, при том во множестве, без ведома хозяина сайта.
Подобные дубли страниц сайта называются replytocom. Они являются обычными страницами, подобно прочим страницам вашего ресурса, но с добавкой к адресу вроде? comment-876. Данные странички возникают благодаря включенным древовидным комментариям. Можете проверить, работает ли данная функция на вашем блоге:
Данная команда у вас включена, если на блоге в комментариях имеется ярлычок «ответить». В этом случае, необходимо произвести небольшие настройки.
Например, зайдем на моем сайте на любой пост с комментариями, кликнем по ярлычку «Ответить» правой кнопкой мышки, мы увидим страничку в новой вкладке. Url её длиннее странички оригинала:
http://info-kibersant.ru/sozdaty-lektronny-koshelek-qiwi.html/?replytocom-876
Окончание commtnt-876 и есть не нужный дубль. Также данный адрес мы увидим с лева в нижнем углу экрана, если просто наведем на данную кнопочку курсор.
На одной и другой страничке статья будет один в один, но с небольшими изменениями в адресах. Подобные дубли страниц сайта могут возникнуть в большом количестве, за это от Гугла может последовать бан. Их может быть и пятьдесят и сто. А один подобный дубль, равен примерно 31 дублю replytocom. Если их сто, то с одной вашей страничке может идти 100х31=3100 продублированных постов replytocom.
Теперь давайте подумает, какое количество их может быть на сайте? Проверить это можно при помощи сервиса «Соломоно». Их может быть 3935 и более. Это все исходящие ссылочки.
Входящих же ссылочек может быть 110, а то и меньше. Гигантская разница, не правда ли? Как же нам определить, сколько на вашем ресурсе дублей страниц?
Как определить есть ли replytocom на сайте
Для их определения нет ничего затруднительного, достаточно войти в поисковик Гугл и набрать:
site:вашсайт.ru replytocom
Далее, у нас выйдет результат. Если взять мой сайт, мы увидим:
Затем жмем Показ скрытых результатов, у нас получается 41.
Это довольно мало, по сравнению с тем, сколько может быть. Просто я уже более года назад с robots.txt удалил строчки Disallow: *?* и им подобные. Обязательно проверьте на своём сайте.
Ну как? Результат вас впечатлил? Можно войти на ресурс seolib и проверить результат там.
Если ваш сайт довольно молод, дубли страниц сайта replytocom у него могут отсутствовать. Просто Гугл их еще не успел проиндексировать. Но индексация этих копий будет проведена в дальнейшем в обязательном порядке.
Если же подобных дублей replytocom у вас довольно много, тогда становится ясно, отчего у вас на блоге так низка посещаемость. Если рассмотреть Яndex, то здесь ситуация иная. Он не особо обращает внимание на дубли страниц сайта, точнее обращает, но не индексирует. Но с Гуглом ситуация противоположная!
Хотя и Яndex не любит replytocom. Роботу данного поисковика приходится их также просматривать. А ему это, можете мне поверить, не нравится. Т.е. без этих дублей с Яндекса посещаемость будет выше, и значительно.
Люди комментируют ваш блог довольно часто? Это отлично. Но вместе и комментариями увеличиваются и дубли страниц сайта, а это уже плохо. На нужно от них избавиться. Как это сделать? Довольно просто, но в поисковиках процесс может оказаться затяжным.
Как удалить дубли replytocom
Давайте вначале подумаем. У части блогеров в комментариях присутствует кнопка «ответить» и копии страниц также присутствуют в Гугле. У других же людей также существует данная кнопка, но копии страниц в Гугле отсутствуют, отчего так?
В основном из-за одной из причин: — кнопку «Ответить» выводит скрипт или она не закрыта в Роботсе. Поймите суть проблемы. Не делайте закрытым в robots.txt путь к replytocom. В таком случае он находит метатег:
<meta name='robots' content='noindex,follow' />
и не станет индексировать копии постов.
Просто уберите из Роботс запреты типа:
Они означают «Запрещен правилами». Я объясню, зачем это необходимо. Например, робот поисковика заглянул на страничку копии и увидел, в Роботсе данная страничка закрыта. Что же он делает? Он индексирует данную страничку. Запрещение в robots.txt для него не указ, а что-то вроде рекомендации.
Что бы он ее не стал индексировать, он должен увидеть тег <meta name=’robots’ content=’noindex,follow’ /> или нечто похожее. Мета тег объясняет роботу, что это именно запрет, а не рекомендация.
Убрать из robots.txt запрещение – это самое главное действие. Далее можно добавить 301 редирект. Для этого мы добавим в папочку .htaccess, лежащую в корневом каталоге пару строчек:
RewriteCond %{QUERY_STRING} ^replytocom= [NC]
RewriteRule (.+)/feed /$1 [R=301,L]
Добавьте эти строчки после строки:
RewriteBase /
Что в этом случае произойдет? Когда поисковик приходит на страничку http://info-kibersant.ru/wise-disk-cleaner.html/?replytocom-76
Его на автомате перенесет на адрес: http://info-kibersant.ru/wise-disk-cleaner.html
Другими словами, робот дубли страниц сайта replytocom не заметит.
Можно пойти другим путем, и за место 301 редиректа применять 404 ошибку. Что бы это сделать, поместим в function.php строчки:
add_filter('template_redirect','Redirect404');
function Redirect404(){if ( isset( $_GET['replytocom'] ) ) {
@header("HTTP/1.0 404 Not Found");
die();
}
}
В данном случае поисковик станет натыкаться на страничку 404 ошибочки. Подобные страницы он не индексирует. Также можно убрать кнопки Ответить, показывающиеся благодаря реплитоком, т.е. не полностью убрать, а видоизменить. Для этого можно применять расширение WordPress Thread Comment.
Этот плагин вы с легкостью найдете в сети интернет. Установите его, затем войдите в «Настройки», далее в «Обсуждения» и выключаем древовидные комментарии. После данной операции кнопочка «Ответить» станет появляться благодаря новому расширению. Теперь же, наведя курсор на данную кнопочку, мы увидим:
javascript:void (0)
Но у данного расширения есть недостаток. Ответик в комментариях может выйти внутри совершенно постороннего комментария. Но я надеюсь, что программисты доработают данный плагин и все будет Ок.
Также хочу отметить. Часть блогеров в своих постах дают следующий совет про реплитоком: — Необходимо зайти в панель инструментов (Сканирование — Параметры URL) и поставить галочку следующим образом:
Я не сторонник данного действия. Советую оставить все как было, я имею в виду «на усмотрение робота». Он должен сам разобраться!
Далее, предлагаю видео про дубли страниц:
[urlspan][/urlspan]
Я надеюсь, данная статья поможет вам удалить дубли страниц сайта replytocom и тем значительно повысить трафик не только с Google, но и с других поисковиков! Успехов!
С уважением Андрей Зимин 04.10.2014г.
Анекдот в каждой статье: