
Как убрать дубли страниц сайта
Дубли страниц на сайте онлайн. Добрый день! В прошлой статье мы разговаривали про дубли страниц сайта replytocom. Напомню суть прошлой статьи. Она в том, то не следует делать закрытым в Роботсе путь чему-либо на вашем блоге. Желательно наоборот, роботс сделать открытым, чтобы робот зашел, посмотрел, увидел тег noindex и не стал индексировать дубли страниц.
Если же данные копии страниц будут закрыты, данный робот скорее всего подобные дубли наоборот проиндексирует. Желательно это запомнить! Далее давайте вспомним, как мы искали копии реплитоком в поисковике Гугл. Я напомню:
site:ваш сайт replytocom, т.е. на примере моего это будет выглядеть site:info-kibersant.ru replytocom
Как искать дубли страниц на вашем блоге
Отлично. Сейчас мы поищем прочие копии страничек, а подробнее копии: feed, category, tag, comment-page, page, trackback, attachment_id, attachment
Их поиск проводим похожим образом, как мы искали дубли страниц реплитоком. Делаем все подобным образом, а именно зайдем в Гугл и внесем в поисковик любой блог, например site:realnodengi.ru feed
Нажав «Показ скрытых результатов» мы увидим:
22 дубля страницы. Что значит feed? Это непонятный отросток в конце адреса статьи. Для любого вашего поста жмете ctr + u и скорее всего увидите ссылочку feed в конце. Другими словами, подобные ссылки необходимо удалять. Давайте войдем в роботс данного сайта, мы увидим:
То есть то, что нам не нужно. Что же нам делать, подобные запрещения в роботсе желательно удалить. Что бы робот на них не заходил и не индексировал их на «всякий случай».
Отлично! Мы сделали проверку страничек feed.
Возьмём другой сайт, например reall-rabota.ru и вставим page. У нас получится site:reall-rabota.ru page:
Мы видим, что на данном сайте присутствует 61 дубль страниц page. От них необходимо избавляться. Я надеюсь, авторы данных блогов за анализ на меня не в обиде?
Подобный анализ проведите для своих блогов, и не только по данным копиям, но и по прочим, которые я приводил выше, таким как — category, tag и пр.
Ну как? Ваш результат вас порадовал?
Скорее всего не по всем данным словам вы найдете копии. Это конечно отлично! Но от тех, которые у вас имеются, придется избавиться! Давайте подумаем как?
Как убрать дубли страниц сайта решение проблемы
Во-первых, зайдите в мой роботс http://info-kibersant.ru/robots.txt и скопируйте его себе, соответственно заменив info-kibersant.ru на название вашего сайта. Заменили? Отлично! Я думаю на многих блогах присутствовали запреты, как на сайте, приведенном выше.
Во вторых, перепишите следующие строки в ваш файлик .htaccess:
Данный файл находится в вашей корневой папке, которая чаще всего называется public_html. Для этого я обычно открываю программу FileZilla, переношу нужный файл на рабочий стол, открываю данный файлик софтом Notepad + +, вношу необходимые изменения и заменяю старый файл на новый.
После закачки нового файла ваш .htaccess должен получиться примерно таким:
В третьих, вставляем в function.php после <?php следующее:
/*** ДОБАВЛЯЕМ meta robots noindex,nofollow ДЛЯ СТРАНИЦ ***/
function my_meta_noindex () {
if (
is_paged() // Все и любые страницы пагинации
) {echo "".''."\n";}
}
add_action('wp_head', 'my_meta_noindex',
3); // добавляем свой noindex, nofollow в head
В четвертых, проходим в расширение All in One Seo Pack и делаем так:
Если у вас другой плагин, например WordPress SEO, поставьте noindex в разделах, похожих по смыслу.
В пятых, в «Параметрах» идем в «Настройки-Обсуждения» и удаляем галку с пунктика Разбития комментариев:
В заключение предлагаю подробное видео про дубли.
[urlspan][/urlspan]
На этом не всё, существует ещё множество дублей страниц и прочего хлама. Его необходимо удалять. Самому это не всегда сделать просто, поэтому иногда необходимо обращаться к профессионалу. Но его не всегда найдешь, да и не станешь постоянно обращаться.
Отсюда, желательно все тонкости узнать самому. Это можно сделать как при лично общении, так и изучив материал. Я имею в виду видеокурс. На мой взгляд, видеокурс предпочтительнее, т.к. вы пройдете обучение дама перед своим монитором!
Я хочу предложить курс того же автора, видео которого вы сейчас смотрели. Это Александр Борисов! Известный блогер, издавший множество курсов! Так вод, недавно у него вышел новый курс, [urlspan]«Кибер-Блоггер»[/urlspan].
[urlspan][/urlspan]
Я не просто так привел данный курс, я его изучил. Мне лично он понравился. Раньше, Яндекс показывал у меня проиндексированных страниц 1220, хотя реально их 250. Сейчас, после очистки, Яндекс показывает 490, Гугл 530. Согласитесь, данные цифры ближе к реальным!
Но, как это не покажется странным, на большом количестве сайтов данные цифры зашкаливают за 200000 дублей и более. Без всяких шуток! Сайты с подобными показателями в скором времени могут быть забанены поисковиком. Но давайте вернемся к курсу. Приведу слова Александра:
Подробнее обо всём этом на сайте Борисова, для этого просто кликните по картинке с курсом.
В основном работа проделана, дубли страниц будут удалены после индексации, но не сразу, вам придется подождать несколько месяцев! Успехов в продвижении вашего ресурса! Если вам известны другие способы, как убрать дубли страниц сайта, пишите в комментариях, изучим вместе!
Анекдот в каждой статье:
Действительно нужная вещь. Этих дублей статьей оказалось 10453
Это действительно так, но не стоит расслабляться, подобную проверку желательно делать частенько.
Спасибо раньше не знал такого способа.
Ну как обычно сапожник без сапог, у вас то сайтик имеет дубли судя по этому способу)))
Вполне возможно, что уже имеет. Я не проверял подобным способом сайт уже года два!
На счёт дублей страниц тут у меня мнение не однозначное. Многие утверждают, что поисковые системы уже научились их определять и не берут во внимание. А многие говорят, что ничего они не понимают. Я думаю, что если есть возможность, то лучше от них избавиться. Так будет намного надёжней.
Я полностью согласен с вами Александр, нужно от них полностью избавляться! :)