Опубликовал Санёк. января 16, 2022
Как известно, поисковые системы не любят когда их забивают всяким мусором, поэтому очень важно правильно составить файл robots.txt . Поэтому предоставляю наиболее подходящий, на мой взгляд, вариант:
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /feed
Disallow: /comments
Disallow: /category/*/*
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /xmlrpc.php
Allow: /wp-content/uploads
Следующие два параметра только для блогов с "правильными ссылками"
"Неправильными" я считаю ссылки вида domen.ru/?page_id=34
Disallow: /*?*
Disallow: /*?
Недавно Яндекс заявил, что их робот понимает новую директиву: Crawl-delay. Она поможет в индексации сайтов, размещенных на медленных серверах. С помощью этой директивы можно выставить timeout между закачками страниц. Это может значительно ускорить обход сайта роботом. С выходом новой версии WordPress это особенно актуально, так как WP cтал значительно прожорливей, что часто замедляет работу сайта. Если вы хотите выставить timeout в 5 секунд, это должно выглядеть так:
User-agent: Yandex
Crawl-delay: 5
Думаю этого вполне достаточно. Владельцы блогов - присылайте используемые вами директории))
Проголосовать на:
Статьи по теме:
УслугиНовый диз для блога.SEO плагины Firefox: переключатель регионов.
Тэги: robots.txt, WordPress, Yandex

января 20, 2022 at 11:46
А еще запрещаю xmlrpc.php:
января 31, 2022 at 11:33
И зачем я их буду закрывать?
Или закрыть остальные, PR не имеющие вообще?
марта 1, 2022 at 13:46
марта 2, 2022 at 2:25
марта 2, 2022 at 2:10
А мне он важнее, чем народ.
марта 20, 2022 at 19:27
марта 20, 2022 at 19:26
марта 22, 2022 at 19:06
апреля 12, 2022 at 0:10
User-agent: Yandex
Crawl-delay: 5
То паук яндекса будет игнорировать то, что написано в User-agent: *
мая 6, 2022 at 23:56
_http://tunngle-skachat.ru/robots.txt
мая 15, 2022 at 12:44
Приме:
seo.kg/topics/news/
И ещё, не у всех категории называются “category”, вот у меня “topics” или “go” бывает…
июня 17, 2022 at 2:43
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/languages/
Disallow: /wp-content/plugins/
Disallow: /wp-content/upgrade/
Disallow: /wp-content/uploads/
Disallow: /wp-content/themes/classic/
Disallow: /wp-content/themes/default/
Host: domen .ru
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/languages/
Disallow: /wp-content/plugins/
Disallow: /wp-content/upgrade/
Disallow: /wp-content/uploads/
Disallow: /wp-content/themes/classic/
Disallow: /wp-content/themes/default/
Всего доброго!
июня 24, 2022 at 13:30
июня 24, 2022 at 13:36
июня 28, 2022 at 17:39
июня 28, 2022 at 18:38
сентября 24, 2022 at 0:44
Allow: /tag/feedburner
октября 2, 2022 at 11:15
Disallow: /stat*.htm
Disallow:
Disallow: /blog/comment*.html
Disallow: /blog/stat*.html
Disallow: /blog/search*.html
Host: mysite.ru
ноября 2, 2022 at 22:58
Disallow: /
Вот так надо
Disallow: /
ноября 3, 2022 at 19:49
Зайди в яндекс вебмастер и проверь там, правильно ли составил robots.txt
я так понимаю ошибки пропадут после следующей индексаци?
ноября 9, 2022 at 13:12
Теперь, думаю, все ок будет.
января 28, 2023 at 20:03
И еще – чем отличаются
Disallow: /trackback
Disallow: /feed
Disallow: */feed
Disallow: /*?
января 28, 2023 at 21:00
Disallow: /feed
Запрещает tunngle-skachat.ru/trackback
tunngle-skachat.ru/feed
Disallow: */trackback
Disallow: */feed
Запрещает tunngle-skachat.ru/*всякая фигня*/trackback
tunngle-skachat.ru/*всякая фигня*/feed
января 28, 2023 at 21:19
Allow: /
И нафига прописывать директорию Host?
марта 3, 2023 at 2:27