Robots.txt – приоритет обработки записей

Вновь хочу вам отрекомендовать блог Владимира Чернышова, который, на мой взгляд, очень интересен “практическими” публикациями. На сей раз, Владимир поделился с нами вопросами, а вернее ответами, каковы же приоритеты обработки файла robots.txt, когда в нём прописаны разные инструкции для разных роботов (поисковых пауков):

Вопрос заключался в том, какими директивами в данном случае будет руководствоваться робот Google, что для него будет запрещено? Можно подумать, что робот наткнется в первую очередь на секцию для всех роботов и именно ее правила примет к рассмотрению. Это неверное предположение. Робот при парсинге файла работает примерно по следующему алгоритму:

  1. Полностью получает файл robots.txt
  2. Выделяет в файле корректные секции
  3. Ищет “свою” секцию
  4. Если своя секция найдена принимает к руководству ее инструкции
  5. Если своей секции не обнаружено, то …

В общем, рекомендую, разбор алгоритма обработки robots.txt

Ну и сюда же немного полезных ссылок по теме:


Смотрите также: