文杰在线工具
切换模式
收藏列表
放到桌面
收录申请
工具搜索
用户登陆
  • 限制目录

  • Sitemap

什么是robots.txt文件:

1、robots.txt(统一小写)是一种存放于网站根目录下的文本文件,它通常告诉网络搜索引擎蜘蛛,此网站中的哪些内容是可以被收录哪些不可以被收录。

  • robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下
  • 如想单独定义搜索引擎蜘蛛访问子目录的行为,那么可以将自定的设置合并到根目录下的robots.txt
  • robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私
  • 注意robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有与没有斜杠“/”表示的是不同的URL

2、robots.txt文件内容:

  • 搜索引擎蜘蛛的是否可访问性或者说可爬行性
  • 搜索引擎蜘蛛针对目录或者文件的可访问性
  • 网站站点地图sitemap路径定义
  • 搜索引擎蜘蛛爬行的时间间隔限制

3、关于robots.txt文件生成器:

  • 通过web界面设置好要配置的数据, 点击生成即可生成robots.txt文件内容
  • 创建一个空白的文本文件,命名为:“robots.txt”,然后把上面的内容,复制并粘贴到“robots.txt”中去
  • 把“robots.txt”放在你网站的根目录,访问robots.txt,确保他能让搜索蜘蛛访问到
推荐阅读
推荐工具
主页 搜索 收藏 开灯关灯