文杰在线工具
  • 免费流量卡办理
  • 切换模式
    收藏列表
    放到桌面
    收录申请
    工具搜索
    用户登陆
    • 限制目录

    • Sitemap

    什么是robots.txt文件:

    1、robots.txt(统一小写)是一种存放于网站根目录下的文本文件,它通常告诉网络搜索引擎蜘蛛,此网站中的哪些内容是可以被收录哪些不可以被收录。

    • robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下
    • 如想单独定义搜索引擎蜘蛛访问子目录的行为,那么可以将自定的设置合并到根目录下的robots.txt
    • robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私
    • 注意robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有与没有斜杠“/”表示的是不同的URL

    2、robots.txt文件内容:

    • 搜索引擎蜘蛛的是否可访问性或者说可爬行性
    • 搜索引擎蜘蛛针对目录或者文件的可访问性
    • 网站站点地图sitemap路径定义
    • 搜索引擎蜘蛛爬行的时间间隔限制

    3、关于robots.txt文件生成器:

    • 通过web界面设置好要配置的数据, 点击生成即可生成robots.txt文件内容
    • 创建一个空白的文本文件,命名为:“robots.txt”,然后把上面的内容,复制并粘贴到“robots.txt”中去
    • 把“robots.txt”放在你网站的根目录,访问robots.txt,确保他能让搜索蜘蛛访问到
    推荐阅读
    主页 搜索 收藏 开灯关灯