[科普]关于robots.txt文件一些知识

  • A+
所属分类:wordpress

我们经常在一些网站上,看到一些关于SEO的文章,上时不时的会出现robots.txt文件什么的,robots.txt文件到底是个什么玩意儿呢?这里整理了一些网上的资料和大家一起科普一下。

[科普]关于robots.txt文件一些知识

robots.txt文件和各搜索引擎的关系

  • 一、什么是robots.txt文件
    1、robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。
    2、因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。
    3、如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据。
    4、robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有与没有斜杠“/”表示的是不同的URL。robots.txt允许使用类似"Disallow: *.gif"这样的通配符。
    5、Robots协议是国际互联网界通行的道德规范,基于以下原则建立:1、搜索技术应服务于人类,同时尊重信息提供者的意愿,并维护其隐私权;2、网站有义务保护其使用者的个人信息和隐私不被侵犯。
  • 二、关于robots.txt文件内容
    1、搜索引擎蜘蛛的是否可访问性或者说可爬行性。
    2、搜索引擎蜘蛛针对目录或者文件的可访问性。
    3、网站站点地图sitemap路径定义。
    4、搜索引擎蜘蛛爬行的时间间隔限制
  • 三、robots.txt文件如何生成
    问问度娘:robots.txt文件生成器,搜索出大量的信息,有robots.txt文件生成器的PC软件,也有在线网站robots.txt文件生成器,功能五花八门的,反正可以生成robots.txt文件,单触角蚂蚁建议还是使用在线网站robots.txt文件生成器比较方便。当然如果你在wordpress站点上使用了Google XML Sitemaps插件,它会自动帮你生成robots.txt文件。
    有没有robots.txt文件,你可以访问:http://www.1mayi.com(你的域名)/sitemap.xml 试试看能不能打开。
avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: