1. 首页
  2. 问答百科
  3. 正文

robots.txt是什么?robotstxt怎么写?

  一、什么是robots.txt?

  robots是网站和搜索引擎协议的纯文本文件,当一个搜索引擎蜘蛛来访问站点的时候,首先爬行检查根目录是否存在这个文件。

  如果存在的话,那么就会根据文件的内容来确定访问范围,如果没有的话蜘蛛就会沿着链接进行抓取,robots放在项目的根目录下。

  二、 robots.txt基本语法:

  1、允许所有搜索引擎访问网站的所有部分,robots.txt写法如下

  User-agent: *

  Disallow:

  或者

  User-agent: *

  Allow: /

  注意: 1. 全国个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

  2 、禁止所有搜索引擎访问网站的所有部分

  robots.txt写法如下:

  User-agent: *

  Disallow: /

  3 、只需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引

  robots.txt写法如下:

  User-agent: *

  Disallow: /css/

  Disallow: /admin/

  Disallow: /images/

  注意:路径后面有斜杠和没有斜杠的区别:比如Disallow: /images/ 有斜杠是禁止抓取images整个文件夹,Disallow: /images 没有斜杠意思是凡是路径里面有/images关键词的都会被屏蔽

  4、屏蔽一个文件夹/templets,但是又能抓取其中一个文件的写法:/templets/main

  robots.txt写法如下:

  User-agent: *

  Disallow: /templets

  Allow: /main

  5、 禁止访问/html/目录下的所有以”.php”为后缀的URL(包含子目录)

  robots.txt写法如下:

  User-agent: *

  Disallow: /html/*.php

  6、 仅允许访问某目录下某个后缀的文件,则使用“$”

  robots.txt写法如下:

  User-agent: *

  Allow: .html$

  Disallow: /

  7、禁止索引网站中所有的动态页面

  比如这里限制的是有“?”的域名,例如index.php?id=1

  robots.txt写法如下:

  User-agent: *

  Disallow: /*?*

  8、 禁止搜索引擎抓取我们网站上的所有图片(如果你的网站使用其他后缀的图片名称,在这里也可以直接添加)

  有些时候,我们为了节省服务器资源,需要禁止各类搜索引擎来索引我们网站上的图片,这里的办法除了使用“Disallow: /images/”这样的直接屏蔽文件夹的方式之外,还 可以采取直接屏蔽图片后缀名的方式。

  robots.txt写法如下:

  User-agent: *

  Disallow: .jpg$

  Disallow: .jpeg$

  Disallow: .gif$

  Disallow: .png$

  Disallow: .bmp$

  三、写robots.txt要注意的地方:

  1)、 全国个英文要大写,冒号是英文状态下,冒号后面有一个空格,这几点一定不能写错。

  2.)、斜杠:/ 代表整个网站

  3)、如果“/”后面多了一个空格,则屏蔽整个网站

  4)、不要禁止正常的内容

  5)、生效时间是几天到两个月

  四、robots.txt文件对网站优化有什么作用?

  1、疾速增加网站权重和拜访量;

  2、制止某些文件被查找引擎索引,能够节约服务器带宽和网站拜访速度;

  3、为查找引擎供给一个简洁明了的索引环境

    延伸阅读

  • robots.txt是什么?robotstxt怎么写?

    一、什么是robots.txt?robots是网站和搜索引擎协议的纯文本文件,当一个搜索引擎蜘蛛来访问站点的时候,首先爬行检查根目录是否存在这个文件。如果存在的话,那么就会根据...

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.lnbdc.com/article/3353.html

(function(){ var src = (document.location.protocol == "http:") ? "http://js.passport.qihucdn.com/11.0.1.js?1d7dde81dc0903e04d3ac0b9599444f6":"https://jspassport.ssl.qhimg.com/11.0.1.js?1d7dde81dc0903e04d3ac0b9599444f6"; document.write('<\/mip-script>'); })(); (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();