公务员| 工程类| 考研考博类| 英语类| 小语种| 经济类| 经济师| 证券类| 金融类| 保险类| 管理类| 物流类| 公共管理类| 外贸类| 财会类| 统计类| 精算师| 心理类| 教育类| 中文类| 艺术类| 新闻传播类| 编辑出版类| 法学类| 医学类| 计算机类| 理工类| 国家职业资格考试| 秘书| 导游| 中小学| 学>科竞赛类| 成人高考| 自考| 综合类

robots

缺省值是INDEX,NOFOLLOW。

 

  这样,一共有四种组合:

 

  <META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>

 

  <META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>

 

  <META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>

 

  <META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>

 

  其中

 

  <META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;

 

  <META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>

 

  目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:

 

  <META NAME=”googlebot” CONTENT=”index,follow,noarchive”>

 

  表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。

禁止抓取图片

  User-agent: *

 

  Disallow: .jpg$

 

  jpg可以代替为gif,png 等等...

禁止快照

  要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的 <HEAD> 部分:

 

  <meta name="robots" content="noarchive">

 

  要允许其他搜索引擎显示快照,但仅防止搜索引擎显示,请使用以下标记:

 

  <meta name="Baiduspider" content="noarchive">

学习培训网,中华金融学习网,中华学习网,中华培训网,中华娱乐网,中华管理学习网,中华教育学习网,中华支教网,中华最佳学习网
Copyright © 2011-2061 中华学习网  |  Powered By:迪超网络  |  关于我们  |  点击进入QQ交谈454541734  |   |   |