如何彻底禁止搜索引擎收录指定网页内容

Original 己立223 JustThink 2022-08-18

点击蓝字关注我
获取高效/实用/好玩的工具软件和教程

前言

在《网站 robots.txt 文件配置方法》中我们介绍了如何使用 robots.txt 文件来禁止搜索引擎的蜘蛛抓取网站内容的方法。

但是该方法也并非对所有搜索引擎都有效，而且也有实现不了的效果，比如禁止传递链接权重、禁止快照等。

本文就介绍下如何使用 meta 标签完全禁止搜索引擎收录和索引网站的指定内容。

meta 标签使用方法

meta 标签（漫游器元标记）是网页 HTML 语言标记的一种，可以让我们更精确地控制网页如何被编入搜索引擎的索引并在搜索引擎结果中显示。

# 使用方法

将编辑好的 meta 标签放在目标网页的 <head> 部分即可，示例如下：

<!DOCTYPE html>
<html>
  <head>
    <meta name="robots" content="nofollow">
    <meta name="googlebot" content="noindex, nofollow">
    ……
  </head>
  <body>……</body>
</html>

其中：

name：指生效的目标抓取工具（网络蜘蛛），robots 表示全部蜘蛛，也可以指定单个蜘蛛，如 Googlebot；
content：操作效果，noindex 表示不收入索引。

指令和效果说明：（↓截图自 Google Developers）

# 常用代码示例

1、禁止所有搜索引擎的收录和索引，也不追踪网页上的链接：

<meta name="robots" content="noindex, nofollow">

2、只禁止谷歌和百度蜘蛛的收录和索引：

<meta name="googlebot" content="noindex">
<meta name="baiduspider" content="noindex">

3、允许搜索引擎收录，但不追踪网页上的链接，也不传递链接权重：

<meta name="robots" content="nofollow">

4、允许搜索引擎收录，但禁止显示网页快照：

<meta name="robots" content="noarchive">

5、允许搜索引擎收录，但禁止索引网页上的图片：

<meta name="robots" content="noimageindex">

现在很多 SEO 插件，如 WordPress 的 Yoast SEO 等都支持在文章编辑页面直接设置索引方式，非常方便。

结语

在网页的 <head> 标签中插入好 meta 标签后，并不会立即生效，需要等到下一次搜索引擎抓取该网页时才会更新状态。

对于常见的 WordPress、Typecho 等博客，通常使用如 header.php 等模版统一生成 <head> 标签，会对全部文章都生效，需要格外注意。最好使用插件对单篇文章进行设置。

参考资料：

漫游器元标记和 X-Robots-Tag HTTP 标头规范 | 搜索 | Google Developers
禁止搜索引擎收录的方法搜索学院百度搜索资源平台

关注&分享朋友（圈）

拯救良心（但不火）的个人公众号

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

“我，19岁，瞒着父母把留学的钱，在北京买了套房，如今……”

如何彻底禁止搜索引擎收录指定网页内容

meta 标签使用方法

# 使用方法

# 常用代码示例

结语

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

“我，19岁，瞒着父母把留学的钱，在北京买了套房，如今……”

生成图片，分享到微信朋友圈

如何彻底禁止搜索引擎收录指定网页内容

meta 标签使用方法

# 使用方法

# 常用代码示例

结语

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡