查看原文
其他

百度为何删除快照功能?内部人士称主要由于网页技术发展所致

点击关注公众号,一周多次包邮送书

来源:转自公众号 蓝点网(ID:landianwx)

作者:山外的鸭子哥


昨天蓝点网提到百度等部分搜索引擎将网页快照功能下线,网页快照功能对搜索引擎来说还是蛮重要的功能。当网站爬虫检索到页面时就会将页面缓存,当特定网站挂掉的时候我们可以通过搜索引擎快照功能查看内容。

作为国内最大的搜索引擎百度将快照删除让人疑惑,同时搜狗搜索以及必应中文版快照也被下线或无法使用。只不过没想到蓝点网昨天发的这篇文章被不少科技媒体转载,新浪科技还就快照功能联系百度寻求官方回应。

内部人士确认快照被删:

新浪科技联系百度官方咨询但并没有获得百度回应,不过有内部人士确认百度搜索确实已经将快照功能下线。该内部人士称主要是由于网页技术的发展及代际变迁所致,简单来说就是百度认为快照功能已经不是很重要。
这名内部人士解释称百度搜索发展早期,由于互联网上的站点经常出现访问不稳定的现象影响用户搜索体验。百度通过网页快照抓取网络关键内容保证用户搜索体验,但随着互联网技术的发展如今网站访问都比较稳定。
这么说也不能说是完全没有道理,不过这毕竟还不算是百度的官方回应,不知道未来快照功能是否会被恢复。

网页快照是如何实现的:

网页快照功能是所有搜索引擎的标配,具体名称上略有差异,例如必应等搜索引擎将快照功能称为缓存内容。搜索引擎的爬虫抓取到链接时就会将网页文本内容保存下来,其他资源例如样式表和图片等内容不会被缓存。
当网站发生故障无法访问时至少文本内容还是可以查看的,当然这还可以用来查看网页历史检查修改内容等。从成本上说只保存文本内容其实对服务器的占用还是非常低的,毕竟远程资源还是保存在原网站的服务器上。
·················END·················

推荐阅读

• Firefox的衰落为什么是必然的?• 发明闪存能赚多少钱?这是一个日本的狗血故事• 聊聊Java中代码优化的30个小技巧• 一篇文章彻底搞懂 Cookie !• 面试官灵魂拷问:为什么代码规范要求 SQL 语句不要过多的 join?• 面试被问跨域问题,怎么破?• 面试难题:Spring 事务高级特性,你懂吗?
👇更多内容请点击👇

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存