这都是你最关心的一些SEO问题(续)!
接着上次的《这都是你最关心的一些SEO问题》,我们继续!
1、对百度爬虫误封禁(非robots.txt声明,直接在网络上禁止)一般多久会被降权?若被降权后,除了解封爬虫,还有没有其他措施可以使之尽快恢复?
对于网络爬虫的抓取,很多人觉得抓取越多越好,其实不是,那只是你的网站还没有做到抓取过载,爬虫爬太多会造成服务器过载,加载慢等问题,具体可看《搜索引擎蜘蛛爬行太多未必好》
关于闭站保护以及百度站长平台的抓取频次工具,不用多说,出现问题按百度的指导来最好,建《百度站长平台新增闭站保护功能 》。而一下子说这么多状态码,很多人可能一下子消化不了,只知道404、301、200,502是干啥的?503又是干啥的?在《网站首页返回大量304状态码》中都有列出!
2、301跳转后新旧页面的排名会交替波动,是什么原因?这种情况是否有导致权重分散的可能?
关于这个问题,正好我昨天在《SEO分析:权重8,你看到的未必是真实的!》中提到,百度的系统、数据库、算法不是100%完善的,也不是全能的,更不是立马就能及时达到理论效果,这个是一直需要不断改善和反馈的,全世界的搜索引擎还没有说到完美的程度,还很远!!
3、百度快照时间与页面质量、抓取更新频率是否有什么关系?
关于这个木木就多说一点薄见,首先,网站快照的更新频率与权重并不存在任何直接的关系。百度快照也不直接不影响排名,所谓的百度快照更新,其实就是网页缓存的更新。每个新抓取的网页,百度都会根据其重要程度和时效性以不同的频率去建立索引,一些经常有重要内容更新的网页,蜘蛛会以更快的速度创建索引并放出这个索引缓存。如果一个网站只是一般的文字变更或者内容没有时效性价值的内容,并不一定会被搜索引擎认为是有更新的页面而去建立新的索引。
很多时候,百度快照会倒退,为什么?一个重要的网页,往往会在搜索引擎中保留有多份网页快照,而且这些快照的索引时间也不尽相同,有时搜索引擎可能会选择一个他觉得比较重要的快照来进行展示,所以就有可能出现网页快照倒退的情况出现。甚至有时候由于缓存问题,还可能出现搜索同一个词有多个快照的情况。
4、在终端页,边栏、底部部署大量链接,可能和当前文章主题不直接相关(但间接相关),算相关链接还是噪声?是否影响页面本身内容识别和收录?
消噪是搜索引擎预处理过程中的一个基本步骤,消噪是在搜索引擎抓取完网页在预处理过程中经过提取文字、分词、去停止词后进行的,搜索引擎需要处理的网页数量非常庞大,而这部分无意义的内容也是非常大的,为了节省计算资源,更快的计算,搜索引擎在预处理时会将这些内容识别后剔除出去,这个过程就叫做消噪,而这些剔除的内容就叫噪音。具体关于消噪和加噪可以查看《SEOer如何利用搜索引擎消噪原理》
5、Canonical标签使用的的要求是高度相似,有没有什么标准?
可以看到百度对于canonical标签的判断是非常严格的,上面2个网页其实内容基本上是完全一样的,事不过排列的结构不同。不说你可能都不知道,以为只要内容类似就可以进行Canonical 标签了,其实不止内容相似,还要结构、标题、标签等网页上的元素都相似。
6、关于原创采集问题。
这一点是真不用多说了,原创内容从来都只是影响排名中的一个因素,并且现在是越来越少被官方提起了,内容增益,满足需求,用户基数大,体验好才是经常被说到的。不多说,之前我《百度是如何保护原创的?谈百度原创那点事》一文已经很详细的分析了“原创”与网站的恩怨情仇!!
木木博客,关注互联网营销,注重网络推广策略、营销引流技巧及思路!如果你有不同的看法也可以和我交流,公众号:mumuseo!