登陆 注册

双鱼论坛

[SEO知识] 百度的反作弊算法:SEO人员必备知识

[复制链接]
网络营销 发表于 2020-7-10 10:51 | 显示全部楼层 |阅读模式
在搜索引擎的架构中过滤也是很重要的一环,在Spider 抓取部分会过滤掉重复和垃圾页面,在进行排序和呈现时同样还会进行一次过滤,来保证搜索结果的质量。反作弊就是过滤环节中的主要组成部分。当下搜索引擎排名的重要参考因素主要有内容、链接、网站权重和用户体验,所以作弊也一般是从这几方面入手。

虽然搜索引擎针对每种作弊行为所做的反作弊动作和算法各不相同,但是大体上还是有一定规律可循的。搜索引擎会利用黑白名单和作弊特征研究两方面进行反作弊算法升级。

1.黑白名单
搜索引擎会根据网站内容的质量、权重、品牌建立白名单,也会找出明显作弊严重的网站建立黑名单。搜索引擎会认为白名单中网站所推荐的网站都是好的、健康的网站,含有黑名单中网站链接的网站可能会存在某种问题。

链向白名单中网站的网站不一定是健康的,同时黑名单中网站链向的网站也不一定是不健康的。但是有多个白名单网站链向同一个网站,那么这个网站就很可能是健康的;同一个网站链向了多个黑名单中的网站,就可以把其认定为不健康的网站。在整个互联网中,黑白名单中的网站不可能和名单外的网站都有直接链接关系,所以搜索引擎会给这种白名单的链接一定的信任值,这个信任值随着链接级数的增加而逐级衰减;同样,从黑名单网站反向开始,会给最终链接指向黑名单网站的各级链接一个不信任值,这个值也是逐级递减的。对于一个黑白名单之外且和黑白名单中网站没有直接联系的网站,搜索引擎会计算它得到的信任值和不信任值,当达到或超过搜索引擎设置的值之后,就会把其列为健康网站或者不健康网站。

这是一种很常见的反作弊方式,在SEO工作中体现最明显的就是选择服务器和交换友情链接。选择服务器时,大家都希望自己独立使用一台服务器或者一个IP;选择虚拟空间时,也会检查相同IP的网站是否有作弊嫌疑,以免被相同IP网站连累。虽然百度官方声明不会按照IP惩罚网站,但还是远离作弊网站比较稳妥。交换友情链接时就更明显了,一般都会检查对方有无作弊嫌疑或降权嫌疑,以免自己把链接指向不健康的网站而遭到搜索引擎的惩罚。

2.作弊特征研究
作弊特征研究是现在搜索引擎进行反作弊的主要手法,当发现一个对搜索结果影响很大的作弊网站或一种新的作弊手法时,一般不会只是人工地把这个或这些网站降权或者屏蔽,而是潜心研究这个网站或这些网站到底是怎么作弊的,以及钻了搜索引擎技术和逻辑上的什么漏洞。

当发现漏洞后就会提升算法弥补漏洞,同时对这种作弊方法进行有针对性的打击。Google 近两年所发布的算法升级都是有针对性的,不是针对操纵PR的链接作弊,就是针对网站影响用户体验行为的作弊等。百度更是如此,从2012年6月份以来的算法升级,每次都会针对特定的作弊行为。这都是研究作弊手法的特征后进行有针对性的算法升级的。

因为是针对某一特征的反作弊算法升级,也有可能会出现这种情况:某个网站没有作弊,但是也有类似作弊站的某些特征,而被搜索引擎摘带处罚了一下,视特征的符合程度遭受到的处罚程度不同。也就是说搜索引擎在反作弊的算法升级过程中,很有可能会产生误伤。这种误伤会不会产生,以及误伤程度和误伤范围要取决于搜索引擎打击作弊的力度和算法的精度。比如,百度搜索在2012年10月23日针对超链接作弊的算法升级过程中,只是取消了作弊链接的作用,而因为有很多有着优质内容的综合门户网站也都参与了此种作弊,所以才没有对参与作弊的网站进行打击。这种反作弊算法也就是把作弊的情况整理了一下,作弊站顶多失去作弊部分所带来的排名和流量,而没有得到其他额外的惩罚,这样没有作弊的网站就更不可能得到惩罚了,顶多有几个外链的作用消失而已。

又如,百度搜索在2012年6月28日针对采集站和垃圾站的算法升级中,因为是识别垃圾和采集,又因为搜索引擎暂时不能精确地识别原创,所以就导致了一些网站被连累,产生了一定误伤。后来百度搜索部门对投诉的网站进行了详细分析,虽然只有少数的网站被确定为误伤,但是可以肯定这种算法升级有一定的负面连锁反应。

站长和SEO人员在工作中,不仅仅要尽心尽力地运营自己的网站,还要避免自己和作弊站、垃圾站有所靠近或关联,同时要尽可能地向优质高权重网站靠近或扯上关系,相信这也是大部分站长和SEO人员一直努力的方向。但是很少有朋友有心避免被反作弊算法牵连,搜索引擎的算法再精准也是人设计出来的,并不是神造的、完美无暇的,所以有作弊就会有反作弊,反作弊稍微严格一点就可能产生误伤,作为站长和SEO人员应该尽可能避免这种被误伤的情况发生站长和SEO人员要潜心研究搜索引擎想要打击的作弊行为的特征。

比如,某种作弊行为都会选择使用一套开源CMS程序或者模版,那么你就要尽可能避免使用同一个CMS和模版;买卖链接的网站一般都会设置隐藏的链接块或文本块,并且卖的链接中经常会有医疗病种、私服、或者其他暴利、高竞争的关键词,那么你就要尽可能地不使用隐藏的TAB来做友情链接,并且最好不要和搜索引擎重点打击行业的网站做友情链接等。搜索引擎打击所有的作弊行为中,肯定都会根据这种作弊行为的特征进行算法升级,那么作为一个“良民”站长或SEO人员就应该避免和这些作弊行为有相似的地方比如,某个人长相和奥巴马一样可能会受到追捧,某人长得和“凤姐”一样就可能会受到到鄙视或嘲笑。

最后,需要了解的是,针对反作弊,搜索引擎也并不是总处于被动状态,搜索引擎也一直在研究站长作弊背后的动机和站在对立角度审视自己的各种算法,一般在算法上线之前都会设计相关算法,把站长容易操纵的作弊因素根据特征从正常的算法中过滤掉,并不是一味地亡羊补牢和处罚作弊站点。这应该也是近年来大众认为“SEO越来越难做”的原因之一在反作弊过程中,也很有可能会伴随着人工干预自然搜索排名,但是搜索引擎中的人工干预肯定不会是大众想象的那样频繁,也不是浅层次上的干预,否则搜索引擎自然排名的算法就可以丢弃了,搜索引擎也没有那么多专门来干预排名的人。但是不论多么大的搜索引擎,肯定都会有人工干预的存在。

能够让搜索引擎人工干预的站点,肯定是严重背离搜索引擎运作机制,或者严重影响到了搜索引擎的搜索结果质量,这种站点一般在搜索引擎上获得了异常多的流量,否则搜索引擎为众多网站导流量,并不会特别注意到。也就是说很多自认为遭受了人工干预的网站,或许根本就没有达到被搜索引擎人工干预的资格。在行业内,一般会认为被讨论越多的站越容易Over虽然正规的网站在SEO上也有很多值得讨论研究的地方,但在业内远不如对于作弊站点的讨论激烈,当搜索引擎从一些途径获得这些信息后,认为该站点的作弊行为已经产生了非常不良的影响,就可能会先进行人工干预,随后研究其作弊方法。

有很多朋友都在各种站长论坛中发帖声称自己被人工干预了,分别是在百度和Google 中搜索“百度人工干预”的结果数量。百度搜索有594000条,Google 搜索有834000条,这些声称自己被人工干预的站点其实都是小站,还没有达到被人工干预的程度,真正能够逼迫搜索引擎进行人工干预的站一般都是“大佬”或者技术逻辑“高手”的站点,用特殊资源顶上去的网站,恶意抢夺了太多的流量,而这些“大佬”和偷偷赚钱的“高手”是不会到处发帖子玩儿的,一个网站被干掉后,一般会马上研究其他的项目。当然也有说因为和百度的利益关系遭到人工干预的站点,像我等这种“丝级”的人物是接触不到的,所以一般网站被降权后,基本不用考虑人工干预的事。

百度进行人工干预的情况应该会有以下几种:某站长发现百度算法重大漏洞,使用低质量内容抢夺了太多百度搜索流量,已经明显影响到用户的搜索体验;针对热门搜索词或敏感词,为了“不娄子”可能会进行人工干预,搜索结果只使用某些主流网站的内容;针对不满意的搜索结果进行各项因素的权重比例微调等。

网站在搜索引繁中的表现突然下滑,不是自己网站作弊被搜索引擎处罚了,就是因为自己网站和其他作弊网站有关系。也不排除一种可能性比较小的情况,就是被搜索引擎的反作弊算法牵连了。当发现网站在搜索引擎中突然表现得很悲催时,就从以上三点找原因吧。不过可悲的是,很多站长和SEO人员已经不把作弊当做弊了,而是把很多作弊行为都当成正规运营手段比如,有一些SEO人员居然会发布类似“人家的内容全是高价请人伪原创的,一点作弊都没有,却被降权”的吐槽帖。


回复

使用道具 举报

广告客服|帮助中心|豫ICP备20018966号-2| 双鱼论坛

GMT+8, 2020-8-10 07:55

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.