文|锌刻度 杨宇良
编辑|陈邓新
关于搜索引擎人工干预的问题并不是新鲜的话题。而近日,《华尔街日报》的调查报道再次引爆了一出商业化丑剧。
该报道称,在测试了Google的新算法,并进行了100多次摸底采访后,发现了其结果偏向eBay等客户的事实。Google的工程师和供应商通过黑名单、后台调整算法等操作改变了用户的搜索结果,而让搜索呈现出对主要广告客户有利的排名。对搜索结果进行人工干预,让顶着“不作恶”光环的Google站到了风口浪尖。
对于这一场影响力巨大的指控,Google发言人立即予以反驳:“Google一直秉持公开透明的态度,无论是搜索分类、特殊功能(例如自动补全和依法不显示)的政策、还是Project Owl纠错机制,本质上都是为了让用户受益,而不是服务商业合作伙伴。相关报道对我们的指证,很多证据已经过时,都是不完整的旧事。”Google想一带而过,但是,事态发展远比想象中复杂。目前,反托拉斯监管机构已经在调查Google的业务,以确定其是否在市场上处于主导地位以扼杀竞争或伤害消费者。其实,谈到搜索引擎的人工干预,跟这套算法的进化有着紧密的联系。搜索算法需要不断升级,而升级的衡量标准在于用户,也就是人的体验,比如之前的标准强调精准,但是搜索范围很大,效率不高,用户体验差。如今,算法在强调精准的前提下,结合AI以及人工干预等方式,给出补全、联想、推测等方式,目的就是更好地服务用户。这件事,Google一直在做。它在全球多个国家招募了工作人员,对搜索结果给出评价,通过反馈来提升算法效率和用户体验。而对于关键字搜索的人为评价,本身就涉及到评价者的宗教信仰、政治立场、价值取向、专业精神等。综合这些评价给出的最优搜索结果,应该是大数据或者概率上的最优,但不可能做到尽善尽美。
而且,如果人工干预只是作为算法的一部分,的确可以通过大数据和人工智能筛选排除作弊或操纵的可能。但是如果人工干预超越了算法,直接参与到搜索结果排名,那就涉及商业腐败及不良勾当。
而《华尔街日报》正是抓住了这一把柄,而揭露其为了广告主的利益进行搜索结果操控,这无异于号称“不作恶”的Google一记响亮的耳光。这当然不是空穴来风,既然Google承认了相关调查属于旧证据的故事新编。那么,这就涉及Google的搜索引擎内部算法的争议。而这个争议的确也属于Google的最高层内部冲突。从2000年开始,Google的两位创始人谢尔盖·布林与拉里·佩奇就对于如何处理垃圾邮件和仇恨性内容意见相左。布林的态度是不干预。而佩奇则鼓励积极干预。
佩奇甚至敦促团队采取强硬的垃圾邮件处理方式,他对主管吼道“你只要做好份内的事,要是听布林的,公司早就毁了”。一番争斗之后,Google选择修改算法来对抗垃圾邮件,并允许更多的人工干预。
Google搜索算法首席工程师阿米特·辛格在Google官方博客中,曾经对Google算法的原则进行过详细的解释。他坦言,Google每天都要对海量网页进行数亿次的查询,网页搜索是访问量最大的,其他图片搜索、新闻搜索、地图搜索、产品搜索等。而在搜索排名上,Google的算法有三个原则。第一是全球相关性最高的搜索,第二是简单易用,第三是无需人工干预。第一个重点在于关联度高。第二个在于创新。第三个就是如何反人工干预。辛格举例称,只有对于一小部分违反政策的网站才选择人工干预。然而,《华尔街日报》却不这么看,他们指出,Google的确在维护垃圾网站的黑名单和关键词,并宣称Google不碰政治,但是它对算法进行的改变,却让广告大客户eBay受益。据悉,2014年,eBay的流量急剧下降,为此Google的当年收入减少了2亿美元。如果严格按照算法,eBay的搜索引擎优化SEO评级将会降低,所以eBay考虑从Google撤回大约3000万美元的季度广告支出。但是,显然Google不想失去金主。因此,Google最终通过人工干预,提高被降级的几个eBay页面的排名,而eBay当然也心照不宣为此付出了高昂的费用。除了eBay之外,Google还对亚马逊和脸书的网站进行了维护,在保证大企业利益的同时损害了小企业竞争者的利益。
这种定期对搜索结果的人工干预,涉嫌工程师越权操作。为了评估其搜索结果,Google雇用了数千名低廉承包商。但根据《华尔街日报》采访的承包商称,Google工作人员给他们每小时13.5美元的报酬,然后会告知他们一些“正确”的排名结果。这说明Google的暗箱操作并非是出于法律或公序良俗的需要,而是为了自身利益。更有甚者,Google的搜索黑名单则会自动排除有争议的主题(如使得堕胎或移民的评论更少煽动性)。而有的员工可以推动特定搜索结果的修改,包括疫苗接种和自闭症等主题。在此次的调查中,有一个现象值得关注。那就是Google在搜索算法上,2010年的更改是500项,2017年就变成2400项,而到了2018年,这个数字居然是3200项。专家分析,频繁地调整算法是人工干预的另一证据。Google为了讨好大股东和大客户,使其获得曝光率,而自己获得了某种隐晦性安全以及经济利益。
作为搜索行业龙头,Google的行为严重损害了行业的原则和底线。人工干预具有不可控,不安全,真相遮蔽等问题。特别是当它与商业利益绑定之后,一方面损害了用户的知情权,另一方面损害了同业竞争者的公平权。而一旦用户抗议达到一定程度,很可能导致对搜索引擎的失信,转而其他平台寻求答案。事实上,搜索功能的实现正在多元化。除了专注的搜索平台,越来越多的社交平台也承担着搜索的任务。我们对于传统网站的兴趣在于它的公正客观属性,虽然事无绝对,但是至少秉持着不作恶的态度,还是应该守住道德底线和行业操守。否则像Google与广告商暗通款曲,在获得巨额商业回报的同时,也一点点失去了用户的信任。带铜臭味的肉,永远是一把双刃剑。当Google试图伪装的岁月静好被拆穿后,那残酷的真相可能会引发暴风骤雨。林肯说,你可以在所有时间欺骗一部分人,也可以一段时间欺骗所有人,但你不可能所有时间欺骗所有人。这次关于Google的揭露,也许只是冰山一角,关于那些隐匿在屏幕背后的故事,涉及的绝不是技术决定论,而是关于人的善念、道德与良心。