查看原文
其他

谈谈大数据时代的《别被算法困在“信息茧房”》

傅一平 与数据同行 2021-10-16

点击上方蓝字关注公众号

请您点击“与数据同行”以“关注”,关于数据的实践与思考,每周一我在这里等你!

作者:傅一平 就职于浙江移动大数据中心  微信号:fuyipingmnb  欢迎交流!

人民网这样中央级别的政府媒体很少批评某一家企业,但从2017年9月18日的《人民网一评算法推荐:不能让算法决定内容》、9月19日的《别被算法困在“信息茧房”》直到最近的《人命关天的黑心勾当也敢做,还有良知吗?》,矛头指向今日头条,前两篇剑指算法推荐,评论其完全依托技术算法分发,事实上造成不良信息的野蛮增长;同时,一味简单迎合用户兴趣,也会让人们“自我封闭”,最近一篇则直指今日头条发布虚假广告,骗取患者钱财,于法不容,性质恶劣。

笔者重点想探讨下关于前两篇算法作恶的看法,因为在这个大数据时代,算法将越来越深刻的影响到每个人。

首先来看看人民网在《不能让算法决定内容》中的评论:

“定制化的新闻内容顺应了阅读分众化的时代潮流。但大数据技术和算法,也让内容的野蛮生长被放大,即使在技术为王的时代,也不能完全让算法决定内容,原因在于,技术红利的背后,也有阳光照不到的地方,包括,传播色情低俗内容。未经科学验证的健康知识、夸大其词的广告、只为博眼球的标题党、过于情绪化的观点乃至毫无用处的信息,都时常出现在智能平台首页的推荐当中。”

其在《别被算法困在“信息茧房”》作进一步评论:

“大数据兴起,算法越来越高级,技术越来越完善,我们迎来了信息订制化、传播智能化的时代。智能化的信息传播机制可以快速完成用户与信息的精确匹配,大大降低获取信息成本,为生活带来便利。但换个角度看,算法主导下的内容分发模式,也会带来“自我封闭”的危险。在算法的帮助下,我们可以轻易过滤掉自己不熟悉、不认同的信息,只看我们想看的,只听我们想听的,最终在不断重复和自我证成中强化了固有偏见和喜好。一旦身处这样的“信息茧房”,就再难接受异质化的信息和不同的观点,甚至在不同群体、代际间竖起阻碍沟通的高墙。”

为什么人民网会说算法主导下的内容分发模式会带来“自我封闭”的危险?

这个论断当然不是空穴来风,查理.芒格在《穷查理宝典》中就提到人习惯于避免不一致,习惯于追求确定的东西,而这些对于人的成长不利:

“为了节省运算空间,人类的大脑会不愿意作出改变,这是一种避免不一致性的形式,在所有的人类习惯中,无论是好习惯还是坏习惯,我们都能看到这种情况,没几个人能够列出许多他们已经改掉的坏习惯,而有些人哪怕连一个都列举不出来,与此相反,几乎每个人都有大量持续很久的坏习惯,尽管他们自己也知道这些习惯不好,考虑到这种情况,在许多时候我们说三岁看老不是没有道理的。”

大脑的抗改变倾向还使得人们倾向于保留如下几种东西的原样:以前的结论、忠诚度、身份、社会认可的角色等等。人类大脑在进化的过程中为什么会产生出这种伴随着快速消除怀疑倾向的抗改变模式,现在还不是很清楚,猜想这种抗改变模式主要是由如下几种因素的共同作用引起的:

(1)当人类的远祖还是动物的时候,迅速作出决定对生存来说是至关重要的,而这种抗改变的模式有助于更快地作出决定。

(2)它使得我们的远祖能够通过群体协作而获得生存优势,因为如果每个人的反应总是不停地改变,那么群体协作就会变得很困难。

(3)从人类刚开始识字到今天拥有复杂的现代生活,中间的时间并不是很长,它是进化在这么短的时间内所能得到的最好的办法。

我们很容易可以看出来,如果任由避免怀疑倾向引发的快速决定和拒绝改变这种决定的倾向相结合,将会使现代人的认知出现大量的错误,而且实际情况也确实如此,我们所有人都曾和许多冥顽不灵的人打过交道,那些人死抱着他们在小时候形成的错误观念,直到进了坟墓还不肯放手,由于避免不一致性倾向引起的糟糕决定所造成的问题特别严重。

正确的教育应该是一个提高认知能力的漫长过程,以便我们变得有足够的智慧,能够摧毁那些因拒绝改变倾向而被保留的错误想法,正如在世界顶尖大学任教的凯恩斯爵士谈及他那些高级知识分子同事时指出的,新思想之所以很难被接受,并不是因为它们本身太过复杂。

新思想不被接受,是因为它们与原有的旧思想不一致,凯恩斯教授的言下之意,就是人类头脑和人类卵子的运作方式非常相似。当一个精子进入卵子,卵子就会自动启动一种封闭机制,阻止其他精子的进入,人类头脑强烈地趋向于与此相同的结果,所以人们倾向于积累大量僵化的结论和态度,而且并不经常去检查,更不会去改变,即便有大量的证据表明它们是错误的。

我们一方面在提博雅教育、通识教育,希望能开阔年轻人的眼界,提升素质,另一方面,媒体的算法却越来越擅长依据个人历史浏览信息去实施推荐,但依据历史信息进行算法推荐是个正反馈系统,它会将历史的极致呈现给你,而基因让我们总是倾向于记得历史美好的事物,忘记曾经的痛苦,算法放大了这一点。

移动互联网+大数据本来是为了让信息传递变得更为透明方便,现在也带来了副作用,孕育而生的算法+高度集中的媒体是否是另一种禁锢?

媒体可以说我冤枉啊,算法是无罪的,但算法真的是中立的吗?

笔者不知道,但可以给你看本书,也许它说了大实话,市场环境下的利益车轮不会说谎。

霍金写《时间简史》和《大设计》两书,都有一个被所有人忽视了的第二作者:列纳德·蒙洛迪诺,其还写了本《潜意识:控制你行为的秘密》的书,蒙洛迪诺真的是个非常会写书的人,他完全了解读者想看什么。

蒙洛迪诺说,人做判断的时候有两种机制:一种是“科学家机制”,先有证据再下结论;一种是“律师机制”,先有了结论再去找证据。世界上科学家很少,你猜绝大多数人使用什么机制思考?每个人都爱看能印证自己已有观念的东西,我们不但不爱看,而且还会直接忽略那些不符合我们已有观念的证据。

如果人已经被各种观念分成了阵营,那么趋利的媒体就不会追求什么“客观中立”,因为没人爱看客观中立的东西!媒体应该怎么做呢?技术活动家Clay Johnson 在 The Information Diet (《信息食谱》)这本书里,给我们介绍了美国收视率最高的新闻台 Fox News (福克斯新闻)的成功秘密,其成功在于有最先进的新闻理念:

第一,有线频道这么多,你不可能,也没必要取悦所有观众,你只要迎合一个特定观众群体就可以了。第二,要提供有强烈主观观点的新闻。

给观众想要的东西,比给观众事实更能赚钱。观众想要什么呢?娱乐和确认。观众需要你的新闻能用娱乐的方式确认他们已有的观念。福克斯新闻台选择的观众群体,是美国的保守派。每当美国发生枪击事件,不管有多少媒体呼吁禁枪,福克斯新闻一定强调拥枪权——他们会找一个有枪的采访对象,说如果我拿着枪在现场就可以制止惨案的发生。美国对外军事行动,福克斯新闻一定持强硬的支持态度,如果有谁敢提出质疑,他就会被说成不爱国。哪怕在其网站上转发一篇美联社消息,福克斯新闻都要做一番字词上的修改来取悦保守派,比如《选民对经济的担心给奥巴马带来新麻烦》这个标题被改成了《奥巴马跟白人妇女有大问题》。

今天有些媒体和网络上有各种观点鲜明的文章和报道,它们或者骂得特别犀利,或者捧得特别动人,观众看得畅快淋漓,十分过瘾,但是这些文章提出什么切实可行的解决方案没有?说过什么能够修正我们现有思想的新信息没有?它们只是在迎合和肯定人们已有的观念而已,因为它们的生产者知道他们不需要取悦所有人,他们只要能让自己的粉丝基本盘高兴就已经足够获利的了,他们是“肯定贩卖者”。

这个毛病叫做“确认偏误”(confirmation bias),如果你已经开始相信一个什么东西了,那么你就会主动寻找能够增强这种相信的信息,乃至不顾事实,这样一旦我们有了某种偏见,我们就无法改变主意了。

蒙洛迪诺说的对不对笔者不作评价,但算法似乎利用了这种确认偏误。

当然企业要生存,收益为第一要务,算法投其所好是很自然的结果,正如你到超市发现最热卖的商品总是放在你容易看得见的地方一样,但媒体跟超市有一点不一样,就是社会的发展已经让物质生活极大丰富,吃穿住行的选择已经很难影响青少年的成长,但媒体则要承担更多社会责任,包括政治责任、道德责任及文化责任。

“媒体要弘扬社会主义核心价值体系,继承、扬弃、整合和创造文化形态,潜移默化地影响和塑造社会大众的精神操守,提升民族文化的层次和品位”,显然,完全迎合人短期偏好的算法的确会做过头。

未来到底要不要对算法做约束?这跟市场经济环境下政府要不要干预一样,人民网发文出来警示下很好,大家需要多讨论,但客观环境改变有个过程,作为个人还是要能发挥主观能动性,那么如何破解呢?

万维钢在《智识分子》这本书的建议供你参考。

首先,如果别人预测你会这样,结果你果然就这样,你是什么人呢?

普通人,俗人,分母。

如果你做事处处符合大数据,你应该被机器人取代。

但是世界上有些人却是模型所预测不了的,统计,顾名思义,就是指大多人的行为规律,总有少数人的数据因为距离大多数人的主流数据太远,而被模型视为误差直接忽略,这些少数人,就是格拉德威尔说的异类,他们就是王小波说的、拒绝被生活安置的“特立独行的猪”。他们就是《黑客帝国》里跟机器人对抗的反抗者,这些不平凡、不能被模型预测的人,才是大数据时代的英雄,当然我们不可能一下子成为英雄,但我们今天就可以从自己做起:

不总是去看某个媒体推荐给你的信息,而是努力去做个信息极客,看新闻就装8个客户端,浏览信息就同步打开8个网站,这样的世界会更丰富而精彩,当然更要能发挥主动性,内事不决问百度,外事不决问谷歌,偶偶可以问问必应,从知乎到简书,从CSDN再到维基百科,从得到到喜马拉雅,从36氪再到混沌大学,最后还可以去查查论文。

总之,世界很精彩,不要被算法困在“信息茧房”。


视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存