查看原文
其他

如何利用数据了解世界

编译/黎文 文汇学人 2024-01-09

即便拥有越来越多的数据,许多人对世界的看法也相当偏离现实。总部位于牛津的研究机构“我们的数据世界”数据主管爱德华·马蒂厄(Edouard Mathieu)近日接受fivebooks.com网站的采访,介绍要利用数据了解世界,有哪些可靠的指南。他推荐的五本书里,有两位作者是扑克牌手,还有三位分别是医生、政治学家和数学家。


Factfulness,2018
中译本《事实》,2019


马蒂厄首推《事实》,由已故的瑞典医生、学者汉斯·罗斯林与子媳合著。这本书胜在简单直观,“无关那些花哨的机器学习技术。它是关于现有的数据——我们已经有了几十年的数据——能告诉我们的世界状况”。罗斯林曾调查瑞典的学生、政治家和记者,发现许多人对世界的看法要么偏颇要么扭曲,对已取得的进步没有准确认识,无论是儿童死亡率,还是当前世界的女童入学率。人们普遍认为世界处于一种可怕的状态。但实际上,数据显示,在过去的几十年和几个世纪里,我们取得了巨大的进步,人类不应如此悲观。马蒂厄建议大家都登陆Gapminder网站做个测试,通过可视化数据,看看自己是否真的掌握世界现状。


在更好地了解世界之外,数据也可以帮助我们在日常生活中做出更好的决定。马蒂厄说,其实他选的每本书都在描述贝叶斯定理。托马斯·贝叶斯是18世纪的统计学家和哲学家。他提出了关于如何理解世界的重要理论——根据一段时间内可获得的证据进行反复推论,不断微调。这个定理的方程式不重要,人们一旦掌握了其中蕴含的方法,就可运用到几乎每件事情上。


以我们想知道自己感染一种传染病的几率为例。很多人都会在两极之间摇摆:开始总是认为不可能得(近乎0%的几率),某天突然有了症状,就立马会想,哎呀,我中招了(100%)。


根据贝叶斯定理,正确做法是从一个基线概率开始。这可以是对本城目前感染人数的估计,如官方数据给出的3%。然后,当你获得一个新信息——例如,有了症状,就应该根据这个新信息去调整染病概率(或调至20%)。然而症状也可能是其他原因所致,因此不要直接作出最坏的判定。在贝叶斯定理下,凡事都不是直接进入最坏的状况。随着每个新信息的出现,你不断调整,直到得到对事件概率的最新最准确估计。不要见风就是雨。



The Signal and the Noise,2012
中译本《信号与噪声》,2013


马蒂厄说,在利用数据这方面,纳特·西尔弗的《信号与噪声》虽是十年前的旧作,但可能至今仍是数据科学、概率思维、机器学习及所有这些方面读物的集大成者。西尔弗做过扑克牌手、棒球分析师,还成功预测了两次美国大选。他认为区分海量数据中何为噪音、何为信号,至关重要。在贝叶斯定理之外,西尔弗强调在统计中要正确表达不确定性,还应考虑一系列可能的结果。


《对赌》的作者安妮·杜克也是一名扑克牌手。她对认知行为决策科学非常感兴趣。在书中,她比较了扑克和国际象棋。以博弈论的术语来说,国际象棋是一种“完全信息”博弈。棋盘在前,两个玩家掌握所有的信息,他们知道眼前这个世界的全貌。在扑克中,情况恰恰相反,大部分信息是隐藏的。你只知道自己手中的牌,不知道牌桌上其他玩家手里有什么,也不知道接下来揭开的是什么牌。


杜克认为,生活更像扑克,而不是国际象棋。在生活中,并没有一幅完整画面展现你希望拥有的所有信息。你在很大程度上都是在猜测——猜测人们的意图,猜测事情如何发展。那么,既然生活更像扑克,你就得像一个扑克玩家那样去生活。你要“赢”,就须凡事都从概率角度思考,用扑克牌手的技巧做出更好的决定。


她还提醒人们千万要避免“结果”导向的思维,即以最后的结果来判断考虑过程的质量。举例来说,在任何一场足球比赛后,你都会听到专家们花几个小时分析场上发生的一切,并从中得出惊人的结论。他们激动地宣称教练应该被解雇,某球员不值得挖,某球员在什么时刻应该被换下。但他们忘记了,足球是一项随机性相当大的运动;也许教练做出了所有正确的决定,可即便如此,结果也未必更好。


Thinking in Bets,2018

中译本《对赌》,2018



马蒂厄推荐的第四本书是政治学家菲利普·泰特洛克与记者丹·加德纳合著的《超级预测》。泰特洛克依附美国情报高级研究计划局(IARPA)进行的“良好判断计划”就发现,一些“超级预测者”远胜某特定领域的专家,例如他未必懂球,却猜得更准。泰特洛克还发现,这些“超级预测者”组队的表现更优于单打独斗,他们的共同点是,都习惯于将大问题分解成更小的问题,并且会先定下基准概率,考量手中所有信息而不只是新证,思考概率而不仅仅是某件事的真假,等等。


数学家汉娜·弗莱的《你好,世界》深入浅出地展现了算法和计算模型的工作原理,也出现在马蒂厄的推荐中。她举出大量现实案例,具体客观地评价算法的作用。例如,她探讨了COMPAS(美国地方司法体系中使用的机器学习系统,旨在为法官提供量刑建议)存在的局限与偏见,但仍对数据科学的应用前景表示乐观。


《超级预测》,2015


《你好,世界》,2018



编辑:温弟




猜你喜欢

大数据时代还需要民意测验吗?

“在国内学术界,真正积极研究分配正义的,往往不是经济学家,而是社会学家。”

梁捷 | 2020诺贝尔经济学奖:当拍卖活动涉及公共价值

梁捷  | 诺奖经济学奖为何再次青睐行为经济学

梁捷 | 赫希曼与发展经济学的新进展

成一农 | 如何将你的文献数据“武装到牙齿”



资讯(2023.4.15)|如何利用数据了解世界

编译/黎文





 关注我们~



继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存