查看原文
其他

测测你的“数商”能得几分

商周君 商业周刊中文版 2020-09-19


自古以来,数据就代表着事实、逻辑和智慧。在汹涌而来的现代智能时代,数据正在扩展新的边界,拥有新的内涵。我们正在进入一个“数据不是一切,但一切都将变成数据”的时代。在这本书中,大数据先锋思想家涂子沛借助全新研究成果,创造性地提出了一个新概念——“数商”。数据是土壤,是基础设施,更是基本生产要素,而数商则是衡量现代人类是否具备数据意识、思维、习惯和数据分析能力的重要尺度,它衡量的是数据化时代的生存逻辑。


作者涂子沛,江西吉安人,大数据先锋思想家,曾在美国学习、工作多年,2014年从硅谷回国,出任阿里巴巴集团副总裁。2018年创建数文明科技,同时担任伊斯佳股份董事、人民网和国地科技独立董事。著有《大数据》《数据之巅》《数文明》《给孩子讲大数据》《给孩子讲人工智能》等作品。本科毕业于华中科技大学计算机系,研究生毕业于中山大学、卡内基-梅隆大学,获公共管理硕士和信息技术科学硕士学位。


这本书阐述了以大数据为中心的大计算、人工智能等核心技术浪潮和趋势的演变逻辑,为个人梳理了一张在新时代需要理解掌握的技术地图和清单。作者借助一个又一个的历史故事对数商的深刻内涵进行解读,这些故事以人物为中心,跨越了从远古到现代,特别是人类社会转折、文明跃迁的高光时刻。在这本书中,作者不仅赋予了数据独特的价值,更难能可贵的是,作者还在书中精心编制了“数商测试题”,让数商变成可以用标尺来衡量的数据思维能力——它就是数据智能时代的度量衡。


以下内容摘编自《数商:如何用数据思考和行动,并在智能时代胜出》。参与文末留言分享活动,就有机会把这本书收入囊中哦!!



书名:《数商:如何用数据思考和行动,并在智能时代胜出》

作者:涂子沛

出版社:中信出版集团

出版时间:2020年7月

定价:88.00元





实“数”求是:抗疫要数据,更需要数商 




这一章,我们关注如何用数据来对抗危机和灾难。


2020 年年初,全球各地陆续暴发新冠肺炎。截至 5 月 1 日,全球新冠病毒感染人数已经超过 350 万,死亡人数约 25 万,这场突如其来的灾难成了 21 世纪以来人类面临的最大挑战,其影响甚至超过了 20 世纪 30 年代的大萧条。截至本书出版,疫情何时彻底终结仍未可知。


疫情的终结有赖于疫苗,但疫苗的开发需要最少一年的时间。除了疫苗之外,人类对抗瘟疫,数据就是第一支点,也是最有用、最高效的工具和武器。


举个例子,新冠病毒的传染性很强,当一个人被确诊感染之后, 我们就要知道他去过哪里,和谁接触过,因为他接触过的人可能会被他传染,成为新的传染源,感染更多的人。以前我们只能靠询问,但遭受感染的人此刻正在被病魔折磨,可能很紧张,也很虚弱,自己记不清也说不清去过哪里,这时候大数据就可以发挥大作用了!


主管传染病的是公共卫生防疫部门,他们可以通过电信运营商和互联网公司获取这个人近 14 天的行踪轨迹,即每天他从哪里到了哪里,在每个地方停留多久,用过何种交通工具,包括日期、航班与车次,还有公交卡、网约车、出租车司机等,都有数据和记录,根据这些信息,可以寻找他可能密切接触过的人,对他们进行隔离,以切断病毒的传播渠道。此外,药店也有发烧药和咳嗽药的销售记录,买药、乘车也可能留下手机支付的数据,这些数据也可以辅助公共卫生防疫部门追踪和决策。


疫情初期,中国的数字地图公司纷纷绘制出了人口迁徙大数据地图,这些地图可以回溯春节前后武汉将近 500 万人的流动情况,即他们从哪流动到了什么样的地方,这对疫情的防控起到了很大的作用。中国是疫情暴发最早的国家,也是疫情控制最快的国家,一个重要的原因,就是重点地区封城、全民禁足,即有效地隔离。


在疫情快要结束的时候,人们要复工上班,要在同一个办公室上班,如果有人携带病毒,那会引起群体性感染,是非常危险的。手机健康码于是应运而生,用的就是上面的原理,每天进入办公楼的时候,有人给你量体温,你一提交自己的个人信息,你的个人轨迹就在大数据的平台上和其他数据进行碰撞,如果你和确诊的患者乘坐过同一班列车或者公交,去过同一个地方,系统就会提示你需要重点关注,可能需要隔离。


当然,在整个疫情的防控期间,也有数据应用不到位的地方。我注意到,一开始对疫情传染渠道确定说是飞沫,后来,有专家说通过眼睛也可以传染,接下来,又说通过气溶胶、接触,还有粪便的渠道传染。中间有一段时间,大家的注意力转向了公共设施,例如电梯按钮、扶手、火车上的洗手间等,因为怕传染,甚至连电梯里的按钮也不敢按,其间有近两个月,传染渠道一直说不清楚。一方面,人类对新型传染病的认识需要时间;另一方面,也有对病例的数据搜集不详尽、不彻底,分析不到位的因素。


其实数据在流行病的防治过程当中有非常久远的应用,历史上有过很多成功案例。现在我就要和你讲一个我心中的数据英雄,他用数据谱写了人类抗击流行病历史上的第一段数据传奇。这个故事发生在工业革命的早期。


不明其理就会做蠢事


工业革命,是人类历史上划时代的变革,它在英国率先发生,但你现在肯定想不到,当时的英国首都伦敦,作为全世界首屈一指的大城市,真实情况是个什么样子。


毫不夸张地说,它是一个被粪坑包围、恶臭弥漫的城市。你记得英国作家狄更斯的《双城记》一开始的那句名言吗?“这是一个最好的时代,也是一个最坏的时代”,这个描述很无奈,但又很准确。


说起来这和抽水马桶的发明有关。18 世纪末,英国人发明了抽水马桶,从 1800 年到 1850 年,抽水马桶快速普及。坐上马桶,粪便一冲而走,这感觉非常好,但马桶的普及也带来了灾难性的后果,因为当时的城市,即使像伦敦一样先进,也没有一套与之相配的现代污水处理系统。大多数抽水马桶只是把污水和粪便排到了和房子邻近的粪坑当中,而这些粪坑需要淘粪工人来清理,粪便还要用马车来运输。


这个时候的伦敦,正处在快速城市化的进程当中。据 1851 年的人口普查,伦敦有 240 万人口,全世界人口数量第一,但当时的伦敦城市面积只有 90 平方英里(约 233 平方公里),人们挤在狭窄的公寓里,排泄物就沉积在邻近的空间当中。到粪坑来拉粪便的马,就是当时最主要的交通工具,这些马也会随地排泄。这样一来,整个伦敦城弥漫着粪坑、下水道、作坊、锅炉以及牲口穿行街道散发的臭味。


恶劣的给排水条件导致饮用水和污水互相渗透,后来人们才知道,正是这个原因造成了一种烈性传染病的大流行。


这个病就是“霍乱”,当时,霍乱无药可医,染上就是等死,而且症状十分恐怖:患者全身肌肉痉挛,肚子剧痛,同时不停地上吐下泻。一个人体内的水分最后会被排干,整个过程中,患者的神志都很清醒,差不多就是眼睁睁等死。


对英国来说,霍乱也是随轮船和贸易而来的舶来品。1831 年前英国从来没有霍乱,但这之后,欧洲其他地区暴发霍乱,英国也会出现零星的病例,再之后,就是大面积暴发,一共有过 4 次,每次都有数以万计的人死亡,其中 1848 年至 1849 年尤为惨烈,死亡人数高达5 万人,这引发了大面积的恐慌。


但当时人类一直搞不清楚霍乱大面积暴发的原因。主流的观点就是“瘴气论”,这个观点认为城市里的恶臭空气是霍乱的源头,很多人主张用除臭剂来阻断霍乱的流行,当时的宣传是:“吃热喝热,睡好穿暖,不要在通风的地方睡觉和休息!”可以设想,当霍乱流行, 家家紧闭门窗,希望借此逃脱死神的收割。


但事实上,霍乱是通过受污染的水来传播的。1880 年,德国的微生物学家科赫(Robert Koch,1843—1910)在显微镜下发现了霍乱弧菌,霍乱患者的排泄物中含有这种细菌,而饮用了含有霍乱弧菌的水就会感染霍乱。所以预防和控制霍乱,最关键的就是保护水源。因为不知道真正的原因,伦敦城干过蠢事。当地的政府组织民众进行垃圾大清扫,结果把带有霍乱弧菌的污水倒进了泰晤士河,这些病菌随着饮用水又进入了家庭,导致霍乱再扩大,死的人更多。可以说,因为没有真正了解霍乱传染的原因,伦敦城的人们是在自己给自己挖坑,越清扫越糟糕,人们在不知不觉中集体赴死。


直到斯诺(John Snow,1813—1858)出现,这个错误才得以扭转,斯诺运用数据和夺走数十万人性命的疾病展开斗争,在人类历史上,他是第一人。


难以战胜的人类感觉


斯诺是一名医生,其本业是麻醉。1853 年,维多利亚女王的王子出生,就邀请他担任麻醉师,为皇家服务在当时是很高的荣誉,斯诺算是一名皇家医生。


当时的麻醉术,刚刚出现不久。没有麻醉术时,在医院的手术室里,常常会传出病人惨绝人寰的哭叫之声。1846 年,美国的牙医莫顿(William T. G. Morton,1819—1868)发现可以用乙醚作为麻醉剂, 以减轻手术中病人的痛苦,这种方法很快就传到了伦敦。


斯诺发现,乙醚很神奇,但麻醉效果常常不稳定:有的时候非常完美,整个过程病人都处于昏睡状态,但有的时候病人会在手术中间突然醒过来,还有的时候病人根本就不会入睡。他推测根本的原因在于剂量,之所以难以控制剂量的多少,是因为乙醚在不同温度之下密度相差很大。这意味着在不同的温度下做手术,乙醚的使用剂量不同,例如在寒冷的冬天,乙醚的使用量就应该比炎热的夏天少,大部分医生都没有意识到这一点,意识到了的,在实际操作中也是凭经验控制用量,没有标准可循。


斯诺尝试解决这个问题,他制造了一款乙醚吸入器,它通过控制水温来控制乙醚的密度,进而控制病人的乙醚吸入量。为了得到精确的数据,他把刚发明的吸入器固定在自己脸上,释放出乙醚气体,几秒钟之后他的脑袋就耷拉在桌子上。等他一醒过来,尽管双眼迷离, 他马上拿起表记下失去知觉的时间。他发现温度每升高 20 华氏度, 乙醚的剂量就应该增加一倍。斯诺把不同温度之下乙醚的强度和用量制成了一张表,以供医生使用。


如果说,贾格尔拥有对数据的信仰和机警,达尔文把记录当作一个常年的生活习惯,第谷拥有几十年如一日的执着,开普勒有不厌其烦、长夜战斗的精神,你会看到,斯诺不仅严谨细致,他还有一种大无畏的精神,愿意也敢于用自己的健康和生命去换取数据,他是一位真正的“数据英雄”,是人类历史上第一位配享这 4 个字的医生。对于斯诺,我不忍也无法仅仅用“数商”两个字来评价分析他。


1831 年,伦敦暴发了第一次霍乱。小灾进城,大灾离城,在巨大死亡阴影的笼罩下,城市的居民都成群结队向乡村逃亡。这个时候,斯诺还是一名学徒,他目睹了出城的人流造成交通大拥堵,人走城空,正常的生活被传染病快速摧毁,这些场景令他刻骨铭心。


他是一名麻醉医生,这种传染病跟他关系不大,但医者仁心,他开始关注研究这种病。


当时的人们都传言,霍乱是通过空气传播的,城市里无处不在的臭味和瘴气是这种传染病的根源。


伦敦市政府的户籍办有个统计学家,叫法尔(William Farr,1807—1883),他的职责就是记录人口的最新变化,例如出生、结婚和死亡。这个法尔非常了不得,他在户政部门工作了 30 多年,建立完善了伦敦的人口出生和死亡记录体系,他也是我们上一章提到的对疾病进行测量的主要倡导者。在他接手霍乱疫情统计之前,办事员会记录死者的姓名、地址、年龄和死因,但死因往往很笼统。法尔认为, 增加记录的变量就会增加数据的价值,他将疾病分成 27 类,并劝说医生在报告死亡病例的时候,从这 27 类疾病当中选出一个死亡的原因, 所以经他统计的数据,不仅有年龄、地址和职业,还有具体的死亡病因,这给伦敦的医生和卫生机构提供了一个新的制高点,使他们有能力追踪、调查城市流行病发生的时间、地点,分析其模式和原因


法尔对死因的记录方式后来成为世界各国普遍采纳的模式,但当时法尔也笃信瘴气论,他认为,污浊的空气会郁集沉积在低处,更高的地方空气更好,因此居住在高处的人感染霍乱的可能性要小。为了证明这个推测,他在收集霍乱死亡案例的时候又增加了一个要求,记录病人居住地“海拔高度”这个数据项。


大霍乱期间,法尔每周都发布伦敦市的死亡报表。这些数据好像真的显示出,高一些的地方病人更少,更加安全。


1848 年,伦敦暴发了第三次大霍乱。斯诺发现,霍乱患者的最初症状都是腹泻呕吐,“如果真的是瘴气传播,那为什么最先被感染的不是鼻子和肺,而是肠胃?又为什么一家人当中会有幸存者,接触病人的医生也不会被传染?”


斯诺断定,霍乱一定是经口腔进入肠胃的。他推测这极有可能是因为喝了不干净的水。但用当时的科学设备,看不到水里的微生物, 被霍乱弧菌污染的水,看起来完全和正常的水一样,仍然纯净透明,斯诺无法说服身边的人相信他的判断。


凡是这个世界的事物,表面看起来越是普通日常、容易明白,要对它们的来龙去脉做出解释、分析和证明就越难,越需要非凡的能力和思想。


斯诺需要的,显然是更多的证据。他深入病区,挨家挨户敲门询问患者和喝水有关的信息。他发现了一个惊人的事实,1848 年至1849 年霍乱暴发期间,伦敦市共有 7466 人死亡,其中 4001 人都居住在泰晤士河南岸,这就意味着南岸的死亡率接近 0.8%,是市中心区的三倍,而伦敦西边和北边的死亡率仅仅是 0.1%。


对此,瘴气论的流行解释是,泰晤士河南岸聚居了大量的劳工阶层,污浊的空气导致死亡率更高。



斯诺认为这个解释是错误的,他举出反证说,伦敦东区比泰晤士河南岸聚居了更多的民工,是全伦敦最贫穷、最拥挤的地方,但死亡率只有泰晤士河南岸的一半。斯诺认为真正的原因是,南岸的伦敦人都饮用泰晤士河的水,而北岸伦敦人的饮用水来源并不仅仅限于泰晤士河,而是有多个来源,他分解了各个来源,发现死亡的数据和供水的路线有高度相关性。


斯诺的调查数据表明,饮用A 公司水的家庭有1 263 人死于霍乱, 而饮用 B 公司水的家庭只有 98 人死于霍乱。当然,单纯比较死亡的绝对人数是不公平的,因为有些地区住的人多,有的地区住的人少, 斯诺又拿每 1 万户的死亡人数做对比,结论是饮用 A 公司水的家庭, 每 1 万户死亡人数是 B 公司的约 8.5(315/37)倍。


饮用不同供水公司的水,每 1 万户死亡人数就会有高达 8.5 倍的差距,这究竟是什么原因?斯诺又追踪了两个公司的水源,他发现,A 公司在流经伦敦市中心的泰晤士河下游取水,而 B 公司在上游取水,而当时的泰晤士河,已经被霍乱患者的排泄物污染了。


法尔对斯诺的观点半信半疑,他提出:要测定水源对霍乱的影响,必须要有两组居民,这两组人生活在同一海拔高度,活动于同一空间,吃的东西一样,日常活动也要相同,仅仅一方面不同,那就是喝的水,但在现实中的伦敦,显然找不到这样的实验条件。

 

但斯诺认为,实验已经摆在我们面前。两家公司的管道都通向所有的街道,进入几乎所有的院落和小巷,无论贫富,无论房子的大小,两家公司都等而视之地提供自来水服务,而接受不同公司服务的客户,他们在生活条件或者职业方面也无明显的区别,特别是他们都被同样的“瘴气”围绕,为什么有的犯病,有的没事呢?


1849 年,斯诺把这些调查和发现编写为一个小册子《霍乱的传播方式》,正式提出水污染是霍乱流行的真正原因:“再也设计不出比这更好的实验,让我们彻底地检测水对霍乱的影响了,整套实验设计就现成地摆在研究者面前,而且这一实验的规模也非常大,多达 30 万不同性别、年龄、职业阶层和地位的人,从上流人士到底层穷人, 被分成了两组,他们不仅不能主动选择,而且在大多数情况下对这种选择毫不知情。”一组得到了干净的水,而另一组得到了被污染的水, 所以斯诺得出结论,水源不干净,才是霍乱传播的真正原因。


斯诺的论断是天才式的,他在“随机对照实验”的概念还远没有产生的时代,就在现实中发现了一次科学实验。我们后文会阐述,科学的实验机制要到 20 世纪初才被统计学家确立。但斯诺这些论述只有很少的人相信,这个小册子总共才卖出去几十本。大众对瘴气论深信不疑,毕竟,嗅觉是人类一种最原始的感觉,人类相信自己的感觉,就像哥白尼时代的人类相信地球静止一样。人类对感官的迷信可谓根深蒂固,只有一流的头脑才能将数据当作“感觉的替代品”,通过数据来感知我们自己的身体和外部环境。


斯诺告诉法尔,为什么光看死亡人数,瘴气论好像很正确。那是因为在海拔高的地方,人口的密度往往低,因此死亡的人口总数更少,但真正的原因不是这些地方远离瘴气,而是居民远离了泰晤士河下游,水源较为干净。他甚至得出结论说,如果 A 公司将其取水口移到泰晤士河上游,那么就可以挽救 1 000 多人的生命!斯诺最终说服了法尔,在他的统计当中增加了一个新的变量:死亡者的饮用水源。都是数据分析,为什么只有斯诺才能洞察真正的因果关系?我想这来源于他对事实和规律持之以恒的细致追踪。在很多时候,流于表面的观察都无济于事,最高水平的成就来源于一步一步的追踪和死磕。近半个世纪以来,中国社会一直倡导“实事求是”。事,就是事实;是,则是规律。实事求是即通过事实分析发现事物的规律。斯诺的方法,可以总结为实“数”求是:把事实记录下来,再通过全面细致的数据来寻找规律。


数据英雄的逆行


1854 年的秋天,大霍乱第四次席卷英国,8 月 31 日暴发,3 天就有 127 人死去,10 天之后,死亡人数攀升到 500 多人,其中一个叫宽街(Broad Street)的居民区死亡案例最多、最集中。


这时候的斯诺,每周第一时间就阅读法尔的死亡报表,关注死者的饮用水源,希望在表格和数据中寻找到线索。


虽然法尔收集了供水的来源,但根据这部分数据斯诺做不出任何判断。为什么呢?


这是因为整个伦敦有 10 多个大公司在为城市的不同地区供水, 各个公司的地盘互相交错,供水管杂乱无章地交织在一起,仅凭地址无法准确判断供水公司。


斯诺左思右想,无计可施,为了得到这些数据,他最后决定一家一家上门走访。

 

斯诺走了多少路,我们今天已不可得知。但他很快又碰到了新的困难,即使挨家挨户去敲开每一个患者的门,得到的数据也还是不完整、不准确,因为很多住户根本不知道自家的用水是哪个公司提供的,房子可能是租的,水费可能是由房东支付的,就算是自己付的, 也找不到公司的收据,名称还是不清楚。


苦心人,天不负,斯诺又想出了新办法解决这个问题。他在走访中发现,某一个公司的水所含的盐分是另外一个公司的4倍,根据这个差别就能判断水的来源,这样一来他碰到不知道自己供水公司的住户,就取一小瓶水样,在瓶上注明地址,然后带回去检测。


斯诺搜集数据的执着让人感佩。在大多数情况下,数据都没有现成的。搜集数据太难了,就像在风中奔跑,搜集随风飞散的柳絮一样,你需要逐风而行,东奔西走。但对高数商的人而言,这一点是共性:他们都愿意展开搜集数据的行动,都愿意为之付出极大的努力, 包括精力和时间,搜集数据所用的精力、体力和时间,可能是分析数据的数倍之多。第谷和开普勒就是最好的例子。


在死亡案例高度集中的宽街,斯诺发现,“几乎所有的死亡案例都发生在一个街头水井附近。只有10个死者的住所靠近另一个街头水井,而其中有5个死亡家属确认,他们一直使用那个水泵,有3户距离这个水井远一点,但死亡的孩子所在的学校就在这个水井附近”。


在这条街上,他还发现,有一家啤酒厂和一家感化院没有一个人死亡。他实地走访了这两个地方,发现啤酒厂和感化院都有自己独立的水井,而且啤酒厂的工人平常只喝啤酒不喝水,斯诺更加确定,水就是人们感染霍乱的最终原因。


现在,让我们设想一下,一个小区暴发了有史以来最为凶险的传染病,惊恐的居民在一片混乱中成群出逃,马车拉着家当往一个方向走,但一名皇家医生选择逆人流而上,挨家挨户去敲门了解死者的生活细节,他走进的每一间房子,都还笼罩在葬礼的阴影和哀号当中。



斯诺不仅追踪每一起霍乱死亡的病例,还创新了记录的方法,他将死者的地址在地图上标注成一个一个的点,当所有代表死亡的点都标注上去之后,地图呈现的信息立刻清晰起来:霍乱绝不是像空气一样平均分布在这个地区的,死神的阴影有浓云密布的地方,它是从一个点发散出去的,这个点就是水井!相比于数据,人类的大脑更愿意接受图表,当面对人群,高数商的人一定要想办法把数据转化为图表。


9月8日这一天晚上,是新一轮霍乱暴发的第10天,在政府组织的紧急会议上,斯诺展示了自己的数据和发现,并建议立即封闭宽街上的水井,以此切断霍乱的传播。


这在当时,是一个异常艰难的决定,因为如果斯诺搞错了,那些备受死神折磨的家庭,还将没有水喝,没有水用,这无异于雪上加霜;如果他是对的,这个举措就将挽救无数的家庭和生命。斯诺在会议上发言并展示了他的图表,这张图表发挥了巨大的作用,市政理事会最后经过投票采纳了斯诺的建议,当局立即拆除了宽街水井的水泵手柄,以控制水井的使用。


宽街霍乱引发的死亡,由此慢慢地平息下来。


——图 8.3 水井和霍乱的传播——


注:这幅图出现在今天的各种教科书中,它已经成为数据可视化的一个标志性作品,它展示和代表的并不仅仅是绘图技术,而是收集数据的科学原则和大无畏的精神。

 

后续调查证明,1854 年这一场霍乱起源于宽街 40 号的一名女婴, 她被确认感染了霍乱,她的母亲把她的尿布水直接倒进了家门口的化粪池,化粪池的秽物渗透到土里,距离这个化粪池不到 3 英尺的地方,就有一口公用水井。


这名女婴的父亲随后也感染了霍乱,并在 9 月 19 日去世。在丈夫病倒后,这位母亲又开始朝化粪池中倾倒污水,如果当局没有拆除宽街上的水泵手柄,后果将不堪设想。


也就是说,斯诺的判断有效地阻止了霍乱的再一次暴发。


在我看来,斯诺是敢于逆行的英雄,是一名有头脑的英雄。所谓数据英雄,就是一个人有足够的勇气和专业的判断,为真正解决问题起到关键的、压倒一切的作用,如果没有斯诺的行动,伦敦霍乱的局面和后果将会完全两样。


现代流行病学的开创人


这之后,越来越多的人逐渐接受斯诺的观点:霍乱是通过污水传播的。


伦敦市政府也因此开始下决心建设一套现代化的新地下水道,把污水处理和生活供水系统彻底分离开来。


但在这个工程完工之前,1866 年 6 月,伦敦又暴发了一次霍乱。这一次政府立刻按照斯诺的思路,张贴出通知,要求居民不能饮用任何没有煮沸过的水,随后调查发现,在首例死亡案例的发现地,那户人家有抽水马桶,其马桶的排污管道距离一家供水公司的水源仅仅几英尺之遥,而高达 93% 的死者都是这家供水公司的用户。


由于迅速切断了污染源,这场霍乱很快平息,越来越多的人信服斯诺的判断,著名的医学杂志《柳叶刀》发表了评论文章:



斯诺的调查富有成效,位列现代医学调查的榜首,因为他的严谨分析和归纳,霍乱经污染水源传播的理论得到了证实。他对人类做出了莫大的贡献,因为他,我们才能找到霍乱传播的源头和途径并迎战,斯诺给我们带来的福音,我们应该铭记不忘。





但在这段评价发表几年之前,斯诺已经离开了人世。他是病死的,时年 45 岁,据称他的早逝跟他年轻时做实验吸入了太多的麻醉气体有关。今天,斯诺被全世界尊称为“现代流行病学之父”。流行病学,就是为了遏制不明原因的流行病而产生的学问,其中的关键, 是为流行病之所以流行找出真正的原因。斯诺是这一门学问的开创者,从他的故事你可以看到,寻找真正的因果关系,是一件高难度的事情。我认为,斯诺之所以能戴上后人给予的这顶桂冠,关键在于他对数据的细致、严谨、执着和信靠的态度。


斯诺的故事并不是孤例。19世纪40年代, 维也纳总医院流行产褥热病,很多孕妇在医院中死亡。这个医院的产房有两个部门,一个部门由医生给孕妇接生,而另一个部门只有助产士接生。但奇怪的是,由医生接生的部门,死亡率是 12%,而由助产师接生的,死亡率是 3%,两者相差巨大。当时有一名医生叫塞麦尔维斯(Ignac Semmelweis,1818—1865),他注意到了这组异常的数据。


1847年,一名教授在给一名死于产褥热的妇女做尸检时不慎划伤了手指,随后死亡。塞麦尔维斯由此断定,孕妇死亡的真正原因是医生的手上沾染了不干净的东西。他于是游说医院出台一项新的规定,医生在对孕妇进行检查之前一定要用氯液洗手。在实施这个规定之后,两个部门产妇的死亡率大幅降低,分别下降到 1.27% 和 1.33%,医生终于做得比助产士更好了。


但塞麦尔维斯的做法同样不为当时的大众和同行医生所接受,因为人类那时候看不到细菌,大部分人认为塞麦尔维斯是可笑的,直到塞麦尔维斯死后15年,人类才从显微镜下看到导致产褥热的链球菌。


塞麦尔维斯被后世称为“母亲的救世主”。但如果你生活在塞麦尔维斯的时代,你会相信他的推断吗?高数商群体的一个特征,就是能用数据代替感官来进行思考。


——图 8.4 纪念斯诺的水泵和酒吧——


注:你如果去伦敦,现在还可以看到当年拆除了手柄的水泵,它在布罗德维克街(Broadwick Street)上。隔街相对,有一间以斯诺的名字命名的酒吧。


1868 年,整个伦敦市的地下水道体系建成使用,伦敦的恶臭渐渐消失,饮用水的质量逐步提高。这套系统一直使用到今天,至今还是伦敦污水处理的中流砥柱。


1892 年霍乱再次来袭,德国汉堡成为重灾区。


当这个消息通过电报传到英国,伦敦的市民无比焦虑,因为在这之前的 60 年里,只要汉堡发生霍乱,病菌就会越过英吉利海峡传到伦敦。但这一次,新的地下水道真正成为一道防线,完全把病菌隔离了。自此之后,对伦敦而言,霍乱彻底成为历史,再也没有在英国流行。


1892年德国汉堡的这一场霍乱,带走了当地近一万条生命。这个代价相当巨大,因为汉堡的人口只有伦敦的1/7。在19世纪70年代,德国汉堡也学习伦敦,修建了一套现代化的地下水道系统,但是后来发现其系统设计有缺陷,没有保证污水和生活用水完全分离,这正是导致霍乱再次暴发的原因。


中国人对霍乱的理解和治疗


在历史同一时期,中国正处于清朝,我们当时对霍乱这种疾病的解读和治疗,只能用一团乱麻来形容。


霍乱传入中国的最早时间,学者并没有定论,但比较一致的看法是,1820年,即清嘉庆二十五年,世界性的霍乱传入中国,其强传染性和导致死亡的惨烈程度,也引起医生和民众的巨大恐慌。


据记载,当时的疫情非常惨烈,广东、福建、台湾等沿海地区是重灾区,霍乱感染者十之八九,都没有办法救治,棺材销量剧增,奔丧探亲也可能感染疫情。


传统的中医认为,霍乱的表征为肠胃疾病导致的吐泻,其原因是饮食不节制、阴阳失调。对于严重吐泻所造成的脱水症状,中医解释说,“霍乱而转筋者”乃是“冷气入于筋故”,血气虚弱和阴阳失调。例如光绪年间,名医徐士銮著《医方丛话》一书,就分析了节气、地理环境、个人易感体质、饮食习惯与感染霍乱瘟疫的关系。他认为南方“地卑气薄”是导致居民多发吐泻痧症的重要原因。

 

基于以上的解释,中医的治疗方法主要有以下四点:一是刮,邪气有进去的地方,必然也可以出来,“肩、颈、脊、背、胸前、胁肋、两肘臂、两膝弯等处,皆宜用棉纱线或苎麻绳或青线或瓷碗口,醮菜油自上向下刮之,以红紫色绽方止,项下及大小腹软肉处,以食盐研细,用手擦之,或以指醮清水撮之”;二是灸,以灯芯草蘸油点燃刺激身体的若干穴位,或者“炒盐适量,用布包后熨灸心腹,待热气透达后,又以一包熨灸背部,待手足回温后,再服神香散一钱,寒重则再服”;三是洗,“生大蒜,杵烂,贴两足心,或吴茱萸一两,研末,盐卤和,涂两足”;四是针刺,刺血泻邪,即用针刺某些穴位,把邪血放出来。



除此之外,民间到处都流传着各种稀奇古怪的猜想,有人指出天有异象,“四月朔,日月合璧,五星联珠”,有鬼兵出行;在江浙地区有鸡翅生爪的传闻,“民间盛传鸡膀生爪,三爪可食,四五爪不可食,食之杀人”,以致民间争先恐后杀鸡;还有人猜疑是海鲜鱼类及瓜果等饮食致病,有“巨鱼”入港,“人多脔而食之,灾后未几,遽发大疫”,或者“甜瓜剖之有血,食之立病”;而在山东等地,外国传教士较多,又产生了纸人作祟、外国人投毒水井传播疫情的谣言。


究竟死了多少人呢?对不起,根本没有细致的数据和统计,很多地区都只记录死了数万人,到底多少,完全是笔糊涂账,只能说成千上万。


也就是说,数据的追踪和统计无从谈起。当时的中国,没有建立一套成形的公共卫生体系,国人不愿意把家人的死亡信息公开,因此对全面的疫情和死亡人数,不可能像斯诺医生那样获得实际的统计。


1932年,霍乱在全国大暴发,上海租界当局为了掌握疫情,不得不规定,每报告1例霍乱,酬银 l 两。


到1885年,广州流行霍乱。这个时候,德国的科赫已经确认了其病源就是水中的霍乱弧菌,中国的报纸也开始介绍西医流行病学如何对霍乱进行治疗和处理的知识,但中国大众对霍乱病因的讨论,还是聚焦在脏乱环境、海鲜、蔬果导致瘟疫流行的讨论上,可见传统的思维如何根深蒂固。


直到 1904 年,广州霍乱流行,中国的第一个女西医张竹君女士(1876—1964)指出患者呕吐秽物污染了江河水源,扩大了疫情传播,她建议当局用船从广州郊区运水供市民饮用。她的建议被政府采纳, 两广总督派出 4 艘退役军舰,拖载40条水船运水供广州市民饮用。几周之内,疫情就被控制下来,这成为中国流行疫情防控历史上的经典案例。


我们前面提到了李约瑟之问,中国为何不能产生现代科学。这个李约瑟难题,成了近一百年以来中西比较研究的热点话题。大科学家爱因斯坦也曾讨论过,他认为,形式逻辑体系和通过科学实验发现因果关系,是近代科学得以发展的两个基础,和西方相比,古代中国在这两个方面都非常薄弱。


过程往往更能揭示真相,细节常常更能说明问题。本章斯诺的故事,讲的就是他如何通过数据搜集、分析和逻辑推理对抗灾难,拯救人类的生命,他实“数”求是的数据思维,给后世的流行病学打下了深刻的烙印。我认为,斯诺给后代展示的,不仅仅是一个高数商的抗疫思路,还有大无畏的英雄行为,他是历史上为数不多的真正的数据英雄。


对于李约瑟之问,大家心中可能各有答案。但我相信,这个故事一定有助于我们理解中华文明的短板和它伟大而坎坷的征程。

 

——思维拓展训练——


很多人读了斯诺的故事,会强烈地感觉到这好像一个侦探在破案,因此斯诺被后世冠上了“数据侦探”“侦探医生”的美名。这种感觉还真没错,伟大的侦探都要有一种本领,那就是通过蛛丝马迹来判断因果关系,这当然需要数据。福尔摩斯在面对一宗疑案时,曾经情不自禁地喊出声来:“数据!数据!给我数据!巧妇难为无米之炊。”今天警察要破案,核心能力就是大数据分析。下面两道题帮助你思考如何像侦探一样找到真正的因果关系。


1. 在一个小镇上,有一个警察局长发现,当冰激凌的销量上升的时候,当地的犯罪率也会上升。他把当地冰激凌的销量和案件的数量关系制作成一个散点图,这些点竟真的清晰地表明了两者的上述关系。你认为下面哪几个说法是正确的?


A. 控制并减少小镇冰激凌的销量,可以降低犯罪率

B. 这是两种独立的趋势,不过碰巧同时出现而已

C. 冰激凌和犯罪率不是因果关系,而是相关关系,因为天气变热,犯罪会增多

D. 虽然控制冰激凌的销量不能减少犯罪,但可以用冰激凌的销量预测犯罪


2. 氡是一种放射性气体,它可以从地基渗透到建筑物中,并在房屋关闭的时候累积相当高的浓度。有医生认为过浓的氡气会导致肺癌。在美国科罗拉多州,氡气很常见;在中国香港氡气不常见。研究人员对比了两个地方的肺癌发病率,发现基本相同,因此得出结论说,氡气不是导致肺癌的原因,你认为:


A. 凭借这组数据可以得出这个结论

B. 凭借这组数据不能得出这个结论




想要立即获得本书?那就快点击文章下方的“阅读原文”前去购买!


点击文章右下方“在看”并转发朋友圈,在本文下方留言谈一谈你对于“思维拓展训练中题目”的理解和看法,就有机会获得我们送出的《数商:如何用数据思考和行动,并在智能时代胜出》哦!活动截止时间为2020年8月12日中午12点,一共5本,快来加入我们的留言互动吧!

网站、APP一号通

点击这里购买

一键拥有“国际视野&全球商机”



可点击下方图片订阅最新杂志!

◆  ◆  ◆  ◆  ◆  


点击你感兴趣的关键词

立即获得关于TA的更多信息!


途牛

香港 | 普京

新加坡赫兹澳门赌王

特朗普安倍晋三马斯克金正恩

尼曼马库斯中行原油宝IMF华为

......


欲了解更多专业内容,请点击这里下载商业周刊中文版App

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存