SDG智享会 | 饶翔:如何利用大数据预测疫情走势
导 读
社投盟4月发起“SDG智享会”系列分享活动,以促进社投盟专家团观点碰撞与交流,推动可持续发展主题下的洞察分享与智慧对话。
随着疫情防控形势陆续好转,国内企业已陆续复工复产。全国范围内,复工人员相关数据的收集、监测工作量显著增加。大数据防控在这个过程中起到至关重要的作用。
4月8日晚,社投盟举办第2期线上分享活动,邀请社投盟2019年共闯加速营产品模块导师、安讯科技创始人饶翔结合SDG目标(良好健康与福祉)带来线上分享,进行大数据疫情的预测与下一步思考。
本期“SDG智享会”由社投联专家团召集人、科技专家黎江作为特邀主持。
本期嘉宾
安讯科技创始人饶翔
扫描图中二维码可回看活动视频
饶翔于2003年成立安讯科技,致力于大数据信息工程和人工智能应用的产业化创新。他坚持研究和耕耘于大数据与人工智能技术,为运营商、银行、政府等部门提供多维大数据智慧型平台。目前,安讯科技可以合规使用15亿手机大数据,是中国覆盖人群范围最广、跨行业数据应用最深的AI公司。
饶翔于2011年将iCloud的知识产权授权苹果公司使用。2020年1月28日,他正式启动安讯大数据疫情防控系统。在系统上线后,他第一时间与防疫指挥部联系,并免费捐赠系统给南京市政府使用。
特邀主持
社投盟专家团召集人、科技专家 黎江
黎江从业36年,在云计算、大数据、区块链、人工智能、金融IT、数据中心和产业规划与实施、IT战略与治理、产品创新与研发技术管理等多个领域颇有建树。
智享会分享全文如下:
如何让数据开口说话
据统计,目前在野外有160万种病毒,而人类已知的只有5000种。如今,传染病的死亡人数实际上是战争的13倍。然而,针对战争的军费支出十分庞大,但是针对治疗传染病的投入却比想象中要小得多。
我们的世界正在变得越来越小,传播的威力却越来越大。以2014年一个社交红包活动为例。起初只有两个种子用户发放红包。两个小时后,红包传递人数就达到了1500人;五个小时之后,达到了3万人;到了第二天,总人数达到12万人次。
在数据跟踪并分析了12万人的传播过程后,我们发现,相比于以前的六度连接,实际的传播只有3.8度连接。而新冠病毒的传播过程正如这个社交红包活动的传播过程,速度十分惊人。
国家卫健委1月14日发布的公文提到,要用大概率思维去处理小概率事件。然而,面对新冠疫情这种百年一遇的大事件,如果用大数据的思维去思考,那么应该用超大概率思维来思考灰犀牛的大概率事件。
此次新冠病毒的传播分为三个阶段。
第一阶段为2019年12月1日到31日。12月27日,财新杂志率先报道了三例不明原因肺炎。
第二阶段为2020年1月1日到20日。从数据上看,1月10日时已有40人确诊。在1月24日,我们大概知道新冠病毒的潜伏周期可能长达14天或者更长,它的周期中位数大约是在5天到6天。
第三阶段是2020年1月21日到30日。依据这些数据,我们得出了比较准确的判断。尤其在第三阶段时,我们已经通过大数据分析,采取了防范新冠病毒的强有力手段。
如果从数据上对比意大利的米兰和美国的纽约,我们可以发现更多应急处置的不同,也会发现更多背后的问题。
疫情如何被预见
疫情预测的两个关键点是对于趋势的把握和对于区间的把握。现如今,人处于大预测时代,有93%的事物是可以被预测的。
从新增高峰和目前的峰值来看,我们之前对意大利疫情趋势的预测,基本上都是准确的,其峰值在3月25日到31日之间。现在它基本上处于一个相对缓慢的下降过程,每天新增3000到4000例。目前,美国的感染人数还在日益增加,我们预计其高峰值在未来一周内。通过大数据建模,我们对每日新增确诊人数的区间和累计感染的人数区间进行了预测。
总结来说,预测疫情需要建立一个全球范围的新系统。
第一是运用雷达。以广州卫健委为例,它主动用雷达监控并发现到达广州的感染者。
第二是运用地图。如何能够科学预判疫情,知道当前处于什么样的发展阶段呢?当发现几十例确诊的时候,要通过地图来看这几十例的来源地。这些就是冰山下的数据,是更为重要的、可以预判未来趋势的数据。
第三是快速高效的核酸检测。这是目前为止最有效的检测方法,较早发现,较早隔离。
也就是,相关部门收集来自于互联网等各渠道的综合数据,形成云雷达。在综合分析之后,推演、判断未来趋势。例如需要口罩、床位、呼吸机的数量,以及高峰期到来的时间。这些就好比是预测洪水的高峰时期,或者说预测台风的登陆时间一样。同时,不断进行精准抽样,对于高风险的人群和区域进行主动检测。
人工智能(AI)把全球70亿人的健康联系在一起。当前全球的疫情状况下,我们发起“Big AI Union”,即运用大数据AI的手段,让它服务于公共卫生制度,服务于整个人类命运共同体。数据是思维,是大AI。如何让数据能够说话,如何能从未知知识中把它提炼出来,让我们能够更好地判断、认知和决策,需要人文情怀来创造人类福祉。这也是全球数据的“新基建”,真正做到显知识与隐知识齐飞,人决策与数决策并举。
智慧对话
黎江:“Big AI Union”这个词涵盖三个范畴。大数据Big,代表必然性关系;人工智能AI,代表性关系;联盟Union,表示协同化的组织形态、多信息整合梳理。您对于“Big AI Union”这个词的内涵和外延,有哪些更多的考虑?
饶翔:从文科角度来说,“大爱”是用科技激发生产力。“Big AI”像我们日常必不可少的水源,推动人类的可持续发展并造福人类。“Union”则具有人文精神,代表命运共同体。从理科角度来说,针对这三个不同的领域,团队需要不同的专业技术人才,为未来发展提供支持。
黎江:您认为数据化的推手究竟是谁?有人说不是CTO或者CEO,而是新冠病毒。数据化应用在金融方面的案例又有哪些呢?
饶翔:我们最早的产品叫iCloud智能云。它基于整个运营商的大数据来进行深度的分析,用来提升运营商内部的业务(最早是网络质量),后来也包括业务的优化、改善用户体验。在金融领域,我们已经做的很好的事情是普惠通信。一个例子是,在中国,贵州、青海、西藏等偏远地区也是有三级以上手机信号的。另一个例子是,每个人现在都有手机号。我认为数据隐私、信息安全是非常重要的,并且要把它们合法合规化,在安全、去隐私、利民化的同时搭建规范的通信体系。其实这是一种“云图思维”。预测新冠病毒感染的人数也可以运用这种思维,类似于在脑海中构建几百个人的流动曲线,然后进行模型推演。
听众互动
提问一:先前您说疫情是可以被预测的,但是这个预测的成功会不会是幸存者偏差?因为预测的基数太大,总会有一个预测成功的结论?
饶翔:在众多预测数据(感染率、确诊率等)中,死亡率预测是相对来说比较准确的,因为当前的死亡人数是真实的。而感染人数却不一定真实,因为存在无症状感染者,所以永远不能准确知道真实情况下到底有多少人患病。一般来说,对于疫情的预测趋势是正确的,不会存在幸存者偏差。但是针对不同国家的应对政策和具体情况(比如是否戴口罩),预测结果会有相应调整。
提问二:几个小时以前特朗普宣布要冻结给WTO的资金,像这种在政府层面的项目里突发的事件,是否会影响到AI的预测结果?
饶翔:虽然现在有一种说法是,特朗普的行为是不可预测的,但它的不可预知也正好是一种可预测。用大家理解的话说是“民粹主义”“直觉性思维”。
提问三:比起建模感觉数据的获取难度更大,完成这样宏大的分析需要的数据量和渠道的来源有哪些呢?
饶翔:最好、最强大、最全面的数据一定是运营商的数据。它的可用性超过任何一家互联网公司的数据,不管是阿里的、Facebook的,还是谷歌、苹果的。但是在这次疫情中,我们做预测的时候,没有运用到运营商的数据,而主要运用的是从互联网上获取的卫健委公布的数据。后来,我们对数据进行失真之后的修补,也就是还原。其实,互联网是一个非常好的数据来源。
提问四:可以预测一下全球疫情的拐点会在什么时候到来吗?全球疫情什么时候可以控制在和我国当前的水平接近?另外,请预测一下印度、拉美以及非洲是否能够像美国或者欧洲一样有爆发的可能?是否预测到英国的疫情的拐点?
饶翔:我认为现在谈这个还太早。因为从整体来看,中国是雪崩的第一波小高峰。第二波是在欧洲,特别是西欧国家。美国所对应的爆发,正好是高峰期,从3月25号左右开始,是真正的高峰期。到4月15号之前,如果能够顺利过去,已经算是比较好的了。
第三波实际上是最凶险、最危险的。印度政府最应该做的是,选择一个区域,就是我们称之为高风险区域的地方,对人群进行随机抽样的核酸检测。
相对来说,巴西政府在疫情防控方面比较靠谱。通过我们的监测,巴西的实际感染人数可能会比我们预计的要低一些。
其实,我们所认为的高风险人群的最主要特征是社交活动量大。因为接触的人特别多,所以被感染的风险性也非常大。所以,我们认为,对于英国来说接下来这一周是很重要的时间段。英国政府一直采取鸵鸟式防御,也就是我们所熟知的群体免疫防御。我认为,英国民众不应该去做抗体检测,而应该去做核酸检测。否则它的高峰期更加难以预测。英国的卫生副大臣、大臣都中招了,但是目前都已康复。查尔斯王子也已经康复。
提问五:如您可以提三条对于中国疫情防控的建议,那这三条建议是什么?
饶翔:第一,要主动基于数据进行疫情监测和防控,针对高风险人群、高风险区域进行判断。第二,基于全球新常态防疫情况来对待国内疫情。大数据是手段,核酸检测是载体。第三,随时做好准备。借用孙子兵法的一句话,不要以为敌人不会来,而是即使敌人来了,我们随时有准备。
提问六:搭建全球疫情系统的目前有哪些障碍?
黎江:首先,数据的使用权确认、流转、加工、分配缺乏在制度方面的约束。其次,数据的使用在文化方面也受到限制,比如有的国家禁止使用摄像头。这些都是人工智能的使用过程中的障碍。但是,这次疫情证明了数字化进程不可阻挡。
提问七:两位认为什么样的科技是面向未来的科技?如何能够让数据和AI更好的为人类福祉作出贡献?
饶翔:有爱、有人文关怀、上善若水的AI,是人类帮助自己穿越失控混沌巨婴期的唯一大道。
大数据模型及平台介绍
安讯大数据团队构建了新冠疫情的6期9率模型,打造了PandemicMap,1月份对中国疫情趋势做出了准确预判,2月21号文章中将韩国/意大利的风险系数分别列为海外第2和第5,彼时意大利累计确诊数为3例。
安讯科技和中国发展研究基金会、东西方慈善论坛,联合发起设立“一带一路国际联合防疫大数据AI平台”专项基金项目。该项目联合中外合作伙伴机构共同搭建起一个“Big AI Union”,建立全球公共卫生领域疫情预报与防控数据信息平台,也为建设国际公共卫生联动互助互通基础设施探寻道路并贡献经验。
点击PandemicMap 全球大流行预测大屏链接,查看对应国家的6期9率分析预测数据。
http://www.axon.com.cn/PandemicMap/(中文)
http://www.axon.com.cn/PandemicMap/en(英文)
相关阅读
可持续发展金融理念系列解析,请持续关注“社会价值投资联盟(ID:casvi2016)公众号,后台回复关键词“义利99”,免费下载2017、2018、2019年《发现中国”义利99“A股上市公司可持续发展价值评估报告》简版,了解评估详情。