查看原文
其他

【专家观点】沈晓卫:认知计算引领产业智能化(PPT精选及报告全文)

2015-08-22 战略前沿技术


本文由杨静lillian(公众号:lillian_yang_1111)授权转载,原文来源于中国人工智能学会公众号(CAAI-1981 )


【专家观点】谭铁牛:智能化时代生物识别的机遇与挑战(附报告全文)

【专家观点】李德毅院士:大数据认知(附报告全文)



2015年8月14日,由中国科协、中国科学院指导,中国人工智能学会主办的第五届中国智能产业高峰论坛在上海长荣桂冠酒店顺利召开。IBM中国研究院院长沈晓卫做了题为《认知计算引领产业智能化》的报告。今天给大家推荐中国人工智能学会刊出的沈晓卫院长报告全文。(PPT精选由静沙龙特派记者王嘉俊拍摄并整理)
沈晓卫

以下是沈晓卫发言全文:


大家早上好,今天很高兴能有机会在这里跟大家分享IBM关于认知计算方面的一些前沿性研究。包括我们如何用认知计算技术,解决行业中的实际问题。今天,我们处在大数据时代,大数据跟云计算的结合造就了我们今天非常多的机会。刚才几位嘉宾也都谈到,云计算实际上提供了崭新的方式。使得我们把基于大数据的价值,输送给最终消费端。我们还利用了移动通讯技术,使得基于大数据的价值能够更好、更方便的被客户使用。

今天的IT系统从根本上讲需要构建一个具有洞察力的系统。传统的叫基于记录的系统。什么意思呢?数据都是结构化的,基本上我们会把这样的数据放在关系数据库中。过去几十年大多数的IT技术,都是用于构建一个基于记录的系统,这是IBM在过去几十年付出了非常多的努力,跟业界同行一起努力的方向之一。今天我们看到一种新形态的系统,我们把它叫作基于互动的系统,这种互动可能是与人的互动,如社交媒体,可能是与物理世界的互动,如物联网这样的系统。在这里,大多数的数据是非结构化数据。我们今天面临的问题,就是如何基于一个传统的基于记录的系统和一个新兴的基于互动的系统,共同构建一个具有洞察力的系统。IT系统最核心的价值之一,就是从数据中产生洞察力,而这种数据包括传统的结构化数据和新兴的非结构化数据,例如大量的多媒体数据。在这样一个过程中,因为我们有太多的数据,包括大量非结构化的数据,传统的数据分析技术就显得非常欠缺,这也就是为什么我们会谈到所谓“认知计算”技术。

应该这样讲,我们谈大数据,实际上如果没有认知计算,就几乎无法解决大数据的问题,因为数据量远远超过传统IT技术可以处理的范围。也正是基于此,我们认为新的IT系统在做分析时,需要一种自我学习能力。从宏观角度来看,我们认为今天的IT世界已经开始从传统的基于编程的时代进入认知计算时代。在前几十年我们做了非常多的努力,包括前几年IBM Watson系统的成功。
在IBM研究院有一项重要的工作内容叫“全球技术展望”,我们每年都会付出非常多的努力,探讨未来3-10年最重要的技术趋势是什么。从2012年开始,每一年全球技术展望的题目都有跟认知计算相关的课题,包括2013年我们谈多媒体数据分析,包括现在我们谈到基于人脑的计算等等。
这是一张很简单的总结图,能够看到未来18个月、三年到未来十年,在IT行业或者跟IT有关的领域,我们认为可能有重大突破、有影响力的研究方向。在这个过程中,大家可以看到,其实有很多题目是跟认知计算有非常密切的关系的。我们认为在未来几年之内,如何来构建一个认知计算的平台,如何做更好的基于对话和推理的具有实用性的系统,这方面的研究可能有重大的突破。更长期来看,如何做模拟人脑的计算,如何做具有边缘计算这种特性的系统,如何做量子计算,这些都属于可能在未来会有非常重大影响力的方向。
现在我们谈认知计算代表了一种未来的发展方向,接下来我也会谈到新的研究突破。我想特别强调认知计算在今天已经在发挥作用了,今天它已经在引导着、推动着产业的智能化。比如在能源方面,如何利用认知计算技术使得我们能够充分利用新能源,如何利用认知计算技术使我们更好的做环境监测;又比如,如何利用认知计算的技术,让我们来更好的做智慧医疗等等。
物联网是一个非常重要的课题,认知计算跟它实际上有着千丝万缕的联系。今天的物联网已经进入到了3.0时代。传统的物联网1.0是什么概念呢?互联互通,我们对物理世界进行监测,把这样的信息传递回数据中心做简单的处理。回过头来看,这个时代已经在发生。物联网2.0的时代,我们认为它会更专注于对传统IT技术的提升,使我们能够处理物联网带来的巨大数据。这方面的传统技术是有的,但是可能达不到这样的效果。

物联网3.0有两个非常重要的特征:

1.方案从本地部署向云端推进。未来物联网的解决方案,应该是从云端来提供部署,而不仅仅是在本地部署。

2.认知计算会发挥非常重要的作用,同时,物理模型会被用于描述物理世界。物联网3.0非常重要的特征是“智能化”,从简单的数据采集,推进到深度数据分析,进而产生可具有执行力的洞察力。


总结一下,物联网3.0非常重要的,这也是它能够推动产业转型的两个方面——云计算和深度智能化。而在这个过程中,“认知计算”是一个非常重要技术的手段。
下面谈一下IBM的绿色地平线计划。我们如何利用认知计算的技术,来解决今天行业升级转型中所面临的一些问题。IBM在去年由中国研究院牵头,全球12家研究院参与启动了“绿色地平线”计划。它在解决一个什么样的问题呢?如何利用云计算这样的技术,帮助我们更好的利用可再生能源,如何帮助企业更好的节能减排。还有就是如何可以更好的对环境进行管理和优化。
我们跟国内的合作伙伴合作、构建了一个空气质量管理和监测系统。我们可以对城市未来72小时的空气质量指数,包括PM2.5做一公里乘一公里范围的污染指数预测。做这样的预测,可以为污染控制决策争取到更多的时间,可以提出更好的决策支持和解决方案。比如我们预测到某个城市未来72小时之后,它的PM2.5可能过高。这时候我们有各种各样的处理措施,可能会把汽车限号,工厂减产。但是从什么时候减产会有很多经济方面的考量。我们利用卫星云图数据,空气数据,空气污染源数据,包括实时监测的城市空气质量的数据,来做这样的推理。然后考虑应该提供什么样最好的解决方案,让决策更有预见性,更科学。为什么说认知计算可以提供一个非常重要的技术支撑?这是因为有大量数据和大量模型,但是我们很难确定在一种给定的情况下,哪一个模型是最好的。这样的话,我们需要构建一个超级模型综合考虑各种条件和因素。
接下来,谈一下如何基于物联网和认知计算技术做可再生能源的利用。同样的,我们构建了这样的解决方案。今天已经在全球超过30个的风场实施,我们能够精准的对未来72小时甚至更短时间风力进行预测。以风力发电为例,风力虽然是可再生能源和清洁能源,但是由于它的不稳定性,很难被并网使用。同样的,利用这样的技术也可以在太阳能预测中得到精准的结果。
医疗是另外一个例子,我们今天面临着很多挑战,在中国每年大概有70亿人次去医院看病。今天的医疗所走的方向之一是个性化,如何做个性化的医疗?我们以癌症为例,每年在这方面发表的论文成千上万,没有哪一个医生能够有精力来浏览、理解所有的文献,而庞大的基因数据也会成为个性化诊疗方案的基础。面对这样非常大规模的数据,我们需要用认知计算技术来帮助理解发表的文献等等。
接下来,我们谈一下IBM在认知计算方面的研究。一个突破性的进展是,2011年时IBM的WATSON在美国的“危险边缘竞赛”中战胜了全美的冠军。这从人工智能发展历史上,是一个标志性的事件。
这里我来谈一下IBM关于认知计算方面的一些新进展。IBM将WATSON作为未来非常重要的增长点,所以IBM成立了WATSON业务部门。我们认为目前这项技术已经可以进入实用阶段,产生真正的商业价值。
接下来,我将介绍下IBM研究院关于认知计算的探索性研究:

1. Medical Sieve
首先,我们需要Watson具备视觉能力。在医疗行业我们有非常多的多媒体数据需要理解,这个技术帮助过滤必要的临床和影像诊断信息,形成总结和建议,大大减少临床医生观看X射线、CT等医学影像的工作量,准确定位可疑病症,这是我们在IBM研究院正在发生的一个项目。

2. Debater
我们还需要认知系统具备思辨能力。“向青少年销售暴力视频游戏应该被禁止。”这是一个论点。Debater需要在几秒钟内,大概浏览四百万篇文章。这四百万篇文章当中大概有五亿个语句,每一个语句又有很多种可能的理解。面对这样的信息规模,需要排查出最多几十条跟刚才这个观点有关的论点。机器几秒钟就能告诉我们,比如:你这个观点是正确的,有以下三点说明。比如:有什么样的数据显示,暴力视频游戏会让青少年滋生攻击倾向,不利于青少年的健康成长。与此同时,这个系统也可以给你反方的依据。比如:有实践证明或者有数据显示,大多数玩暴力视频游戏的青少年并没有产生暴力犯罪问题,而且,据研究调查表明,暴力视频游戏还可以提高他们的协作能力。大家可以想像,如果这个研究最终能够有非常大的突破,它能产生的商业价值也是不可估量的。

3. SyNAPSE
另外,我们需要未来的认知系统具有感知能力。与现有的冯诺依曼架构的计算机系统不同,模拟人脑中神经元的系统能够实时识别出用正常速度拍摄的路口视频中的人、自行车、公交车、卡车等。这样的信息处理跟传统的数据处理是不一样的。IBM最近有一个很大的突破,就是IBM宣布了SyNAPSE芯片,这个芯片含有100万个可编程神经元,2.56亿个可编程突触,它最大的特点是功耗非常低。一个传统的计算机芯片大概是100-200瓦,人脑是20瓦,这个芯片的功耗不超过70毫瓦。我们可以想像,这样的技术突破,如何能够应用在我们谈到的无论是物联网世界还是认知计算的世界。
接下来我们谈一下边缘数据。今天我们看到边缘端,无论是手机还是传感器等等,产生了非常多的数据。今天我们看到的一个趋势是什么?数据在边缘端产生的速度是远远超过了通信带宽增加的速度,与此同时我们也知道在未来的一两年之内,手机端的存储能力和计算能力也将超过全球服务器的存储能力和计算能力。这告诉我们如果要发觉这样的价值,很多的处理能力是需要在传感器这一端或者在边缘端发生,这也是为什么刚才谈到的像SyNAPSE有很好的应用场景的原因之一。
模拟人脑的系统更适于分析传感器数据,我们需要构建新的IT系统,使它能够更好的对人类的形象思维能力做更好的模拟。包括刚才谈的SyNAPSE系统,可以用在边缘端而不仅仅是在云端来做处理。
最后想特别强调一下,认知计算最终的能力体现是需要与云计算结合的。认知计算本身是一种解决方案,是需要从云端提供给客户,这也是未来发展的一个方向。从技术上来讲,它有芯片方面的创新,有系统方面的创新,有平台方面的创新,更有应用方面的创新。从合作的角度来讲,要构建这样的系统,要帮助我们的产业升级和转型,可能更重要的是要构建很好的生态系统。在这个背景下,IBM也跟很多业界朋友有许多共同的合作,我们也希望有更多的机会来做更好的推动。谢谢大家!
现场活动环节
报告后,现场参会代表积极提问,与沈院长展开了热烈的探讨。

[沈晓卫与现场听众互动环节。]

问:刚才说了,大数据可以给我们未来的生活提供很多很多可能性。我想问一下,关于大数据保护方面有没有一些什么样的想法?是在大数据的开放和保护之间,如何平衡?

沈晓卫:谢谢,我觉得你这个问题是非常重要的,而这两个方面实际上是非常相关的。应该这样讲,我个人认为数据的安全,包括隐私等等,可能是物联网等取得成功最重要的先决条件。如果有什么因素使基于大数据的产业不能得到快速发展的话,这可能是非常重要的一个原因。

对于数据安全,包括隐私等等,它不完全是一个技术问题,需要法规、政策等方面的跟进。在技术方面,传统方式更多是把IT系统设计出来后,再谈怎么把它的安全性提高。实际上,安全是在考虑大数据系统功能、性能的同时,需要从第一天就考虑的。对于这点,我们需要在技术上做非常多的突破,IBM有专门关于信息安全这方面的业务,针对信息安全技术做了很多努力。谢谢!


问:我们在做视觉系统,有两个问题。第一个问题,信息从采集到交互到未来的认知系统。在交互系统里面,由于非规则化的数据产生,在非规则化的数据里面,您认为视频和图象数据占了多大的比重,起到什么样的作用?第二个问题,您提到了未来18个月到三年期间有一个高级图象识别的技术。这个“高级”相对于目前的图象识别,有什么特点或者特质?谢谢!

沈晓卫:个人认为,绝大多数大数据是视频和图像的,可能占到80、90%或更多。视频和图象信息蕴含很大价值,今天还需要花更多的努力,因为目前大量工作还是集中于文本分析,虽然包括结构化和非结构化文本。我们认为这方面是需要有重大突破的,因为大多数数据是视频和图像形式。我想特别强调,除了具体技术的突破之外,我们需要构建一个综合系统,能够真正解决产业中面临的各类具有实际价值的问题,正如IBM几年前基于认知计算技术构建的Watson系统一样。谢谢!


【战略前沿技术】一网打尽系列陆续推出,请回复以下关键词查看相关文章:
回复“工业4.0”或“industry”,查阅“工业4.0”专题系列文章;回复“神盾”或“DARPA”,查阅“美国高级研究计划局DARPA”专题系列文章;

回复“颠覆”或“distructive",查看“智库建设”专题系列文章;

回复“3D”或“4D”,查阅“3D打印”与”4D打印“专题系列文章;
回复“硅谷”或“silicon”,查阅“硅谷”专题系列文章;回复“石墨烯”或“graphene",查阅“石墨烯”专题系列文章;回复“智能制造”或“inte manu”,查阅“智能制造”专题系列文章;回复“智能”或“intelligence",查阅“人工智能”专题系列文章;回复“军民”或“integration",查阅“军民融合”专题系列文章;回复“激光”或“laser",查阅“激光武器”专题系列文章;回复“智库”或“tank",查阅“智库建设”专题系列文章;

其他主题系列陆续整理中,敬请期待……


【战略前沿技术】2014-2015年历史文章目录已上线,回复“目录”即可查看,敬请关注!

【战略前沿技术】已开通原创、评论以及对原创作品的打赏功能

欢迎评论:对于文章有任何问题和看法,请移步文末进行吐槽和评论!

欢迎投稿:对于原创性作品将优先发表,并将获得读者打赏的全部!

欢迎打赏:请对原创作品随意和任性打赏,打赏将全部归作者所有!


【战略前沿技术】
引领科技创新发展
1

微信公众号:tech999

个人微信号:tech9999

邮箱:2669537857@qq.com

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存