查看原文
其他

【视频】2017创新大会 | 陈云霁:制造机器人大脑

墨子沙龙 墨子沙龙 2019-04-08

2017创新大会 | 探索者

往期回顾


崔维成:走进深渊

孙立广:我们在两极的脚印

圆桌|上:未来的人类应该如何开拓生存的空间

常进:探测暗物质

郭爱克:大脑探秘

编者按:人类大脑是已知事物中最强的智能,借鉴人类大脑制造机器“大脑”,是计算机整个科学皇冠上的明珠,也是所有计算机科学家都非常关注的问题。而人工智能想要与人脑媲美,必须找到一个合适的载体,这个载体就是机器大脑的芯片。


人类制造机器、也在创造奇迹。

https://v.qq.com/txp/iframe/player.html?vid=n1421xc6lxz&width=500&height=375&auto=0

视频来源 | 2017创新大会实录


大家下午好。我是来自中国科学院计算技术研究所的陈云霁。刚才郭爱克老师已经非常深入浅出的给我们介绍了人类大脑的神奇和奥秘。我想,它最伟大的地方应该是具备非常强的智能。应该说,我们迄今已知的所有的事物里面,人类大脑是有最强的智能。过去我跟仇子龙老师、跟郭爱克老师都经常交流,包括跟郭爱克老师也经常合作,但是我的角度可能跟他们有所不同,我自己是做计算机科学的,因此我更多的是从计算机科学的角度来思考,跟郭老师类似的问题。我的问题是,怎么去借鉴人类的大脑,去制造出一个机器的大脑来。

    


借鉴人类大脑制造机器大脑这件事情,应该说是计算机整个科学皇冠上的明珠,也是所有计算机科学家都非常非常关注的问题。为什么这么说?因为我们看人平常都在干什么,我们每个普通人每天要做的这个事情,都在智能这个范畴内。包括我们去看去听去触摸,这些我们称为感知。也包括认知,比如说学习、记忆、语言、思维、问题解决,各种各样的范畴,人类的各种东西应该说都在智能的范畴。正是智能把我们人和万物区分开来。

    

如果有一天我们能制造出一个机器大脑,也具备通用的人工智能,那么这就意味着机器可以帮助我们每个普通人日常生活中碰到的各种各样的问题。比如说我比较头疼的一些问题,比如说扫地、洗碗、抹桌子,包括带孩子。尤其是带孩子,因为我今年过年前生了一对双胞胎,让我深刻的感受到带孩子真是太不容易了,尤其是我老婆,带得已经每天是昏天黑地,日夜不分了。这就使得我的科研的积极性得到了进一步的提升,我也觉得,应该多努力一点,尽早的去把这种有智能的机器给做出来,这样至少能够帮助我们解决带孩子的问题。这是其中的一个方面。

    

更长远一点来看,我个人感觉机器大脑的出现,可能会使得我们整个人类社会也发生巨大的变化,刚才郭老师最后说,有所发明有所创造,这是毛主席说的一句话,我记得他还说了一句,就是从必然王国走向自由王国,这是我们科大西区图书馆里的一句话。这句话对我印象很深,因为我觉得一旦机器的大脑能够构建出来,具备跟人类似的智能,那么每个人工作就不再是为了自己的生存和生活的需要去工作,因为这些为了生存生活去做的非常繁琐的体力性的事情或者简单脑力性的事情,都可以用机器来完成,那么我们每个人都可以把更多的精力聚焦在科学、艺术这些需要创造力的事情上,就会可以使得我们的科学、我们的社会,乃至我们人类本身,都可以得到巨大的进步和发展,能够迈上一个新的台阶。我相信这个台阶如此之重要,以至于可能会比从猿到人的这一次飞跃还要来得重要。

    

当然说了这么多,都是我们的未来愿景,现在我们能够参考的,其实最主要的还是人的大脑。刚才仇老师已经说了人的大脑里面有上千亿个神经元细胞,这就是我们人的大脑存在智能的物理上的根基和基础。这上千亿个神经元细胞联结在一起,它们的联结我们称为突触,这个突触可能有上百万亿个,甚至更多。


有的科学家就会想,人是通过神经元网络组成的这样一个架构,具备了这样的大脑之后,有了智能,机器能不能也这样?


1943年有两位科学家,一个叫McCulloch,一个叫Pitts,那个时候还没有计算机,我们都不能称他们是计算机科学家,只能说是数理逻辑学家,或者心理学家。他们就提出说,我们可以对人的大脑进行数字化的抽象,比如每个神经元我们抽象成数字,每个突触我们抽象成数字,这样数字组成的网络某种意义上就继承了我们人的大脑这种进行智能处理的能力,所以在这个图里面我们就是一个大致的抽象,从我们人的大脑到人工神经网络。

    


这个图里面是我们一个最简单的人工神经网络,它有多简单呢?只有一个人工神经元。底下虚的是一个生物的神经元细胞,上面覆盖的蓝色的这个东西是我们的人工神经元,它们之间有很大的区别,区别之大,可能就像是老鼠米老鼠之间的区别一样大。但是在某些基本的特征上,它还是集成了神经元细胞的特点,比如说它可以从外界得到输入,从X1到XN是一大堆输入,每个输入有自己的权重,可能是从W1到WN,那么当一个人工神经元把这些输入的信息进行汇总之后,再通过一个比如非线性激活函数决定了它怎么输出,然后通过突触再传递到下一个神经元,这就是人工神经网络工作的机理。

    


大家可能会说,这么简单的一个东西,到底有没有用?实际上还是非常有用的,比如说在这个图里面,一个最简单的人工神经网络,只有一个人工神经元,就可以完成一些分类的问题。比如说X1等于1、X2等于负1,这一类就可以分出来。可能大家不太接触人工智能,不知道分类这个东西,分类其实是人工智能里面一个非常关键非常核心的问题,比如说对面来了一个人,他是个好人还是坏人,他是男人还是女人,对面飞了一架飞机过来,是中国的飞机还是美国的飞机,对面走过来一个人,他是张三还是李四,这些都是分类问题。可见只要能把分类问题解决好,我们的人工神经网络就可以发挥很多的作用。

    

我们刚才讲的是一个人工神经元,如果有很多人工神经元在一起组成的东西是什么?实际上现在有一个非常流行的词,叫做深度学习,就是这种多层大规模的人工神经网络

    

2006年的时候,有三位科学家Geoffrey Hinton、Bengio、LeCun做出了一个非常划时代的工作,他们解决了深度神经网络,就是深度学习这种多层大规模神经网络训练的问题,一下子使得人工神经网络,特别是深度人工神经网络,能够解决非常多的实用的问题。我们可以看到,这些人工神经网络,深度人工神经网络,虽然层数很多,最开始的思路还是借鉴人类的大脑视皮层,人类大脑一般是六层神经元的结构,我们在设计的时候最开始也是五层六层,而现在可能已经有几百层、上千层的神经网络出现了。

    


现在这种深度学习神经网络已经可以做很多有意思的事情,比如说人脸识别,在一个叫做lfw基准测试集上面,深度学习已经可以达到99%以上的准确度。而我们找一堆成年人来看这个测试器,他们的识别准确度只能到97%多,这意味着机器在识别人脸,在特定的边界条件和光照条件下,甚至可以比人还要准。这个工作最早也是科大校友汤晓鸥同志做的。

    


另外还有语音识别,比如说语音输入法,或者说是苹果的Siri等等,这些背后都是在做语音识别。很多时候语音识别的机器也可以做得比人还要好。



另外一个例子大家都耳熟能详,就是AlphaGo,它是一个下棋的程序,它能够在围棋领域战胜人类的世界冠军。但是对我们人工智能研究者来说,可能远在AlphaGo这个围棋程序出来之前我们就在关注这个事情,因为大家也许知道做AlphaGo的这个团队是叫做DeepMind,2014年的时候被谷歌收购了,大概是四五亿个英镑收购的。


2014年的时候,很多人觉得谷歌是不是冤大头,居然这么高的价钱收购一个初创公司,事实证明,谷歌是非常有眼光的。为什么DeepMind当时会被收购?就是当时它基于深度学习提出了一个非常强大的框架,就是深度学习加增强学习这么一个框架,可以让机器,只要看着屏幕就可以学会打很多小游戏,比如说类似我们玩的小霸王学习机上的游戏,机器看着你玩,自己再玩一阵子就可以学会,而且还可以打破人类的世界纪录。

    

所以它把这套框架后来用到下围棋上,战胜人类围棋冠军也是意料之外情理之中的。而且DeepMind最近又把这套技术用在一个我们平时经常玩的游戏,叫做星际争霸上面。我本科的时候主要从事星际争霸这项工作,我可以稍微介绍一下。星际争霸是非常复杂的军事游戏,有多兵种协同,有科技树攀爬、经济运营等等这些东西。就是说,现代军事上的很多基本要素星际争霸已经都具备了。我们用深度学习和人工神经网络技术,在星际争霸这样的游戏里面,能够打败人类选手,就意味着机器可以在军事参谋上发挥非常核心作用。

    

刚才我们已经讲了,过去深度学习的前辈们已经做出了非常多非常厉害的工作,我们可以在很多领域做得跟人一样好,甚至比人还要好。但是这样的技术就完美了吗?事实上我们可以看到,这些技术离实用化还有很大的距离。

    

第一个例子,谷歌大脑,这是谷歌2012年做的工作,当时用了1.6万个CPU核,跑了接近一个星期去干一件事,就是让机器学会怎么识别猫脸。这么一件简单的事情,每个小朋友可能只要看半分钟甚至看几眼就可以学会的事情,机器学却要用1.6万个CPU核去学好多天。这充分的说明现在的芯片和现在的机器,处理人工智能的速度太有限了。

    

另外一个例子是AlphaGo,AlphaGo第一次跟李世石下棋时候用了多少机器?用了1000个CPU跟200多个GPU,下棋的时候平均每盘棋的电费大概接近3000美元。所以有人说,这是不公平的比赛,因为AlphaGo的功耗可能是几千瓦,而李世石每天吃两到三碗饭,可能功耗是二十瓦左右。虽然说这是个笑话,但某种意义上也说明了一个现实问题,就是现在的芯片在进行人工智能处理的时候,功耗也实在是太高了。

    

我们设想一下,现在的这些AlphaGo、谷歌大脑,它们的人工神经网络的规模,还不到人类大脑的千分之一,如果我们要把这样的工作,AlphaGo或者谷歌大脑,再扩大一千倍,才可能达到跟人脑相近或者相同的神经元突触的数量,那它需要多少电?可能需要一个水电站。可能每年的电费都要上亿人民币。这也就是为什么这么好的技术,为什么人工智能算法已经发展到当前这个程度,很多时候每个普通人还很难受益,为什么机器离人的大脑还有这么远的距离。在座可能都是唯物主义者,唯物主义者肯定知道,所有事物都要有一个物质载体,如果物质载体没有成熟,机器大脑的芯片没有造出来,那么人工智能也是很难和人媲美的。

    

其实我们可以从别的领域得到一些借鉴和启示,比如说图形处理,上个世纪九十年代我们装机攒电脑的时候,那时候并没有显卡这个东西,那时候反正都有CPU在算,但随着图形处理,比如打游戏、看片越来越重要,那么就有了GPU一类这样专门的芯片。


信号处理是类似的,就是我们手机里做的调制解调都是信号处理,最开始也是CPU做,但是随着这类东西重要性越来越高,可能就出现了DSP这样专门的一类芯片。随着智能时代的到来,人工智能的处理可能重要性会非常非常高,我们知道现在的芯片、现在的机器难以处理人工智能的应用,那么可能就会出现一类芯片,人工智能的芯片,或者说深度学习的处理器。


那么前期呢我们在国际上研制了第一个深度学习处理器的这样一个芯片,当然为什么我们能做出这样的工作,其中一个很重要的原因是因为我的父母,不是别的原因,是因为他们超生了,我还有一个弟弟。我跟我弟弟都是中科大少年班毕业的,但是我们后来做的事情不太一样,我是做芯片的,本科开始起做芯片,而他从本科毕业起做人工智能的算法。2008年开始我们想合作一下,没有别的事情可以做了,只能把芯片和人工智能结合一下。这样一个机缘巧合使得我们做的工作比别人稍微早一些。


这是我们做的第一个深度学习处理器的架构的layout, 最开始我们想起一个英文名字,电子的大脑或者机器的大脑,这样起个英文名字叫machine brain, electric brain之类的,但是我们当时组里有一个法国合作者,叫Olivier Temam,他给我们提了一个建议,他说你们还是起一个中文名字比较好,因为对外国人来说也是一个外国的东西,大家会觉得外国的东西很新鲜。所以我们就起了这样一个名字,DianNao。就是汉语拼音的名字。这样一个工作,它可以用CPU大概十分之一的面积和功耗,达到百倍以上的性能。


我们2013、2014年做的这个工作之后,到了2016年,大概两年以后我们看到国际计算机提交年会上,大概有六分之一的工作在引用和跟踪我们前面的成果,包括像哈佛、斯坦福、MIT、伯克利、哥伦比亚,UCSB,UCLA或者因特尔、惠普、MIT、谷歌等等,这我就不报菜名了。更有意思的是这样的,大家看了我们的标题之后觉得特别有意思,叫做DianNao。所以美国计算机学会通讯上面,还有一个伯克利教授专门写了一篇文章,给大家介绍这个汉语拼音的意思。

    

因为时间有限,我不能讲太多的细节上的东西,我这里就讲一个背后的最主要的科学问题,就是我们怎么用有限规模的硬件,能够去支持任意规模的算法。因为我们知道,刚才已经讲了,人的大脑里面是千亿个神经元,百万亿个突触,而且算法只要愿意,可以写得更大,甚至写一亿亿个神经元和突触,它都可以写。但是我们知道芯片的规模永远是有限的,也就是指甲盖这么一个亮晶晶的东西,不可能你想让它多大就多大,毕竟是有物理上的限制。正是这个原因使得过去没有人做出一个芯片能够快速的把深度学习的非常大的算法处理了。

    

面对这个,我们有一个非常简单的思路,说白了就是时分复用的思想,比如我们要处理一个非常大的东西,整个大的网络都是我们要处理的,而我们的硬件又非常小,只有小框框这个大,那么我们又可以用虚拟化的方法,把一个大的人工神经元网络切成很多小块,每一个时刻用硬件我们只处理其中一个小块,下一个时刻我们再换一个小块处理,通过这样的时分复用的方式,类似于蚂蚁搬大米的形式,虽然有很多很多大米,但是蚂蚁一次一次搬,最后一定能搬完。这是我们主要技术上的一个创新。当然,时间有限,我们还有很多内容,这里就不多说了。这是我们过去的芯片的照片。

    

还有一分钟时间,我简单说一下我们未来的梦想。我们最大的梦想是说,希望能够把各种各样代表智能的算法,处理速度和需要花的能量,处理速度提高一万倍,所花的能量降低一万倍。为什么我们希望是一万倍?我们说谷歌大脑是1.6万个CPU核,如果能够做一万倍的提升,就意味着我们就可以把谷歌大脑或者AlphaGo这样的东西能够放到我们手机里,这样手机不但可以本地实时的理解,去看去听去感受这个世界,能够帮助我们去做各种各样的事情,能够理解我们说的话,能够理解我们的视频,更重要它还具备本地实时训练和学习的能力,它可以不间断的观察人、社会的自然现象,它跟着我们,看到人怎么做就知道怎么做,看到我们碰到什么事情会怎么处理,看到自然界碰到什么事情自然界会有什么样的反应。通过长期的不断观察和学习,我相信它有可能真正会集齐强大的智能。

    

谢谢大家。


  

墨子沙龙

一起分享科学世界的点滴

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存