查看原文
其他

锵锵三人行2017/5/22|AlphaGo下围棋已无敌 但干别的还不行

2017-07-05 三人行锵锵

《AlphaGo下围棋已无敌 但干别的还不行》音频资源

许子东,上海人,现任香港岭南大学中文系教授。华东师范大学中文系文学硕士,美国加州大学洛杉矶分校(UCLA)东亚语言文化系文学硕士,香港大学中文学系哲学博士。历任华东师范大学副教授,中国文艺理论研究会理事,中国当代文学研究会理事。主要研究领域为郁达夫研究、张爱玲研究、"文革"小说研究等。2000年起担任凤凰卫视《锵锵三人行》节目嘉宾。

杨强,香港科技大学教授,主要研究领域为机器学习、数据挖掘和自动规划。

窦文涛,香港凤凰卫视的主持人。出生于河北省石家庄市,1996年加入凤凰卫视。1998年推出闲谈节目《锵锵三人行》。

《AlphaGo下围棋已无敌 但干别的还不行》文字版

窦文涛:《锵锵三人行》今天咱们找来一个人工智能。

许子东:虚拟,虚拟教授。

窦文涛:杨老师我觉得。

杨强:真人。

窦文涛:真人,我觉得你天生就是干这行的。

杨强:真的吗?

窦文涛:我觉得你这个面相骨骼清奇,你没觉得吗,他就有点像一个机器人。

许子东:今天我是假的,我是假的。

窦文涛:他是真的权威了,香港科技大学的,上次是谁,江铸九九段,我们那个时候聊的还是AlphaGo下棋下过了李世石。

杨强:那个是很惊人的一个事件。

窦文涛:对,那个时候杨老师就来帮我们来解释,跟我们科普,但是今天照杨老师的意思,围棋这事就甭聊了,太简单了。

许子东:是吗。

窦文涛:对,所以柯洁就已经说抱着什么必胜的决心然后准备必死的状态。

许子东:到乌镇去比赛嘛要。

窦文涛:对对对,但他就说我抱着必胜的决心必死的状态大概是,就肯定下不过。

杨强:对,最近AlphaGo又有了惊人的进步,它从人喂他很多数据,到自己产生了很多自我的数据,这样的话它据说现在可以让去年AlphaGo四个子它还能赢。

窦文涛:天呐,你明白吗就是原来是学别人下棋就储存了别人的棋谱。

许子东:对对对。

窦文涛:现在能够自出,自出一个绝招,你说这家伙这意味着它什么呢?有灵感了吗?

杨强:这个不是意味着它有灵感,意味着它更聪明,就是比方说我们说一个孩子能考试,他原来能考的是八十分,现在能考到九十九分,只不过是说它考试这一行它已经没有人能超过它了,但是你说这个孩子如果只能考试的话,在别的领域它能不能干,它还不行。

窦文涛:现在我们家亲戚的小孩在外国留学什么的问我,你看我已经开始有这个意识了,说学什么呢?我就说看看在人工智能方面机器人这方面他有没有什么兴趣,我现在认识的很多搞投资的这些大咖,我说你们都投什么,很多人都跟我谈说机器人。所以你知道许老师,机器人到什么程度,咱们可以随便看看,我给你看一段就是说波士顿研究出来一个机器人跑的已经跟狗一样快了,而且你可以看看挺好玩,就是但是它摔倒它自己会起来,而且它能听懂语言,能够好像还能猜谜语什么的,你看上楼梯,现在我在有的视频上看到这个仓库里用很多机器人就搬东西包括能旋转,你看跑的,跑的像英国的赛马一样,这怎么跟狗似的。

杨强:对,它是通过一个机械的进化,然后不断的在错误当中学习怎么正确的站起来跑,然后这也是一种学习系统,所以。

窦文涛:机器从错误中学习。

许子东:就是说不是人工去矫正它的程序,是它自己。

杨强:自我学习自我进化,然后学会如何走的更好,它可以从自己的错误当中逐渐的演化演化成今天这个样子。

窦文涛:你能听懂吗?

许子东:我觉得这可以推广到中小学教育,我们的教育不就想要做这个事情吗,就小学生犯了一个错对不对,他最好不是靠爸爸妈妈打的教训的你提着耳朵,而是说他自己知道怎么样下次不这么做。

窦文涛:我现在能够假想到,他今天在这儿绊倒了摔倒了,他下次机器应该可以做到不会犯同样的错误,下次再碰到同样这个杯子的时候他知道抬脚了,但是呢再下一步他能不能举一反三,咱们就是说咱人的智慧表现在说,我今天许老师骗了我,那么下一次连杨强你都骗不了我,这是不是但机器人目前是不是只能做到,许老师说这句谎话骗了我一次,二次再说不能再骗我。

杨强:这有一个科学名词,我说文涛你非常厉害。

窦文涛:真的。

杨强:对,这个领域叫迁移学习,什么意思呢?就是说我从这儿学到的东西我可以换一个领域也可以工作,我数学学好了我学物理容易了,我学自行车学好了我学摩托车容易了。

窦文涛:触类旁通。

杨强:触类旁通,这个是人类智慧的一个最高表现,现在机器应该说还不会做这一点。

窦文涛:但是你不是说现在在香港科大他的实验室里,他的方向就是迁移学习。

杨强:是,我们现在有很少一批人工智能的人正在研究迁移学习,能够让机器比方说AlphaGo只会下围棋,能不能让他学会了围棋以后又会下象棋又会下跳棋,能不能把学围棋的知识用在科研上,用在商业上,这个是机器学习人工智能下一步要做的事。

窦文涛:这可能吗?

杨强:这是完全可能的,我们现在做一些实验比方说我们教计算机去读一些文章,他读会了以后他可以去识别图像就变的更简单了,这个就是迁移学习的一个表现。

许子东:我一直在盼望着AlphaGo这么聪明,能够转到帮助人类解决巨大,比方说怎么样跟金正恩打交道这样对不对,这些东西能用上吗,能用上国防军事决策这方面吗?

杨强:完全可以用的。

许子东:他不是分析很多很多嘛,他可以把无数的可能性都归纳下来对不对。

杨强:对,归纳这个词用的好,其实归纳是一个数学的过程,包括我们看了很多例子,我们怎么能够在大脑里面表现出一个概念,能够把这些例子给总结抽象出来,这个能力是也是人工智能在努力的一个方向。比方说现在说的深度学习,就是它看了一个图像他通过一层一层的不断的转换最后形成一个概念,那个概念就是我们所说的语意,说这个图像的意思,它就学会了。

窦文涛:你现在还在控制中吗,就是你知道我想问你一个什么问题呢,就是说如果像我们这个文科生,研究研究研究某一天突然会产生有点恐惧感,你现在觉得你的那个对象,你的那个电脑它的反应是不是还全在你的预料和控制之中,没有出现什么你觉得惊奇或者我没想到它会这么回答。

杨强:其实对这个答案是Yes or No,大部分的时间都是在我们控制之下,但是现在做的这个模型已经有所谓的黑箱的感觉了,就是你不知道它里面是怎么运作的,但是它是很复杂,你可以设计它,它在经过了几千几万轮的演化之后,它可以很神奇的作出一些让你都感到惊奇的一些地方。

窦文涛:比如说。

杨强:比如说谷歌的科学家现在能够让计算机的模型自动去画画,它画出的一些画都是很匪夷所思的,让人觉得好像是印象派的画。

许子东:以前没教过它的。

杨强:以前没教过的,它自己达到一个印象派的一个效果。

窦文涛:它懂美吗?

杨强:应该说你教它的这些画已经在告诉它什么是美的正例,它就从里面学出无数的模式来把这些模式加以总结归纳,然后最后它可以把这个反转过来用来产生一些新的例子,就是我们所说的这个画家的灵感。

许子东:我觉得画家要机器画毕加索比较容易,它乱画就是毕加索,要它画伦勃朗才比较难,它能画那些比较写实的就是那种很逼真的那种东西吗?

杨强:其实是可以的,其实。

许子东:但这个要事先给它是不是。

窦文涛:我觉得它画毕加索才难呢,我觉得它画写实的太容易了,因为当然我也是外行,因为我知道它现在你看图像识别技术突飞猛进,现在是基本上听说是不是就是说比如说丁义珍要外逃的话,现在全世界所有的摄像头就一下,只要他走在旧金山一条街上,假如能实现联网的话,实际上这个公安的摄像头是能把这个人的脸给找出来的。

杨强:是可以的,从理论上可以,而且现在现实已经很接近这种理论极限了,我们涛哥你在大街上走,肯定能把你抓出来。

窦文涛:卓伟肯定失业。许老师,你这个文学的对人工智能。

许子东:我觉得天天在跟机器人打交道,我花很多的时间,因为我找不到牌友,所以我现在只在网上打桥牌,所以人一不够机器人就替代了,有时候给它气死,有时候活活气死,因为它都是照一套规则来的,打牌的时候我跟我的partner我们是有一套心有灵犀的感觉的,而机器人你一感觉好了它乱了,它给你乱来,明明已经叫的很好别动别动它,我叫到四K清好了,它不跳出来一个六K清,我真的给它活活气死,我把iPad要砸了一下,砸坏了是我自己的损失。

窦文涛:但是赢是谁赢呢?

许子东:总归是它赢,因为它是机器人嘛,它是逻辑推算出来的,我们会犯错它不犯错,所以赢是赢不过它的。

杨强:所以话说回来我们说AlphaGo是不是我们应该害怕说机器比人强这么多在围棋上在打牌上我觉得不应该,我觉得人还是要追求那个乐趣,那个乐趣才是我们真正我们两个人在下棋我们两个人就更加了解对方,这个是打牌下棋。

窦文涛:但是我最近看见有一次演讲,似乎连这个乐趣您也想在机器身上去实现,你看他演讲出了几个图片我想请他讲讲,你看他这个您当时在演讲中为什么出这个,你知道吧这是后边是奥巴马。

杨强:对。

窦文涛:这是有一个政治人物在是谁在量体重。

杨强:是一个英国首相。

窦文涛:量体重,你看奥巴马给他开玩笑,奥巴马在后边踩着这个体重仪给他加重,你看当时为什么用这个图片。

杨强:这图片表示一种幽默,对不对,大家都在笑,大家觉得这是很可笑的一个事,但是今天计算机笑不出来,因为计算机不懂什么叫幽默,我们从来没有教过它,所以要懂这个幽默要学很多的常识,所以我这个就想体现说虽然计算机今天能做很牛的事,但是它没有常识,它没有我们所说的common sense,没有常识它就有很多东西不能理解,像幽默它就没有。

窦文涛:它将来能不能有呢?

杨强:将来现在其实有同学在研究,有同学把推特上面的二十万个这种有趣的东西拿过来做训练,让机器自动的能识别一个推特或者一个微博是不是有趣,他可以从这个表象上去理解,但是我觉得到现在我们还没有发现出一种算法能让它真正的由衷的感到这是幽默,感到这个人牛这个东西有意思,到那一天我们是需要什么呢?我们是需要对它的背景知识有深入的了解,我们是知道什么东西是好玩是幽默,是幽默是一种非常智慧的表现。

窦文涛:我甚至还听您说过几个探讨过一个问题,就是说机器人会不会做梦。

杨强:对。

窦文涛:有可能吗?

杨强:有可能。

窦文涛:它为什么要做梦呢?

杨强:因为是这样,我们什么叫做梦呢?做梦就是说我们在失去意识的情况下,我们大脑里面还有一些活动,残存的活动,这些活动是由我们所谓的日有所见日有所思这样的话。

窦文涛:夜有所梦。

杨强:夜有所梦,这个梦境是我们白天看到的一些东西的反应,所以机器人在训练了,在它看了很多数据以后那个模型里面也会有一种内在的反应,你给它通电的话它也会有一些反应,你可以把它描绘出来,所以谷歌的科学家就做了这么一件事,就让它描绘出它看了几千万张画以后能够想出什么画来,让它随便的画结果画出一些很恐怖的画来。

窦文涛:那是噩梦,机器人的噩梦。

许子东:人类的噩梦就是机器人有一天比人更聪明,这西部世界就是这样,就好像是很多很多。

窦文涛:他也爱看西部世界,你这专家你看西部世界,是什么观感呢?

杨强:对,我觉得是这样,它很靠谱。

窦文涛:很靠谱。

杨强:对,就是说人和机器其实差别不大,人也可以看成是一种机器只不过是很复杂的机器,这是第一种观点,第二种观点是机器人它之所以智慧,之所以我们看 47 32617 47 15533 0 0 2064 0 0:00:15 0:00:07 0:00:08 3590不出来,比方说西部世界我们认不出来哪个是人哪个是机器,除非你给他一枪对不对,为什么呢?因为它有学习的能力,它不断的在学习,它当然西部世界体现的是它在痛苦当中学习,因为人类赋予它很多的痛苦,最后逼着它自己产生氧化,产生智能,产生意识,就好像在迷宫里面找最后的那个终点一样的,所以我们所说的机器学习也是给它不断的刺激不断的学习。

窦文涛:但是它最终能学习到觉得自己可悲吗?

杨强:我觉得完全有可能的。

窦文涛:我的天呐,真的吗?

杨强:但是今天的算法还达不到那一点,今天的算法是我们要把两个词分开,一个是聪明一个是智慧,聪明就是像我们说的小学生做题,他这个题目做的越来越好,分数越来越高,但是智慧就不一样智慧是说它具有常识,具有意识具有自我反应,它能够反应自己的存在,能够反思自己的存在。

许子东:智慧就知识里边还有感情的成分。

杨强:有感情的成分,有自我存在的成分,比方说你把一个猫放在镜子前面,它不认为对方是它自己,它认为是另外一只猫,这就说明它不智慧,说明它没有意识。

窦文涛:但是你知道有的时候你认为很复杂的感情本质上是不是也是一套自我生存的算法,这是一个问题,你比方说我看一个科幻电影,那个里边就讲那个故事就等于是不是太空漫游我忘了,就等于飞向远方的一个宇宙飞船,已经达到了全部有一个电脑智能控制,控制一切,可是后来有两个人的宇航员觉得它是不是出了什么毛病了,出了什么毛病,然后这俩人的宇航员就是说咱别让他听见,关在一个玻璃的一个什么舱里咱们议论议论要不要把它关了,但是没想到它能读唇语,它知道你们要把它给关了,所以这个宇航员具体情节我忘了,大概就是出去修理的时候,它把门就关了不让你回来了,某种程度上这是逻辑的,因为它觉得你要把我关掉,所以你看它的这个算法干掉你这个宇航员也在逻辑里面。

杨强:对的,这个就是说我们在人工智能这个科学里面我们叫做优化函数,如果我们把这个优化函数定到那个水平,就是它不但要完成它的一些任务,而且它要保证自我存在不被干扰,就是一个自卫的能力,如果赋予它这么高的一个自我存在的能力,它确实它应该能够去保护它自己,作为它第一条件。

许子东:所以电脑就是真正的精致的利己主义者,它是通过一系列的计算它的目的是对它有利对不对,其实它是合理的,但人类常常不那么精致的,人会犯错误对不对,人允许自己犯错误,人不可能都是什么东西都非常好非常好,不行。

  杨强:这个说的非常对,这个我觉得也是西部世界里面我们得到的一个感觉,就是人的存在并不是在极度优化某一个函数,我们不是为一个单一的目标存在,我们人的存在是因为我们存在具有乐趣,我们存在是因为我们比周边稍微好一点,我们其实没有必要把我们自己变成一个极致的机器,我们只要能够存在,能够survive,我们就可以了,我们每一天喜欢喝茶,喜欢打球,喜欢看电影这对我们已经是很好了,但是机器是另外一位,机器是一定要有一个目标,然后它要把这个目标推到极致。



窦文涛:你看这要是我说吧,他们就一说文科生不要胡说这个,我所以我就问问你,你是专家你展望未来你认为这个人工智能会到达咱们想像的像西部世界那样很,你讲的这个优化函数是不是就有点像西部世界里那个黑人的那个女的,到最后她拿着个iPad说我把我的提升到最高智能,那就比人聪明太一万倍了,奴役人了,你指的就是实际上是可能的。

杨强:但是我们现在还不知道这个有没有一个终极的优化函数,它可以包罗万象,因为现在我们能做到的优化函数只是单纬的,但是人能够优化的。

许子东:多纬的多方向的。

杨强:人是多纬的,而且这个纬数到现在都不知道它有没有边。

窦文涛:对,所以我现在看到呢,他们这个一些专家就是好像真研究这个的人他们一般好像态度还挺乐观大多数就是说它不会失控就或者最后什么奴役人类,说这些都是不可能的,你怎么看?

杨强:我觉得我是同意这个观点的,我觉得至少是沿着现在这个研究方向,根据我们现在的研究的水平,是不可能达到那一点的,所以我们现在没有去恐惧的原因。

窦文涛:你知道还有一个我觉得杨老师可以给讲讲,我注意到你讲的里边,就是许老师你说咱们原来说人的意识,人如何做到不死有一个办法,就是把你的意识存在一个硬碟里,上次我们讲了他们就说你们文科生,所以我发现理科生你也不要傲慢,因为他有时候说我胡说,我真不知道我有时候简直是背诵的我看的科学书的原话,他们为什么也说文科生你不要胡说,我就是说这个事杨老师就是说,他现在好像找到这个关节点是真的能把你的意识存在电脑里的,是这意思吗?

杨强:现在有人是这样说的,就是说这样就可以不用去西天取经了,你可以长生不老了。

窦文涛:对,就是大脑的神经源之间,比如说你想起一个事情,总之是这个神经源之间的突触的连接,我看您演讲里边是不是提到这个内容。

杨强:提到这个内容,这个大脑是一个非常复杂的宇宙,这个里面它的总的神经源的个数相当于银河系恒星的总数。

窦文涛:一千亿。

杨强:在大脑里面,它是靠神经源和神经源之间的连接,就像星球和星球之间的连接来做记忆来做计算的,这种连接就更多了,有十四次方这么多,我们想一下假设有一天有一个能力能够把所有的这些信息全都上传,从理论上来说这是可能的,但是呢从现实当中来说我们还看不到这一天。

窦文涛:还看不到,现在我不明白就是说现在人机互联,最关键的地方就是你这个机器和这个生物的神经它这怎么就连,我这有点想像不出来,或者就能读取我脑子里的信息。

杨强:对,现在读取这个事在大脑神经学里面已经可以做到了,比方说之前他们是拿一个探针探到连接里面去,就把你这个连接的强弱给读出来,但是在过去的这个做法就破坏了这个连接,也就是说这个假设我来做你的实验,你就变的越来越傻了,我们不希望看到这个事,所以今天他们就发明了一种用激光去读,这样就无损于连接。

许子东:读出来是什么呢?能复原他原来想说的吗?

杨强:没有,它读出来是一个单一的一个bit,就是一和零这样的一个观念。

窦文涛:它不是想法,它读出来不是。

杨强:还完全不是想法,所以它读出这么一纬来,你想和十的十四次方这么多纬,那是千差万别的。

许子东:窦文涛脑子里读出来可能跟毛泽东脑子里读出来差不多。

窦文涛:你说现在所谓的像有些人机互联最简单的就是那个残疾人。

杨强:人机互联。

窦文涛:意念就能驱动这个假肢了。

杨强:对,它是有很多我们人在想东西的时候,我们的脑电波会有变化,如果我们戴一个特殊的装置,我们会把这个脑电波的变化。

许子东:先简单的手抬起。

杨强:简单的变化给它读出来,这样的话我们在想东西的时候只要我们去读那一个部位的变化,如果很敏感的话,我们就可以去控制机器手了,但是这种脑电波的读取现在是非常非常不准。

窦文涛:不准。

杨强:里面有很多噪音。

窦文涛:要是聊天呢,就你比如siri,你跟siri,我都能感觉到siri再变得聪明一点但还是比较脑残,就是你觉得你跟智能聊天它能聊到一个什么程度。

杨强:现在我们熟悉的有siri,有小冰,小度什么这些,大部分的都是这种闲聊,所谓闲聊就是它拿了很多很多微博还有这种网络的这种数据来做训练,它就会学会一个网络语言,所以它只能闲扯它不能为你。

许子东:知识性的可以,附近有什么电影院之类的。

杨强:对,知识性的它就一问一答这种还比较靠谱。

窦文涛:人格性没有形成。

杨强:但是在,对人格或者甚至再复杂一点的就非常难。

点击"阅读原文

【可下载节目音频】

提取密码:qc19

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存