王小川:机器人不会有生存意识
王小川,搜狗公司CEO,前搜狐高级副总裁、首席技术官。
活动:2016.年4月16日 “ WARE 2016 新硬件生态大会” 深圳湾主办 ,笔记侠作为战略媒体合作方,经活动方与嘉宾授权发布完整笔记。
笔记:笔记侠 张倩 深度好文 5454 字 | 5分钟阅读
全网首发 · 完整笔记
今天的主题是“新硬件生态”。
我们总是提一个词——智能硬件,其实每次提到这个词我反而会焦虑,如果没有想明白这个词的真正含义,可能就会带来很多风险。就像很多公司做一个技术,对这个技术能做什么、不能做什么没有判断,要么产生恐惧感,要么产生盲目膜拜,不知道有什么意义,这样投资或做事可能就偏了。
当我们回到“新硬件”这个词时,反而给我留下了一定的空间去诠释:什么是智能?
今年从3月8号开始的一周时间内,AlphaGo与李世石,即人跟最顶尖的科技公司进行了一场较量。Google赛前一发布我就兴奋了,因为两年前我就看到了他们生物科学的发展,我跟清华的同事和实验室都提到了这个想法,但是没有提下围棋这件事情,因为这件事情太难了。
没有参与这件事挺可悲的,有很多朋友说:“你怎么对这件事这么积极?”即使没有参与,围观总是可以的。所以我2月份就在知乎上写文章,说Google会有围棋的人机对战。我发现赛前大部分人看好AlphaGo,但也有人不看好,比如围棋选手,尤其是参加世界大赛拿到9段的选手,包括聂卫平。
我在五局棋里面参加了两局,我对围棋理解有所不同,虽然知道规则,但根本没有办法判断这个局面好不好,所以下棋比赛当中只看一件事情我就知道这个比赛人是否会赢;看教练的脸色,脸色越难看,机器胜算越大,教练最后崩溃了,机器就赢了。
我们似乎面临着一些威胁,曾经擅长的思考能力开始被机器入侵。对一个围棋选手而言,一个机器替代你的成功和你引以为豪的东西时,这是一种什么恐惧?我们可能都会有这种压力,以后大家可能多少会经历一点,包括腾讯也已经在开始改BUG了。
这个比赛前,很多互联网的代表人物,甚至有技术代表的人,都认为人会赢,机器赢不了,我们一一去问公司十几个人,百分之八、九十的人都认为未来机器会赢,只是这次人会赢,他们认为下围棋有区别,觉得以后机器没有问题,但是现在时机还不成熟。
很不幸,最后机器确实战胜了人,我们当时说这不够情怀,即便做科技的人也没有想到会这么突然。
但我们不要有恐惧或有浪漫性的关怀,要了解它到底能做什么、不能做什么,这对我们的生活态度和工作有帮助。如果把重点放在人类自身的提升,而非怎么利用它赚钱,我们对机器的了解可能就会更加长远。
深度学习不是新玩意儿
大家有没有听过“深度学习”这个词?大部分应该都听过,因为这个词就像AlphaGo一样,讲到了一个特别神秘的概念:机器的深度学习或者智能。
深度学习讲的是两个概念:
第一个概念是机器学里用神经语言模拟人脑的语言模型做训练或者机器的识别,就是把你的输入变成向量,中间经过迭代做到结果;
第二是迭代的网络结果很深,不是一层可以做到的,需要多层。
后来研究人员不断提升这样的模型。这个概念很早就提出来了,1985年这个理论就已经趋于成熟了,它属于反向传播,机器开始进行训练的时候这个就已经有了。有了这个机器之后还有一个问题:计算量太大,做不到。当时十几个结点机器就已经不够用了,但是现在变化最大的不是理论体系,而是计算力的提升。
这也告诉大家:
从人工智能到理论深度学习的做法,包括之前这些机器的理解能力已经慢慢成熟,今天我们用的方法没有超过当年理论的框架和计算模式,这不是一个新东西。
AlphaGo的胜利是计算力和数据的胜利
发生了什么变化呢?有两件事情:
第一件事情是计算力的极大提升,AlphaGo的机器计算力是深蓝的2.5万倍;
第二件事情是我们采集了大量数据,数据采集比较困难,现在有大数据。
数据有多大?
其实下围棋没有多大,基本上数据用了30万份曾经的围棋棋谱做训练,没有互联网的时候不敢想,有了互联网之后,国外下围棋的网站上就已经有了对应的数据。30万台,每一台大概100步,所以一共做了3000万步棋的训练。
怎么把这个理论用来下围棋?这是Google的创新:
1、利用CNN网络,用点看图的方法来下棋;
以前棋子是逻辑分析,而不是网络,现在可以像看照片一样看棋盘,所以机器有了棋感。最近五年最大的提升就是人脸识别,以前完全不知道这是怎样的事情,识别眉毛吗?还是识别眼睛?写程序的人可能会想,要用什么规则去描述人的脸,但是今天用CNN图像的感觉做到了。所以Google第一个创新是用CNN网络对机器进行描述,使得机器有了体感。
2、把跟深蓝相关的搜索作为理性方式,与CNN的感性进行结合,这是第二件创新;
3、用强大的学习,让机器跟自己下棋;
当机器变得聪明之后自己可以跟自己下,在这里进行提升。这里并没有带来理论界的突破,但在创新应用里做了很大贡献,所以AlphaGo的胜利背后融合了工程师的重新能力。
AlphaGo的胜利:寻求人和机器的关系
这件事情真正重要的点是什么?不是技术本身,而是所有人都在关心自己的定位。
我把这一周活动比拟成几十年文艺复兴的结果,这个星期让我恍如隔世。
人和人的关系,包括看《圣经》的时候,会发现人和人平等了,距离拉近了。现在怎么看这台机器?比赛之前大家都认为机器比较笨,什么都干不了,比赛之后发生了两个重要变化:
a.对机器的能力有了更高评价;
b.机器可以战胜人了。
看病的时候拍个片子,机器会告诉你,你做的诊断没有什么病,但我们还是难以接受,不相信它,现在机器告诉你一个结果,我们可能会觉得这比人还要准。
谁能想到这个变化呢?
机器因为这一事件之后,人们对它的能力有了一个巨大的认可。这使得更多工程师、更多创业公司、更多资本投向人工智能。开个玩笑:我觉得A股人工智能的概念可能会延续好几个涨停板,因为我们看到了人工智能的信仰。
但AlphaGo不是五局都胜利,它输了一局,只是大家还转不过劲来,AlphaGo的胜利代表了整个围棋界的共同胜利,即机器变成了另外的门派,我们还是保持着自己的尊严。
我想起了二十年前的电影《独立日》,当时人类飞行员面对着太空船的时候,选择把飞船开进去再进行破坏,所以面对机器我们还有尊严。
很多年轻人开始称AlphaGo为狗狗,90后或00后会跟机器人成为朋友,还有人叫机器人为老师。
其实机器还没有到不可战胜的时候,我们第一要相信它,第二要接受它,拒绝它很难,所以我们要接受它。
这是整理人机大战的关键,到底我们怎么用?怎么跟它交朋友?这场启蒙运动很重要。
技术进步的三个层次
1、把规则交给机器
举个例子:我们做一个电饭锅、智能冰箱,用来做什么?程序员要写程序,当温度到103度的时候就会跳闸。
我们可以把足够复杂的东西交给机器,把人类的智慧交给机器,很不幸的时候,如果老师把规则教给学生,学生的能力就会下降,所以这时候机器比人落后,智力少于人;还有一种情况,我们自己都不知道规则是什么,一直在用感觉,就像人脸识别,这是一个非常经典的问题。每个人都觉得很简单,可能脸盲会吃力一点,但是大部分没有问题,不像大家学外语这么难,只是可能记忆力不好,识别没有问题。
把这个问题给机器的时候我们遇到了障碍,在图像识别方面我们有几十年的时间都是举步维艰的,国外曾经把这种数据分大类,每年进展都非常缓慢,搞图像的人基本上找不到工作,因为不实用。
很长时间里人工智能跟理论是脱节的。我们前几年跟清华做人工智能的院士聊,说人工智能但凡跟实践结合,就会拉低水平,因为连接不上。但现在不是,现在连接到一块了,为什么呢?因为我们到了第二个阶段,我们开始不用跟机器讲规则了。
2、将答案交给机器记忆学习
深度学习的美妙之处是我们可以把问题和答案对应的交给机器,告诉他这是张三的脸,那个脸是李四的,不用告诉机器为什么是张三或者李四。机器通过大量的数据训练就能够学会。
就像我们教小孩一样,通过这些方法一步一步展开,而在这里我们一并给到机器,现在图像和声音的领域已经发展得非常好了。
去年开始图像人脸识别机器超过了人,准确率超过了人一倍。我们可以告诉机器答案,机器可以自己学习,这还不够,有一些问题我们甚至连答案都还解答不够。围棋有3000万步答案,机器学会了下棋的基本规则,把6段到9段的方法告诉它,它就达到了6段水平,后来Google让两个机器随机下,下完之后不告诉你赢了还是输了,机器还是能够通过自己优化算法找到更好的答案。
3、将目标给机器人自我学习
第二件事情是把答案给机器,第三件是给机器一个答案,再评价答案是好或者不好,这是三个层次的进度。
特别是第三件事情,像Google团队或者微软顶级的人里面,可能会有宗教色彩,当我们给机器一个目标,机器是否会自己找到规则和答案?我只给他目标,而不是告诉他怎么做,这是演进中很重要的一步。
我看到一个文献,他们想重新训练一台Alpha Go的机器,一开始不是让它学习人怎么下棋,而是让两张白纸似的AlphaGo自己跟自己下,只告诉它目标是赢棋、输棋,看能不能训练出新的棋手。
我觉得这件事情很有意义:就像一个人在中原学会了所有武功,把它融汇贯通,然后再进行提高;另外一个人从来没有来过地球和中原,却要学武功,你说它的武功跟人会一样吗?这是人类所好奇的,看看重新开始会出现什么智慧。
这是三个层次做的事情。
人工智能会取代哪些职业
基于刚才三个层次,我们来想,什么样的职业、什么样人的工作更容易被取代?我们可以看作是机会,也可以看作是对自身的挑战。容易取代的有两点:
1、工作和环境封闭,提供标准化的答案;
这意味着做决策的时候,决策来源的信息是封闭的、有限的甚至是结构化的。比如下围棋这件事情的决策就很封闭,只需要知道棋盘上的规定就可以下决定;医生则会难很多,因为医生要知道病人的病史和当前状态;作为一个老师可能会面临更复杂的环境,做决策的时候信息来源要足够开放,不然你的答案越标准,就越容易被机器取代。
2、目标,认知边界的宽广度
从这一点可以知道,有的决策信息需要,少量机器就可以做,信息需要的机器也能做。要做好一个翻译或者一个作家,就需要很多生活阅历,作家就是读万卷书、行万里路的做法,如此开放的环境对机器是一个很大的挑战;反过来,如果这个开放答案跟你有关,机器就越容易做到。这就是机器是否能做好、人是否会被取代的一个标准。
人类是否会被取代?
1、机器人不会有生存意识
回到人是否会被取代的问题。人的概念是什么?
人的目标是为了自己的生存或者繁衍,机器就更简单了:做诊断,下一个棋,或者做一个语言识别。
人的扩展空间已经很大了,而机器只是在局限的空间里工作,主要看机器的训练空间多大,算法再好也不能脱离目标和机器适应的范围,所以今天的技术还远不到这一步。另外,我们不会特意造一台机器去设定它的目标是应该怎么生存,也不会说它适应环境需要有特别大的空间,即便有能力,我们也没有动力去制造一个能取代人的机器,我们不认为机器自己会演化出一种生存能力。
反过来,如果有野心勃勃的科学家要创造一个智能机器,这个机器面对整个地球环境可以有生存的概念,这其实不是在做人工智能,是在创造一种生命。所以大家要想清楚这个概念:
如果你秉持着创造生命的态度去做,机器就可能会有一种生命意识,知道自己的存在。
今天我们的做法大可以放心,我们做这些事情的目标足够简单。比如AlphaGo,如果把棋盘从19×19变成20×20,人类可以理解和学习,但环境变了,AlphaGo就变得什么都不会了。
2、想象力是目前的机器取代不了的
另外一个问题是想象力,这是人和动物的区别。有一本书叫《人类简史》,历史的发展是相关的,这也是一个路径。
这是我认为人类不会被取代的两个核心判断标准。
人工智能与人的融合
人工智能和人是怎样的关系呢?
技术可能让我们变得更强大,但技术也有可能让我们变得更弱。
很多人都戴着眼镜,眼镜是一种技术,当用了眼镜之后视力变得更好、更强大,但是离开眼镜就会变得更弱。我们要抛离技术之后再看自己行不行,放下手机、pad、汽车交通工具会不会变强?不会,只会变弱。
我们由于机器变得弱化,我们掌握了能源之后体力就被取代了,今天的种植也被机器取代了。目标清晰之后,环境相对封闭,机器能做的时候我们可以交给它,我们可以利用Google做搜索引擎,通过手机变成千里眼、顺风耳,这是一个趋势。未来的穿戴设备可能会变成植入,像Google眼镜,即使眼睛不近视也会有很多人尝试,还有年轻女孩子会整容,这些东西都会带来新的植入。
我认为人工智能与人融合会带来新的物种。通过我们对人工智能的理解和对技术的理解,技术可以带来与人的融合,可以提升人的能力,也可能降低人的能力,这是我们未来的进化。
谢谢大家!
A1:如果把人工智能划分为情感模拟和情感之外的功能模拟,您认为哪个方向更容易定义人工智能?关于更多人将人工智能倾向于类人,就像你PPT里面机械姬的海报一样,如果像那样存在,您怎么看?
王小川:我们要看是模拟情感或者模拟功能,要看这样做的目标,如果没有目标,空谈这个过程就会陷进去。如果模拟情感的最终目的是为了交朋友或者产生陪伴机器人,我们就会看到陪伴本身的属性,功能一样的话也会帮你做判断,它只要在里面对外界做认知,能够做后面的推移,能够做决策就可以。
像“机械姬”,它自己具有了生存的意识,它只要想生存,我认为这一种更高级,已经走出了刚才讲的人工智能的范畴,它的目标已经不是为了解决问题,而是为了生存下去,这就是一种新的物种,有新的目标,以及要适应新的环境。
超越人工智能的阶段,就是造人的过程。我们大可以放心,显然我们现在不会做这件事情,主要还是看目标是什么,到底用它来做什么。
A2:搜索进入智能领域,为什么选择儿童手表糖猫?
王小川:因为硬件在新的时候有两个方向,一个是通过连接带来能力的提升,一个是通过智慧带来的提升。现在糖猫能够联网,解决了父母和儿童之间沟通的问题,所以我认为它是一个连接工具。在连接工具这方面做一个手表,以连接的方式,把手表想象成没有手机群体里面的手机,大人很担忧小孩子用手机,屏幕会伤眼睛或者会有不希望小孩子看到的东西,所以我们从儿童入手。
更多相关文章点击以下链接
「深圳湾」致力于打造以硬件创业者为核心的垂直社交网络,建构以共享经济为基础的企业服务和资源对接体系,全力推动创客与硬件创业生态圈的繁荣。
合作伙伴:混沌研习社|创业邦|领英中国|36氪|中欧商业在线...