百度研究院余凯：智能江山如此多娇

查看原文

其他

百度研究院余凯：智能江山如此多娇

2015-04-14 B座12楼

百度深度学习研究院（IDL）副院长余凯博士在万物互联创新大会的演讲：《从万物互联到万物智能》。

余凯：各位朋友早上好。

今天报告的题目是从万物互联到万物智能。首先我们从机器人的角度看什么叫做「智能」。

首先是感知能力，就像有五官有眼睛可以知道环境是怎么样的。

第二是理解能力。比如说这是一个讲台，这是台阶，如果是一个履带式的机器人，就知道理解是什么，不能从这个方向走，从这个方向走就摔跤，一定要找一个安全的路径去走。

第三是根据目标做决策。因为做了决策，做一个位移，换一个地方，或者把一个东西搬到一个地方，或者说跟对方说了一句什么话，对方会因为我的一句话，会因为我一个位移将来位置，下一步要感知，感知获取新的数据，再理解，做下一步的决策，这样循环往复不断提升的过程。

所以，智能一个本质的能力是说这个系统和服务能不能够随着经验不断的成长，能不能越变越聪明。

可能有些人跟我一样同一个年纪，小时候上过一篇科学，讲的是科学巨匠小时候做小板凳的故事，做的小板凳非常简陋粗理，老师会不会觉得这个小朋友不够聪明，但是看过去几天看小板凳，一个比前面做的好，做的更加精致，尽管做的小板凳不够好，成长曲线非常抖，随着经验不断演化，成长非常快，这个科学巨匠是爱因斯坦。最重要是学习的能力，不是今天到底多聪明，学习的能力是智能的本质，是不是在感知理解决策在各个环节中贯穿一种能力，就是不断地去学习，不断去提升它的能力，这个是智能的本质了，随着经验去演化。

什么是经验？经验就是数据，如果在座的有跟我一样的做人工智能经验学习的背景，通常讲一个词“经验数据”，数据就是经验，经验就是数据。

大数据时代是一个承前启后这么一个桥梁，它让我们从万物互联达到一个未来，这个未来是什么，因为数据的存在，使我们具有无限的可能，研发智能的设备，智能的产品、智能的服务，一个万物智能的时代。

讲人工智能在大规模的应用从什么时候开始？其实在2000年以前，基本上所有的AI在学术研究领域，这里面很多理论，很多算法，很多模型，但是并没有对这个世界产生非常大的影响，真正产生大的影响是因为互联网，2000年以后有雅虎、有google，有中国的BAT，在搜索、广告、推荐三个非常重要大事情面发挥重要的价值。

AI的发展可以分为三个阶段：

第一阶段润物细无声，润物产生重要的影响，为什么细无声，因为绝大部分大规模人工智能的技术，比如说机器学习，用于推荐，使产品推荐更加精准，这些算法是后台的技术，并不容易可感知，是细无声的状态。

第二个阶段，属于“于无声处听惊雷”。今天所处在的10年是一个什么样的阶段，这个10年从2010年到2019年，有的朋友跟我一样听到轰隆隆的雷声，因为数据不断增长，计算能力不断越变越强，互联越来越无处不在，技术深度学习技术使数据分析建模能力跟以前完全不一样，突飞猛进的发展，在过去2010年以前不可想象语音识别准确率到今天这个地步，但是这个准确率到今天还在不断的提升，因为深度学习的技术，大数据的能力，使得语音识别今天变得可用，比如说使得图象识别觉得可以预期，并不是遥不可及，不可用。

还有很多人在后面的五年里面，自然语言的理解，过去不光听清讲什么，而且听懂讲什么会变为现实，还包括机器人。所以看到在往移动互联网，往物联网，往传统行业不断延伸不断的影响，AI技术从后台到前台，从以前不被感知到现在被感知，比如语音的交互。

第三阶段从2010年到2019年的时候，江山如此多娇。第一个需求，交互无处不在，简单重复性的工作需要被取代，比如说很多家庭的服务，比如说常规病的检查，可以想象今天去医院是一个什么样的体验，我的体验就是去好不容易排了很长的队，进了房间，医生基本上不会抬头看我，写了几个字，做检查去，做各种检查，上下楼楼上楼下跑，跑完以后把单子给他，看了一下，还是不抬头看我，他说开药去，很多常规性的工作基本上是定量化的检查，用非常固定式知识推理做这种知识的工作，不需要医生来做，机器系统一定做的更好，一定阅读世界上所有历史上包括最新的研究结果，还有无数病例可以分享，可以比医生做的更好，医生做的疑难杂症。

当然刚刚提到的在过去最近这10年里面，深度学习技术给人工智能很多方面带来突飞猛进的进展，最重要的原因是其实跟大数据的关系非常大的。过去传统人工智能的算法，随着数据的变化在一定程度上面能力不在增长，因为处理数据模型本身处理数据本身计算复杂度的原因，或者说模型本身从统计上面来讲容量不够的原因，导致数据增大不一定增长能力，但是深度学习的算法一个显著的特征能够不断吸收大数据带来的红利，能够不断增长，因为它有很大的容量，容量可以吸收数据里面的信息，第二能找到很好的算法。

抛开技术，深度学习让大数据成为真正商业必然，你的效果随着数据增长不断提升，这里面很有意思的现象，数据的产生往往是物理的过程，一个物理的过程一定耗费时间，是加快不了的，竞争对手如果赶上你的水平，一定要耗费相当的时间，但是你永远跑在前面，好比说如果个性化做的非常好，跟用户的联系永远跑在别人的前面。深度学习技术实际上大数据真正成为一个商业的壁垒。

在目前来讲深度学习技术最成功四个大的应用领域：就是搜索、广告、图像、语音。今天为止百度最核心业务来源就是广告系统，这个广告系统完全基于深度学习的技术，点击率、它的收入因为这个技术大幅度提升，搜索相关性深度学习理解自然语言，理解自然语言的语义，是搜寻排序里面最重要的因素。

最后从万物互联到万物智能一个非常具体的例子，就是从事自动驾驶项目。在右下角图里面，现在未来自动驾驶的车，实际上是被先进的这种传感器武装，武装到牙齿，10几个传感器，最远的感应距离能够感知200米以外的目标，比人更精确，毫发不差精确感知这个速度怎么样，将来这个车一定比你开还要安全。有人曾说，将来人开车是犯法的，当然我并不认同，因为最终我人是要人车一体，为什么在中国做自动驾驶？在中国如果开发出自动化驾驶技术，一定是全世界的，在美国在欧洲开发自动化驾驶技术，一定不是中国的，所以一定不是全世界，不会有这么多的复杂的路况，不会中国式井盖缺失，如果在中国路况能够开发这样的技术，一定在全世界是畅通无阻，所以技术问题在自动驾驶上面在5年时间上面得到解决，最难问题法规法律道德伦理，出了问题谁负责，车还是人，车不是我开的，这个问题是需要大家一起来建设一起来思考，这个要花费更长时间。

自动驾驶最重要四个核心技术：感知、决策地位，高精度地图，定位。

高精度地图更加精确的定位地图技术，基于高精度地图车能够做更加精准的定位，差不多10到20厘米一个定位的精度，实时的，这是云端的技术。而相反如果用GPS错误率在2米、3米，如果市区里面可能在10米这样一个定位的误差。同时基于图像对道路实时场景的理解，比如车道线，路标、车行人等等，用深度技术做实时的，目前能够做到世界上最高车辆检测的精度。

自动驾驶不是一蹴而就，是渐进性的发展道路，到高度自动化驾驶，最后人车一体的系统，不是取代人的系统，人跟车的关系应该相当于人跟马的关系，这是对自动驾驶的理解。

总结一下，从万物互联到万物智能三大趋势，5到10年里面三件事情成为必然：

1、所有的设备都有智能传感器。

2、所有设备都有云端，每个空调很多数据分析在云端去做，像我们车是云端结合的系统。

3、所有设备都从单一的功能变成一个连接人和服务的节点。比如说今天智能手机从过去手机时代就打电话到今天是移动互联网服务连接的节点，在未来会成为人连接服务的节点。从这个角度所有设备一定会成为人工智能系统，一定会成为机器人，每一个空调看见小朋友，如果晚上没有盖上被子，自动把空调温度调到合适，不让你感冒，这个空调是一个机器人，所有都会朝这个趋势去发展。

谢谢大家！

------------

::B12出品::

------------

扫码关注我们

| 回复“目录”查看B12往期 |

------------- 推见 -------------

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

平安信托深陷“爆雷”旋涡：终于尝到“偏爱”房地产的苦果

刀片电池存设计缺陷，或将导致几十万比亚迪车主自费更换or召回？

复旦陈果：低质量的独处，不如高质量的社交，有远见的人都关注了这些微信号