《连线》对话陆奇:人工智能技术商业化的最佳途径就是构建人工智能生态系统
陆奇接受《连线》(Wired) 杂志采访的文章认为,这位传奇工程师回到中国加入百度的原因在于,即便一家公司拥有最好的技术、强大的人才库、最酷的产品想法,也仍然需要充分的数据,才能训练出更有效的算法。在中国有更大的机会——有7.31亿互联网用户,这接近美国全国总人口的两倍,「中国有着人口结构上的优势」。在访谈中,陆奇谈到了百度当下所专注的移动与人工智能两大方向、人工智能商业化以及他加入百度后的工作重心、业务变化等。
整理 | Nurhachu Null 刘燕
来源 | Wired
2017 年 1 月,百度宣布原微软执行副总裁陆奇担任公司高级总裁兼任首席运营官。随后,百度多项业务被重组调整、并经历吴恩达和王劲等多名高管离职。
6 个月之后,在百度 AI 开发者大会上,陆奇带着完整的 AI 技术平台开放计划以及上百家合作伙伴,喊出了百度 「 All in AI 」的口号。他还表示人工智能将会是中国历史性的机遇,无论是人才储备、技术积累、充裕资金还是市场空间和政策。而且他认为百度是中国最适合做人工智能的公司,因为搜索,而搜索是人工智能最早期的雏型。
至此,陆奇上任的改造方向清晰可见——开放 AI 能力、打造 AI 生态,给合作伙伴提供像 Android 一样的人工智能。具体主要涉及到自动驾驶阿波罗平台与度秘事业部的语音技术平台 DuerOS ,这两大平台所在事业部都涉及到此前的业务部门调整与重组。今年 2 月,加入百度不久的陆奇将度秘上升到事业部,在那之前的 1 月,这个团队刚做出底层平台 Duer OS 。
在这次开发者大会上,对百度的四层 AI 能力也有总结:基础层,是 AI 算法、大数据、大计算能力;在感知层,包括语音、图像、视频、AR/VR 等技术;认知层有自然语言处理、知识图谱及用户画像等;在平台层,基础层、感知层、认知层的技术会平台化,通过百度 AI 开放平台 ai.baidu.com 开放,与开发者共享。截至目前,百度 AI 开放平台上开放的技术共有 60 个,已成为最全面的 AI 技术开放平台。
大会之后, 7 月 26 日,陆奇接受了《连线》杂志的采访。文章认为,这位传奇工程师回到中国加入百度的原因在于,即便一家公司拥有最好的技术、强大的人才库、最酷的产品想法,也仍然需要充分的数据,才能训练出更有效的算法。在中国有更大的机会——有7.31 亿互联网用户,这接近美国全国总人口的两倍,「中国有着人口结构上的优势」。在访谈中,陆奇谈到了百度当下所专注的移动与人工智能两大方向、人工智能商业化以及他加入百度后的工作重心、业务变化等。
自从到百度之后,公司进行了重组。作为 COO,你在其中扮演什么角色?
我和 Robin(百度 CEO 李彦宏)在工作上的配合非常紧密,我们要确保我们是完全同步的。我主要负责研发、销售和市场,因为我要保证我们的全局战略是同步的。这是第一点,第二点是,在战略方面,我们现在更加清醒、更加专注。实际上,我们正在进行两场战争:一个是巩固我们在移动端的基础,另一个是引领人工智能领域。
你如何描述你们的人工智能战略呢?
我们认为,将人工智能技术商业化的最佳途径就是构建人工智能生态系统。本质上来说,就是要推动我们的合作伙伴加快创新速度,使用更健康、稳定、经济的模型,帮助我们的开发者和合作伙伴打造强大的、长期的双赢局面。
这个生态系统的基础是百度大脑,这比微软、谷歌在美国提供的产品更加广泛,因为它是一个平台,提供了 60 种不同类型的人工智能服务。
另外,我们也是第一家清晰地将感知和认知分开的大公司。感知能力和认知能力是有关联的,但是他们是不同的,大部分其他的人工智能平台却将两者捆绑在一起。
百度有没有一款可以媲美苹果 Siri 或微软小娜的产品?
为了将我们的用户和合作伙伴联结在一起,我们主要专注于两个平台。
第一个就是我们称之为Duer OS 的平台:Duer OS 是一个基于自然语言、基于对话的人类计算平台,与亚马逊「Alexa」、Google 的「 Google Now 」、微软的小娜以及苹果的「 Siri 」类似。唯一的区别就是目前为止,Duer OS 比其中任何一家都领先。Duer OS 在中国积累的基于对话的技术能力比任何一家都多,拥有自主开发的 10 个主要领域以及 100 个子领域的对话技术。而且,我们正在开发一个新兴合作伙伴生态系统,让合作伙伴也能够在此基础上开发更多的技术能力。或许亚马逊在这一方面比百度更多,因为他们在美国拥有更大的合作伙伴生态系统。但是与中国的绝大多数公司相比,我们拥有明显的优势地位。
第二点,我们在合作伙伴中也处于明确的领先地位。目前,Duer OS 已经应用在超过 100 个家用电器品牌中,无论是冰箱、空调、电视机、故事机或是音箱。
你怎么看待美国的语音技术市场和中国市场的差异?
家居环境是大不相同的。具体到我们关心的语音交互条件上,中美家庭在声音环境和噪声模式方面会很不一样。Alexa,、Echo、以及小娜都是在美国的家居环境中进行优化。在我看来,这仅仅会在北美洲或者欧洲的一部分地区奏效。从根本上来说,都假设你拥有宽敞的房子,拥有好几个房间。然而,在中国并非如此。在我们的目标人群中,即便是高收入的年轻一代,通常可能只拥有 60 平米(相当于 645 平方英尺)的房子,有时候会是 90 平米(相当于 970 平方英尺)。
相比而言,我们的 Duer OS 拥有更好的全球化机遇。因为日本、印度以及巴西的房子都比美国的房子更接近与中国的房子。
所以,这是不同的地方。那么相同的地方在哪里呢?
相同的地方就是技术。核心技术仍然是语音识别、信号处理、自然语言理解以及平台。从很多方面来讲,我们的平台与亚马逊的平台很相似。我认为,亚马逊正在做一件大事情。即使我在微软工作的时候,我总是要支持微软。但是说实在的,亚马逊已经处于领导地位。
但是你不觉得亚马逊的短板是它的后端吗?这是它在技术上无法赶上 Google 和微软的地方。
四年半之前,我开始推动 Cortana 的工作。那时候,我们都是这样认为:「亚马逊,哦,它的这项技术还很落后」。但是我们认识到的一件事情是,在这场人工智能的竞争更多取决于是否能找到合适的应用场景和生态系统。在技术上,Google 和微软确实领先亚马逊一大截。但是你再看一下今天的人工智能竞争,亚马逊的 Alexa 生态系统领先于美国的任何企业。这是因为他们有合适的设备以及与之匹配的应用场景。从本质上说,Echo 是一个人工智能优先的设备。
而微软和 Google 犯了同样的错误,微软专注于在电话和 PC 上开发 Cortana ,尤其是电话上。我认为,在可预见的未来,电话将会是一个手指优先、移动优先的设备。你需要一个人工智能优先的设备来巩固新兴生态系统的基础。
这就非常清晰了,生活在中国,人工智能优先究竟意味着什么。它意味着你与科技的交互从一开始就不一样。在第一次交互中,它必须具备语音识别和人脸识别功能,当然你可以使用触摸屏幕的方式,但是这都是第二位的。
在百度总部,所有设备都以人脸识别为基础。在百度的售货机上,你可以通过语音和人脸的识别来买东西。我们正在进行一个自助咖啡厅的项目。我们的目标是,当你走进自助餐厅之后,你可以在餐厅拿起食物就走。
从技术上来讲,这在很多地方都是可以实现的,但是这并不意味着人么能够接受这件事情。
技术并不是所有要解决的问题,这还关乎整个大环境的结构,比如文化、政策制度等。这就是为什么说,对我而言,人工智能在中国是一个如此有趣的机遇。这里有不同的文化、不同的政策制度以及一个不同的环境。
那么,我们正在创造的技术会受到怎么样的伦理影响呢?在微软工作的人会有着和在百度工作的人一样的交际方式吗?
这是类似的,隐私保护在百度同样很受重视。基本而言,我们的用户是信任我们的技术的。这才是我们谈论相当多的东西的基础。我们将会持续地进行重点投资,以确保你能信任我们的服务。我们以语音交互为例,我们正在研发能够避免非有意唤醒智能手机的技术。因为我们知道人们不想让他们的对话被上传至云端。或许我正在房间里进行私密对话,但是有时候智能终端会认为你在唤醒它,然后将这些数据上传至云端。
你认为中国的消费者真的如此关心这个吗?事实上,他们生活在一个不同的政治环境中,你认为他们有什么不同的期待吗?
我们的假设是人们会关心这件事。归根结底,我们认为人是理性的。如果有足够的利益关系,人们会衡量这件事的结果,并做出他们自己的选择。我认为任何人都是这样。
百度在今年春天公布了一个叫做阿波罗( Apollo )的自动驾驶计划,并且宣布截至目前已经有了150 个合作伙伴。百度为何要在无人驾驶上投入这么多?
如果你想要建立真正能够获取知识、作出决策并适应环境的数字智能,你需要打造自动化的系统。在所有的自动化系统中,无人驾驶将是首个能够落地实现商业化的应用。
这与今天的手机生态系统相似。手机生态系统是最大的软件生态系统,我认为同样的事情也会发生在无人车上面。车辆将会形成一个更大的生态系统,同样的技术集合,包括硬件、传感器、芯片、软件,这些将会被用来制作工业机器人和家用机器人。我们想让成百上千的公司和大学一起做这件事,来打造一个更大的生态系统。然后我们就可以制作机器人、制作无人机、制作所有的自动化系统。所以,我认为自动化是关键。
你在阿波罗计划中起着重要作用,是吗?
虽然我是公司的 COO ,但是我会直接负责推动这个项目的商业运作。在过去的三个多月中,我可能将 40% 的时间花在了无人驾驶技术产品上,包括与客户洽谈、与合作伙伴洽谈。本质上,从今天到能够实现完全自动化的未来,无人驾驶技术的基础技术路径就是迭代的速度。
那么,这种迭代速度取决于什么呢?
从根本上来说,取决于你能得到多少数据。因为,为了能够在路上开车,你必须开过不同的路况,比如光照、天气、路面是否湿滑、胎压是多少等。我们能够对阿波罗启用所有的资源,尤其是数据资源,以让所有人都拥有一种更好的生活方式。
我们为阿波罗写过一份宣言,主要包括四个非常重要的原则:
第一个是开放能力。在百度,我们向所有的合作伙伴开放我们在以下方面的能力,包括代码、服务和数据。这在中国是很奏效的,因为中国小型公司特别多。与美国高度集中化的行情不同,中国有 250 多家汽车代加工制造商,并且没有一家制造商拥有进行深度研发的所有能力。利用我们在 7 月5 日发布的代码库之后,我们能够让每个人都有可能在 3 天内装配一辆能够以受限的形式实现自动驾驶,并且开始研发。
第二个就是资源共享。实际上阿波罗有两个层次的设计。其一是你能够在没有任何附加条件的情况下使用阿波罗的代码、能力和一些数据集。第二层是,你可以使用百度的所有数据,包括高清地图和训练数据,但是同样也要求你贡献你的数据,你贡献的越多,你得到的回报越多。
第三个原则是加快创新速度。因为我们能够收集整合更多的数据,所以我们能够在模拟引擎中形成更多的能力。由此,我们可以让所有人一起来进行更快的创新。
第四个原则就是可持续地双赢。百度是最大的模型。百度将会专注于提供高端、高质量的服务,高清地图,以及安全服务。我们不和那些汽车代加工制造商竞争。无论是博世、大陆集团还是英伟达,我们要帮助它们做到更多。
这就是我们在美国和新加坡建立阿波罗子公司的原因。新加坡政府的表现是这样的:「来新加坡吧,我们已经组做好投资的准备了」。
在中国,汽车要想实现完全的自动驾驶还需要哪些因素?
仅仅依靠科技本身,自动驾驶无法实现长远的发展。举个简单的例子,路上发生了交通事故,警察过来了,没有任何手势。只在纸上写了一句话,「请以时速不高于 5 英里的速度行驶。小心前行。」 然后,他们他们就举着这张纸。这就需要科技来识别手写字体,理解人类的语言,只有这样才能听从指令。但实现这一目标需要很长的时间。
首要问题就是,为了推动完全的自动驾驶,还需要制定新的法律法规。其次,也是阿波罗计划的一部分,就是与所有伙伴进行合作。事实上,我们发现,在实现完全自动驾驶之前,在很多方面已经可以实现商业化。奥迪 A8 就是一个很好地例子,在发生交通严重拥堵的情况下,车辆可以自动前行。这种拥堵情况在北京、上海以及湾区很普遍。现在,当你让车自动行驶,自己就可以读点东西,或做其它的事情。除了跟车行驶,还存在很多其它的场景。
首次见面时,你还在微软。在辞职几个月后你去了百度。能说一下缘由吗?
2016 年 10 月,我摔伤了腿,需要进行两次手术。我和比尔·盖茨、萨提亚·纳德拉依然保持亲密的联系,当我去西雅图时,我经常会去拜访他们,我承诺做他们的私人顾问。
2017 年似乎是中国 AI 发展的崛起之年。这意味着什么?
这是技术逐渐成熟和更多垂直产业应用人工智能实现商业化的结果。从全球范围来看,我确实认为中国和美国拥有更大机遇,能够共同推动世界的发展进步。我可能深受比尔·盖茨的影响,他经常谈论目前的世界经济实际上是一个单一引擎经济。美国占世界 5% 的人口,但带来 24% 的经济产出和 60% 的创新。但显然美国无法支撑增长的速度,因为世界有 70 亿人口。大概有 30 多亿人拥有一个现代的生活,有现代化交通工具,吃着加工过的食物,拥有冰箱。但另外一部分人却是一个完全不同的生活状况,生活条件令人堪忧。
我们的工作就是使所有人都能过上现代的生活。怎么做?只有通过更多的创新,更好的增长才能实现。中国应该成为第二大创新引擎。比尔·盖茨认为,一个更具创新、更加发达的中国对全球经济是有利的。我也认同这一点。
几年前,在百度开始扩充人工智能资源时,选择在硅谷建立实验室。在吴恩达离开百度后,接替他领导百度人工智能实验室的负责人常驻中国。中国的人工智能人才赶上美国了吗?
从整体上来说,美国还是更为强大,这是毋庸置疑的。但中美两国之间的差距正在以极快的速度缩小,这也是不争的事实。我现在已在中国生活了六个多月,我读了很多论文,也与很多人工智能开发人员进行交流,说实话,你真的可以感受到人才根基的力量。
在中国,百度会推进越来越多与人工智能相关的工作。但同时我们也会继续在美国,包括湾区和西雅图进行投资。我们刚刚开放了一个西雅图园区,因为我们收购了 Kitt.ai 。美国拥有更多的顶级人才,我们想要充分利用这一优势。