启元世界袁泉:用AI让元宇宙加速落地|GGV OMEGA访谈录x创业内幕
人工智能,对于现在的我们已经不再陌生。但是为游戏和数字娱乐行业提供人工智能的解决方案,这是不是听上去有点新奇?
启元世界成立于2017年8月,是一家通用人工智能平台公司,其拥有深度学习、强化学习、云计算等自主研发的核心技术和产品。同时公司屡次获得世界级AI比赛的冠军,2020年6月,启元世界自主研发的AI智能体在《星际争霸II》人机大战中以2:0击败了中国星际职业冠军级选手,刷新了人机对抗的历史最高成绩,和DeepMind一同成为了全球唯二的两家能够用AI击败星际顶级选手的通用人工智能公司。
什么叫通用人工智能?
启元世界目前主要的产品的应用场景是哪些?
启元世界跟元宇宙又有哪些联系?
今天的《创业内幕》,我们请来了GGV OMEGA学员、全球领先的通用人工智能平台启元世界创始人兼CEO袁泉,以及GGV纪源资本合伙人李浩军一起聊聊通用人工智能。
Lily:
亲爱的听众朋友大家好,欢迎收听本期创业内幕,我是主持人Lily。本期我们非常荣幸请到了全球领先的通用人工智能平台“启元世界”的创始人兼CEO袁泉(袁总)和GGV纪源资本合伙人李浩军,一起来聊聊元宇宙话题,以及元宇宙相关的一些创业机会。浩军,请你先讲讲,GGV怎么看启元世界和元宇宙这样一个生态和创业赛道?
李浩军:
元宇宙这个概念从去年开始就比较火,从投资角度来看的话,当一个赛道比较火时,还要善于分析以下几点:
第一,这个火背后的一些核心原因是什么?
第二,这个火背后的驱动因素是什么?
第三,驱动因素之下,是不是真的能够承载一些有长期价值的创业机会和赛道价值?
其实去年元宇宙火了以后,我们也在认真研究,这样一个时间点上,是哪些技术的结合,在当下产生了这样一些新的变量。我觉得可能还是跟大的技术发展背景有关。移动互联网到现在,从人工智能技术,到未来两三年AR、VR又有一个可能看起来爆发的可能性,所有元素结合起来形成了Metaverse。当然这里面也离不开像腾讯全真互联网、 Facebook改名的一些推动,让元宇宙从后台走到了前台。
在这个概念之下,我们其实趋势看长,但是机会还是要看近期3-5年内能落地什么。在一个行业成熟早期,它的基础设施应该是最重要的。说到元宇宙的基础设施(像做数字孪生,做数字人),我们要做一个虚拟世界的应用场景,像渲染技术、AI技术、一些经济体系的技术底层,可能都是面向未来整个Metaverse的一些基础设施。所以我觉得其实从这个框架里面,启元所在的整个认知决策引擎或者AI智能体赛道,还是一个偏Metaverse基础设施的赛道,我们确实还是比较看好的。
Lily:
谢谢浩军的介绍。我们请袁总介绍一下自己和启元世界这家公司。
袁泉:
我自己早年是在IBM研究院,做跟机器学习个性化推荐相关的一些算法研究。12年加入阿里做了5年,在淘宝天猫从头把推荐团队搭起来,然后落地。
之后特别巧,AlphaGo打败李世石的第二个月,纽约举办了一次国际会议,当时我正好在现场听David Silver(AlphaGo一作)讲他们背后的技术。它区别于我们做了10多年的大数据和机器学习,AI能够自己生成数据,并且通过左右互搏的训练方式,去达到超越人的智能的水平。
这让我们非常震惊,所以回来之后,我们先在阿里成立了一个认知计算实验室,基于新一代通用人工智能平台去做研究。后来发表了第一篇文章,关于“以深度强化学习的神经网络双向循环的方式,去做小规模(比如二打二、三打三)智能体博弈”,被业界机构引用并引起反响。
之后我们思考, AlphaGo可能就是AI的拐点和里程碑,所以后来就出来专门创业。17年成立了“启元世界”,瞄准通用人工智能。
先从游戏中训练AI,然后再运用到各类数字场景中,是我们特别信仰的方法论。去年元宇宙火了,其实它背后和我们训练AI的技术方法论特别像(就是在游戏中加速训练,再服务于现实世界或者数字世界),也是有缘遇到咱们GGV一起来参与我们这个项目。
Lily:
从 IBM 这种宇宙大厂,到阿里这样的快速成长的独角兽,再到今天去做启元,您觉得三份经验有什么最大不同?
袁泉:
我觉得也是很有意思的几段经历。IBM是外企,是偏后台的研究院,对人的培养是比较开放的,就是系统性做研究,分解细化,抽丝剥茧,解决一个不确定的问题。
阿里是互联网代表,当时我过去最主要的考虑就是,做了若干年研究之后,怎么让研究服务于社会,产生实际价值。我们针对人们购物的信息筛选问题,结合信息瀑布流形式,再扩展成无限瀑布流,不断优化体验。
17年出来创业这一段,我觉得可能是一个更大的历练。之前在IBM、在阿里都是偏技术,创业前三年,我们基本上是强技术驱动。创业过程中,尤其是技术出来之后,这两年在如何把技术能力形成产品能力以及市场能力这块,我觉得可能是对我们过去一个更大历练,包括快速提升认知,快速根据市场和客户变化去修正产品和技术路径。所以我觉得还是从松到紧,体验非常不一样。
Lily:
其实我们大家对人工智能可能都非常熟悉了,您要不要跟我们解释一下什么叫“通用人工智能”?以及启元目前主要产品的应用场景是哪些?
袁泉:
通用人工智能(Artificial General Intelligence,简称“AGI”),最早由DeepMind提出来。我们过去做的比较多的大数据和机器学习,通常是在已经有标注数据的情况下,去拟合历史数据,换一个数据和场景,可能又需要重新去训练它。
通用人工智能的“通用”,体现在强人工智能和技术,希望解决的问题就是,接近人脑,具备通用性和举一反三的泛化能力。
如果在有生之年,启元能够通过对通用人工智能的实现,做出一些自己工作上、技术上、产品上的成绩,那我们会觉得非常激动。启元一直在通过业务和技术,追求打磨AGI的通用性。目前我们主要的应用场景是在游戏上,因为我们这个技术其实来源于游戏,就是星际争霸,所以第一步最自然的一个延展,也是先应用于各类游戏中。启元也是顺从自然路径,先从游戏行业开始,再扩展到一些具备数字孪生的场景,让AI在里面反复加速训练,探索最优的辅助决策的策略。
Lily:
你是怎么看到启元这个项目的?以及你怎么定义它?
李浩军:
坦白说,一般情况下,当一个新技术出现时,最好的试验田其实是游戏。因为游戏用户群本来也是偏极客为主,通过游戏方便用户认知一个新技术,以及感知新技术带来的反馈,元宇宙也一样。其实游戏本身已经是一个虚拟社会,已经是一个虚拟经济体了,大家可能有身份有角色,在里面可能有职业,也有经济体系。在这个概念上,其实延展出去一个更大的开放世界,可能就是今天的元宇宙赛道了。
从投资人角度,游戏本身其实是一个非常好的商业模式,但风险也比较高,所以我们可能自己不太投游戏。但是站在用户角度,我还是有一些第一手的自我认知和自我感知。我天然觉得游戏是一个最好的场景,能够先把这些新技术用起来,而且如果是比较大型游戏的话,它的营收模式足够好,现金流也足够好,开发者对用新技术的意愿也足够强,那么他其实也愿意跟这些底层基础设施去合作。
谈到长期愿景的话,我肯定不认为启元只是一个游戏的基础设施。其实长期看,我们还是叫“AI认知决策智能体”。我觉得既然有SaaS有Pass,AI可能往后也会有AI as a Service,就是一个人工智能会变成一项基础服务的基础设施。很多时候我们可能都需要智能决策、人工智能服务,都可以去调用这样一个服务。就好像今天的云服务,不用每个人都去建机房、盖服务器才能开始开自己的网站和 APP,大家用阿里云、腾讯云,其实它们就是变成基础设施了。人工智能一定也是往这个方向发展的。
Lily:
我在市场调研发现,目前像启元这种领域(基于深度强化学习的智能认知决策系统)研究的专业公司,市场上比较少,这个原因是什么?是咱们的落地场景不够丰富吗?还是说我们对应的人才不够丰富,什么原因?
袁泉:
启元的初心和定位还是在通用人工智能,它具备很强的通用性和举一反三能力。按照这个定义,目前深度学习加强化学习是最逼近这个事儿的方式。所以我们从去年开始,除了强化学习,也在往深度学习,深入研究去做,布局有超大规模的认知模型,具备很强对话和EQ能力的智能体。
之所以觉得市面上搞强化学习的公司比较少,我觉得一方面可能是这个技术比较新。国外几年前受AlphaGo这种事情的感召,许多学校的学生其实都在学习这个事情。当然也有一些优秀苗子回国,但是整体来看,相对于国内做AI的,他们可能人才会更多一些,所以人才确实是一方面。
第二就是强化学习的落地场景。其实大家知道,像最大的游戏公司腾讯和网易自己内部可能也会搭建团队去做,我们作为第三方AI公司,又是专注于深度强化学习赛道,同行也好,学生们也好,会有一些疑问,关于市场空间或者关键场景能否抓住。这个可能也一定程度使得这个领域的初创公司会少一些。
还有一个方面就是即技术门槛还是非常高。在深度强化学习赛道上,首先必须得有一套基于大算力的系统和平台,先解决源源不断的、如何生成高质量数据的问题,这就是一个很有挑战的事。在这一点上,启元花了很多时间去建立这个平台和技术,一是能生成数据,训练出比较好的智能体,而比较好的智能体最后又能生成更高质量的数据,又能训练出更高水平的智能体。这套体系在技术上还是蛮有挑战的。
Lily:
目前来讲,启元最有名的还是在游戏领域的应用。说到游戏,中国其实是有巨头在前面的,启元应该怎么在这个领域做好差异化?
袁泉:
我们觉得我们最独特的基因,还是在通用人工智能的平台和产品这块,游戏就是我们现阶段发力的一个方向,尤其是星际争霸这种比较有渊源的策略游戏。
另外一块,人工智能的终极目标,就是这种通用人工智能,或者是创造认知决策大脑的能力。所以游戏中,我们现在也在做开放世界NPC,它是那种3D的,栩栩如生的,能自己看清楚、识别场景,并且能够和人去交互、对话的NPC。
这个核心就是:我们相信,从这种3D开放世界游戏中训练出来的NPC,可以服务于多个行业和场景。我觉得我们立足于游戏,但是从里面训练出来的这种具备通用能力的智能体或者数字人,确实在很多行业都有很大的想象空间。
Lily:
我们的技术研发团队是一个什么样的构成?我们的人才是如何获取的?您在团队中更看重人才的什么素质?
袁泉:
其实在AI领域,不管是技术、产品还是应用落地,人才还是非常关键。这几年启元还是凝聚了不少国内外、对通用人工智能感兴趣的人。整个通用人工智能的彻底实现,可能是10年20年后的事,但是需要现阶段就愿意投身在这个事上,相信我们逐步在产生产品和业务价值。
通过这几年创业,启元形成了自己一定的人才观,聚集了一批适合做我们现在这个事情的最好的人才。我们要对通用人工智能服务于消费元宇宙或者产业元宇宙有热情,甚至能够去点燃别人的人,这个是我们说的S级人才。
另外就是基本功,我们越来越看重这个人的基本素质,是否有创业心态,是否能够拥抱变化,快速去试错和迭代。我们觉得一个组织的核心能力,就像训练智能体一样,能够快速反馈试错迭代,从而不断探索到一个最优策略。可能就是这几方面。
Lily:
现在我们启元其实有非常强大的技术能力,也在游戏这些领域有一定的落地场景,未来在元宇宙领域,您是怎么想的?
袁泉:
其实启元和元宇宙还是挺有缘分的。17年我们注册公司时,首先定的其实是inspire,我们希望随着AI能力的不断提升,它能够去辅助人、启发人、陪伴人,所以是定的inspir.ai,翻译成中文差不多就是启元。但是发现这两个字已经被注册了,后来我们才加上世界两个字。前面说到的这种深度强化学习训练AI的方法,其实先需要有一个数字世界。后来元宇宙火了之后,有朋友开玩笑说,你们如果把“启”单独读,后面“元世界”单独读,那么就是“启-元世界”。
我们心目中的元宇宙,其实分成两部分:消费元宇宙和产业元宇宙。游戏这部分就是我们说的消费元宇宙,它从游戏互动娱乐,包括可能会延展到教育社交,更多是和个人消费者相关的。所以,这块的终极目标就是, NPC有一个比较好的AI能力(也许从IQ到EQ上都非常懂用户),和这种消费级的个人用户会产生一种可能非常紧密的联系,它后续可能会在消费元宇宙、数字世界中与人创造非常新奇的体验。
第二部分就是我们说的产业元宇宙。现在随着智慧城市、智能制造机器人等,它的数字孪生环境越来越多,对现实世界有一个更好的抽象,你可以把这个数字孪生想象成一个最真实的游戏。所以在这里面, AI通过去做一些智能化调度、控制或者辅助决策,提升工业生产效率,肯定也是一个非常大的应用场景。
一个底层的核心技术就是,我们相信启元在做的通用人工智能,因为训练过程就是依赖于游戏、依赖于数字孪生,所以产出之后,能比较自然地在消费元宇宙和产业元宇宙中,创造出比较大的社会价值和商业价值。
Lily:
元宇宙其实商业化落地很难,不知道接下来对商业化未来怎么看?它落地难是怎么造成的以及怎么破局?要不我们先请袁总说说。
袁泉:
其实元宇宙这个概念从出现到大热,还是一个比较新的事物,我们感觉大家对新事物还是需要更多一点耐心。看新技术或者新事物时,从三五年角度来看,你可能会高估它,但是从10年以上角度来看,可能你会大大低估技术发展和落地的速度。
我们觉得元宇宙最大的想象空间,可能还是在5-10年范围内,在消费元宇宙和产业元宇宙这块释放巨大价值。但是放在今天来看,至少我们看到比如说VR、AR的出货量明显提升,元宇宙沉浸式体验的硬件平台逐步具备,包括我们在做的这种认知决策能力很强的智能体,或者会成为元宇宙中数字人的技术和产品体验,也都在快速落地。总体来看,我们对这个行业和技术还是非常有信心的。
Lily:
浩军你怎么看?
李浩军:
首先要定义一下什么是元宇宙。今天这个概念被炒得很热以后,大家把什么都套上了元宇宙的帽子。因为元宇宙是个集大成者了,可以把什么东西都包在里面。换句话说,我们看好的元宇宙是一个什么样的元宇宙?因为每个人定义中的元宇宙可能不太一样。
其次,我们讲的元宇宙体验是一种什么样的体验。我理解的元宇宙,按照整个技术发展逻辑,我其实是在期待下一代平台性的机会,从PC到移动,再往下一代的平台在哪里?那是一个我期待中的第三代技术平台,那个东西可能叫元宇宙,但它是需要硬件更迭做支撑的,肯定不是构建在今天的PC、移动之上。但是你说AR、VR技术,还有这种新的交互技术,什么时候能够成熟,今天只能说看到一些雏形。可能在未来两年,硬件角度如果能有一个更大进步、更大成熟的话,在新的硬件之上,构建出了这种虚拟和现实相结合的新的交互模式,以及带来的一些新变化,那时再去谈元宇宙的落地和大规模商业化,我认为可能会好一些。
Lily:
最后抛给二位一个问题,其实有很多创业者想深耕元宇宙,二位对于这个领域的创业者,有没有什么一些好的建议?
李浩军:
从我自己角度来想这个问题,我自己思考最多的,其实还是说,技术愿景和产品化、商业化之间的平衡,本身是最难的,但又是必要的。这个中间落地的点到底在哪里?平衡点在哪里?怎样在所谓商业和技术之间找到微妙平衡,我觉得其实是最难的。让我说的话,创业本身还是要找到好的切点,有好的落地场景,然后这个场景能够突破,突破以后才能够让更多人去做认知。大家有了认知以后,你才有机会去迭代,以及拓展更多场景,所以我觉得其实还是落地能力。
袁泉:
我补充一点,我也想讲落地路径这个问题。因为元宇宙或者是通用AI,都是一个比较中长期、可能很大很重要的事,你确实需要看5年,想3年,做1年。进入赛道的这个过程中,随着技术进步,每个阶段能接触的场景和应用,还是需要各位创业者非常深入和透彻地思考。你需要慎重考虑,找到适合自身团队基因的一些切入点,真正能够在每个阶段产生核心价值,而不只是赶风潮。
Lily:
感谢二位今天的精彩分享,我们最后再问问袁总,您现在还招人吗,招什么样的人才?
袁泉:
招,其实我觉得还是两方面,一方面你认同赛道,认同元宇宙,认同我们在做的通用AI。有热情,心中有火,眼中有光,有自驱,其实能帮助你在创业过程中,克服很多曲折和问题。第二个就是基本功要比较过硬,不管是技术能力、产品能力或者是综合素质、市场能力等,然后能随着公司一起成长。虽然创业过程中,大家都会趟坑,都会交学费,但是能从中快速成长和迭代。
Lily:
好,听完这期节目,大家如果对启元世界有兴趣的话,可以在各大招聘网站上搜索“启元世界”,欢迎大家积极投简历。本期节目到此结束,欢迎大家在我们各大播客平台上积极评论、转发,我们会从播客和公众号等各大平台的评论中共挑选出5位朋友,由启元世界送出他们的小手办。