查看原文
其他

两位“老炮”谈AI:未来20年是人工智能时代,大模型有六大发展趋势

元界
2024-09-05


AI大模型,无疑是2023年最火热的风口,大厂和创业者同台竞速。


工信部等机构发布的报告显示,中国AI大模型专利申请总数已突破4万件;近上半年,国内参数规模超十亿的模型就有79个。


AI大模型带来的机遇到底有多大?


在28-29日36氪WISE2023 商业之王大会上,两位身份横跨科学家、企业高管、创业者的AI老兵,给出了同样的判断:


大模型产业机会比移动互联时代多十倍。


他们分别是创新工场董事长、零一万物CEO李开复,中国工程院院士、清华大学智能研究院(AIR)院长张亚勤。


这两位已经跨越过互联网行业周期的行业老将,是共同建立微软中国研究院的战友,亦是AI行业发展的亲历者。


经历漫长的AI行业求索后,他们的人生选择上走向了不同的分叉口:李开复投身于AI 2.0时代的滚滚创业热潮;张亚勤致力于为国家培养顶尖产学研人才,站上清华的讲台。


时至如今,在对AI行业的思考上,他们有什么新的思考和看法?36氪CEO冯大刚以《AI的时代重构》为主题,与他们进行了对谈。


以下为对谈,有删减:


机会,比移动时代至少大一个数量级


冯大刚:特别高兴有机会跟两位中国标志性的商业、研究界的顶级人物,请教AI方面的问题。最近有什么事情让您觉得比较兴奋?什么事情让您又比较焦虑?


李开复:最振奋就是大模型时代是有史以来最大的科技革命,因为这个理由,我才决定自己必须参与,完成我大学时候的梦想,就是让AGI(通用人工智能)时代来临。


另外就是我们公司零一万物的发展还是相当好的。我们在几周之前发布了全球领先的Yi-34B大模型,而且无论是开源还是闭源,34B参数这样的尺寸非常适合使用。我们是全世界最好的,没有之一。很短时间内能做出这样的结果,我感觉非常开心。


谈到焦虑,创业者永远有,但是机会大于焦虑。焦虑就是整个行业太卷了,包括中美的挑战和美国最近对芯片的措施对这个行业影响的大小。但是整体AI 2.0行业的趋势和在中国我们把这件事情做好的可能性,长远看我还是非常乐观的。


冯大刚:亚勤老师,您也有漫长辉煌的职业生涯,学者、企业高管、投资人、创业者,您的多个标签中,今天您最认同的是哪个标签,这个标签下的兴奋和焦虑是什么?


张亚勤:我现在就是一个老师,更多的我希望是创新者。现在我最兴奋的就是,人工智能大模型的时代到来。相较于过去PC互联和移动互联时代,这是一个拥有全新范式的时代。


我原来在微软做操作系统,当时Windows和Linux创造了一个大的PC时代经济,而在移动互联时代,安卓和iOS又创造了一个十倍大于PC的生态。现在大模型/基础模型是人工智能时代的操作系统,在这个大的生态下,机会比PC时代大两个数量级、移动时代大至少一个数量级,所以我很振奋。


我觉得我们的创新机制如果分成三个阶段:0到1,1到100,100到无穷大。我的焦虑就是我们怎么样能有更多原创的、从0到1的、实验室能做出的全新的东西。我们在学校的使命是做出有创新的科研。


再讲一下大模型闭源和开源,我觉得我们需要更多的开源模型促进整个科研。最近发布的几个模型都是基于开源模型之上或者做微调,或者在垂直领域方面有更多的发展。



世界大厂基本停止写论文了


冯大刚:现在有一种观点中国企业是不是过于依赖海外开源模型了。两位怎么看这个问题?什么是中国好的创新,什么是不好的创新?


李开复:首先我不会特别使用这样的一个词“外国的开源”,开源本身就是全世界的事情。零一万物Yi-34B大模型取之于开源,也贡献给开源。


虽然我也很乐观,也同意亚勤的看法,觉得移动互联网是比PC大很多倍新浪潮。但是这次AI大模型有一点不一样的地方就是,不是中国的大厂,而是全世界的大厂,包括OpenAI和Google,他们基本停止写论文了,他们很久没有贡献在开源社区了,他们应该是看到了垄断的机会。


如果全球其他做得好的大厂也好,创业公司也好,不能够改变这样的一个局面,如果在这么重要的科技革命来临的时候,某一个美国大厂真的垄断、统治了,这对全世界的用户、开发者、创业者来说都不是好的事情。所以我觉得全球应该携手在一起,把自己能够贡献的都分享出去,开源如果有什么比较好的技术也可以参考合作。


所以我认为开源是现在大家必须要做的。当年,Windows和苹果是垄断操作系统的,但是Linux出来以后,再加上安卓和其他开源系统,倒逼且改变了当时的格局。Linux带给我们特别大的福利和帮助,也将技术变革的权力扁平化赋予了所有想参与IT革命的每一个创业者。这次AI和大模型时代,开源扮演的力量也是非常重要的。


我们必须坦诚,模型一定是越大表现越好。开源的社区主要以教授、学生、创业者、个人爱好者为主,当然也包括一些青睐非大厂模型的公司。但主要成员都不是最有资源的,所以一定还会有更厉害的闭源模型。我们必须要支持公司一定要做一些闭源的事情,不然靠做公益不能赚钱,也就没有充足的“弹药”投入更多的技术创新。


所以我们一方面把现在最好的模型贡献给开源,另一方面还要用闭源的方式做更大更好的模型。相信也会有一天,更大更好的闭源模型我们也可以开源,然后再做更大更好的模型。


张亚勤:看一下IT的历史,闭源的商业模型和开源的学术模型都扮演不同的角色,以后都很重要。当模型规模大到一定程度的时候,比如达到了万亿参数,现在称为前沿模型,这时候我们对大模型带来的风险、治理都要有更多的关注。我自己最近在花很多时间做这方面的学习,这个不管对于开源还是对商业闭源都是同等的重要。



AI能做的,比人类多1万倍


冯大刚:AGI真的可以实现吗?中国现在是发展AGI好的时机吗?


李开复:我做AI不止35年,做了40多年了。我从读本科大二的时候开始做自然语言和计算机视觉,博士也是做的机器学习。当时我最大的梦想就是AGI,当时申请博士的时候写的作文就是AGI,一方面我希望能打造超人能力的AI,另一方面从此了解人的思考跟大脑是怎么工作的。


之后从我的母校卡耐基·梅隆大学,再到苹果,再到微软和谷歌,我都一直做跟AI相关的事情。AGI目前离我们很远,但是AI可以创造巨大价值。2012年,创新工场投了第一家AI公司旷视,之后创新工场又投出了十多家独角兽,至少2家上市,还有几家准备开始排队。我们对AI一直抱着热情投入。


可是对于AGI来说,过去3年才看到可能达到AGI的浪潮。先稍微定义一下AGI,它能够不断地快速学习成长,只要有更多的数据和更多的GPU,它就一年变得比一年聪明,自我学习自我成长。这样的一个技术是人类从来没有见过的。在成长过程中,它肯定在95%,甚至有一天在99%的工作任务上都会超过人类。我们可以把这个定义成接近AGI。


最后剩余那1%到5%,是我们的感情?还是自我意识?还是我们的所谓的创造力?这个今天还蛮难下定义的。因为可以看到之前很多人认为AI是没有创造力的,或者很难有真正的、很大的创造力,现在看来并不是如此。


也有很多人认为AI是没有自我意识、没有感情的,今天依然如此。但是AI可以学会一种表象,让它们看起来貌似有感情。所以慢慢的,剩下来的一些人类所能做,AI不能做的事的比例就会越来越小,是小到5%还是小到1%,其实已经不重要了。


重要的是,这95%到99%人类能做的事情,AI能做得更好,它可能会给社会带来什么问题,给社会带来什么价值。除了这95%到99%之外,AI还能做很多,比人类能做的事情多1万倍,这个肯定会为人类创造巨大的价值,当然也会带来风险。我们怎么拥抱这个技术,能降低它对社会产生一些害处的概率,这是我们需要注意的。这1%到5%到底哪天能克服,是其次的问题了。



研究层面确有很多从0到1的工作去做

数据、算力,是我们的优势


冯大刚:我们今天看到主流大模型训练的三种范式都来自于美国,如果我们用美国模型的话,是不是不可能超越美国?另外一个问题,中国是不是一定要超越美国而自己独立研究出大模型训练范式?


张亚勤:的确,现在三个主流架构、主流的GPT、自回归模型等都是在美国产生的。下面的这五年,整个架构肯定会有一个大的变化。因为现在最新的模型效率还是比较低,从耗能到对算力的要求,决策的效率、包括激活的方式,还有高昂的价格。


目前大模型的商业模式其实是有问题的,模型的参数规模越大,特别是在大规模使用的时候,用得越多亏得越多。当然这是暂时现象,大模型的效率肯定至少要有一个数量级的增加。


同时一些新的算法一定会出现新的架构,我们希望是在中国出现,我自己希望是在清华出现。目前在研究层面的确有很多从0到1的工作需要去做


但我觉得,目前研究需要的数据、算力,是我们的优势。另外我也同意开复讲的,现在的大模型特别是GPT类型的大模型开启了我们走向AGI的一个通道。GPT-4出来之后能力很强,但还没有到AGI。接下来十年、甚至更短的时间,我们可能达到开复所定义的AGI。


很多时候媒体讲的“AI有自我意识,就会替代人类”,我不认同。AGI就是大部分任务比人类做得更好,包括脑力和体力。另外它有自我学习、自我进化,包括我们现在讲的自主智能的这些能力。我当时看到ChatGPT的第一感觉是,这是人类第一个通过图灵测试的智能体。当然外面有一些不同的意见,但至少我认为我们已经找到了其中的一个通道。



用户体验改写,商业模式颠覆

变化不是特别遥远,可能5年或更长周期


冯大刚:从今天AI的水平到未来的AGI之间,我们下一个技术跃迁可能是什么样的?下一个类似于ChatGPT这样的现象级产品可能是什么?


李开复:当下最大的需要解决的问题就是刚才亚勤所说的,模型越大能力越强,但是模型越大越贵,用起来推理成本也会太高。从我们建零一万物第一天就看得很清楚,怎么把手中的算力做好,把推理成本降下是最重要的。


我们相信这是平台级的应用,相信像过去一样移动互联网必须由3G、4G支持,需要有安卓、iOS和其他操作系统作为它的支撑,我们一定要把这样的一个能够真正实现、成本不太高的训练和推理,但是又能达到相当大的模型尺寸,也许经过压缩等方法实践出来。这是短期每一个公司都要做的,我们要把这个当作当务之急。


再下一个阶段我们看到的竞争白热化的就是多模态。我们人类的学习不是全部看文字,而且我们是通过视觉、触觉和我们的理解,才对真实世界有更深的理解,这正是多模态所涵盖的领域。


我们可能刚开始会把图片、视频、声音、语音输进一个已训练好的文字大模型,这是第一步。再下一步,是把多模态的数据彼此训练,我们文字大模型也可以进步,成为一个巨大的多模态大模型。再往下可能有一个世界模型,这样才能带来结构化的学习。因为文字本身是一定程度自带结构的,但是视频和图片是比较零散的。


另外,同样会发生的就是Agent领域(自主智能)的技术,从图形为主的用户界面走向一个代理式的用户界面。因为毕竟我们人类学习计算机的语言多年,当年PC是用键盘和鼠标,手机是用触摸,AI今天学会用人类语言跟我们交流,我们最自然的方法应该是不要自己把每一个任务完整执行,比如我太太周末生日,我要给她订鲜花、蛋糕,我告诉我的AI助理,它不仅能迅速完成任务而且能超出我的预期,这就是终极版的代理式的用户界面


这天到来的时候,会有几个巨大的变革。一个是用户体验彻底改写,我们不再需要那么大视觉的刺激,或者是输入。我们讲一句话它说OK做好了,就跟一个超级特助一样,能帮你把事情做好。第二就是整个商业模式都会被颠覆,这样一个助理就取代了今天很多商业模式。这些变化可能还需要5年或者更长的周期,也不是特别遥远,我们是可以期待的。



大模型的六大趋势


冯大刚:开复老师从可用性、易用性讲到了未来的变化。张亚勤老师呢?


张亚勤:讲一下大模型未来的六大趋势。


第一个就是像开复所讲的跨模态,多模态,和多尺度大模型:新的大模型包括自然数据,也包括从传感器获取的信息。


第二个是新算法框架:我们需要新的算法来提升当前的大模型效率。当前的大模型稠密激活,计算效率远低于人脑,且商用成本高昂,甚至模型用的越多亏损越多。人脑是效率最高的智能体,它有860亿个神经元,每个神经元有几千个突触,却只有不到3斤重,耗能20瓦。从这个角度来看,人脑的储存量,计算量和能耗效率之高,是目前任何大模型都无法比拟的。我们需要新的算法体系,稀疏激活网络、效果更优的小网络等来提升模型使用效率。


第三个是自主智能:模型正在成为一个代理(Agent),自主规划任务、开发代码、调动工具、优化路径、实现目标,包括N+1版本的自我迭代、升级和优化。


第四个是边缘智能:大模型需要很多算力和资源,如何在边缘和设备终端实现高效率、低功耗、低成本、低延时地部署是一大关键问题。


另外两个很重要的就是物理智能(具身智能)生物智能,比如把大模型和我们人的大脑相连,生物体相连,未来智能是信息智能、物理智能和生物智能的融合,能力十分大,风险也很高。



最挣钱的模式应该来自应用

To B的业务会比较有挑战,会比较红海


冯大刚:据说OpenAI去年收入达到13亿美元,每个月就有1亿美元。您觉得这是大模型创收的高峰还是只是开始?中国什么时候有一个大模型厂家能达到这样的收入水平?


李开复:要做一个科技公司,绝对不能不关注自己的收入、成长和未来的利润。我觉得一个高科技的公司,刚开始可以说自己有多少博士,写了多少论文,拿了多少第一,但是不能作为商业模式的验证。在投行,能够看到数字,才能说是这是家真的知道怎么做商业运营的公司。做不到这点的,都很难成为一个伟大的公司。我们可以看到,微软、Google,包括中国的阿里、腾讯都是受过这样的考验的。所以我觉得OpenAI今天十几亿美金的收入,一定程度是验证了这样的技术是有商业前景的。


但是长期来说,能不能只靠AGI收费打造一个类似云的业务,这个要完全看业态。因为如果Google跟它打价格战的话,可能就会造成两边不断的降价,把这样的一个本来可以溢价甚至有盈利的商机打成一片红海。所以我觉得是有一定的风险的。


最终我们还是要相信,最挣钱的模式应该是来自于应用。应用有To B跟To C的可能性,我们的分析是,To B的业务会比较有挑战,会比较红海。这不代表我们认为不可能造出一个很厉害的To B大模型公司,我们也很乐于见到。只是如果回去看当年的计算机视觉,在某一个城市可能能拿到几千万的单子。但是之后就出来了一大批“四小龙”和一大堆“小小龙”去竞争,几千万的单子“打折”成几十万,最后卷到大家都赚不到钱。


这个问题怎么化解?因为今天不是“四小龙”,而是“百模”,就算有一部分不能存活也是“十模”以上。每次有一个大银行保险公司招标,大家就靠竞价的方式去不赚钱拿到单子,这样一个惯性会把AI往系统集成商的方向去做。我觉得是很有挑战的,怎么破局会成为To B商业上最大的问题和挑战。当然我们也不排除某一家公司创造了巨大价值,让B端公司愿意溢价付费,这可能会破局,但是短期有一定的难度。


另外就是TO C的方向,机会就是可以用AI和它对齐的能力做出很多有意思的应用。从娱乐到电商到生产力工具,用它制作文件、设计图片,甚至制作视频等等,机会很大。但是它的挑战就是它有“幻觉”,它会犯错。降低“幻觉”有两个方法:一个是靠技术或者更大的模型,或者用新的技术去控制它;另外一个方法是挑一些对“幻觉”不敏感的领域,比如“幻觉”在小说或者电影里就会变成一个创意,这也是可行的。


所以毫无疑问,大模型带来的短期机会,一个就是它能生产内容,AIGC帮我们用更少的时间有效生出更多更好的内容,得到商业回报。另外一个就是类似图灵测试,做类人的应用,像数字人是不是也可以有很多用途。所以我们零一万物在To C上会花更多精力,To B我们也会帮助同行杀出一条血路,找到非常好的付费模式和商机。


张亚勤:我们看OpenAI的时候不要忘了微软,微软给OpenAI投了130亿美金,它用的几万个GPU在微软云上。长期来讲肯定有独立的商业模式,短期还是要靠一个大型公司、一个金主。


另外一点,我为什么要拿操作系统做比喻呢?现在的基础大模型十分重要,它会像移动时代的PC和操作系统一样,上面有很多新的机会。比如最近发布的GPT 4.0 Turbo,你甚至可以定制自己的GPT,然后在上面做自己的应用并售卖 ,这以后一定会有很好的商业模式。但是更大的机会在垂直领域的模型,和基于大模型的各种各样的应用,就像曾经移动互联网上的应用,Super App可能有更好的机会。


所以我们需要大模型,但是不需要那么多,更大的机会是在垂直领域、具体应用的模型,这样的模型可能更多,而且有更大的、可能是上百倍的机会。PC时代我算了一下,操作系统挣1块钱,生态是赚17块钱,移动我没有算过,因为安卓免费不好算。我想,AI时代这个比例一定会更高。



“百模大战”两三年后见分晓

未来20年是人工智能时代


冯大刚:李彦宏说未来不需要很多大模型,但是需要很多应用,比如超级App、超级电商,很多行业会在大模型上重构一次。


张亚勤:横向大模型要靠公平的市场竞争,会有大公司,也有一些创业的公司,这个可能两年、三年之后会见分晓,最后可能会有5个、10个在百模大战脱颖而出。


而且一定要给初创公司机会,我们很多0到1的创新,1到100的创新是初创公司做的。微软和谷歌当时也都是初创公司,包括现在很出名的OpenAI、DeepMind等都是初创公司,所以我们不能假设现在的大公司就一定主宰未来,时代变化的时候一定会有新的公司出现。


冯大刚:创业公司更善于使用AI,所以可能会颠覆另外的大公司。我们看人类历史,比如历史上的首富一开始是做能源,然后是做运输,后来是做金融,后面是做互联网的,您觉得下一个世界首富会不会做是一家AI公司的?


张亚勤:我觉得一定是,我认为未来20年是人工智能时代。开复就正在实践。


李开复:这肯定是高风险、高回报的机会,我们看得很清楚,但是“百模大战”站出来,最后能继续做大模型,或者创造巨大价值的公司也不会很多。但是我觉得,今天每一个参与这个领域的人都是值得尊重的,因为我们看到,这件事情很难,但大家依然往前走,因为看到的是对人类而言特别巨大的机会。


而且所有的技术在萌芽的时候,几乎都是美国领先。但是一旦技术开始被理解了、开始成熟了,中国是有机会能够后起追上的。所以在中国能做大模型是有很大的双重意义的。



AI场景落地:

1年之内看到1-2个Super APP?


冯大刚:几年前两位老师对AI怎么落地都做了预测,比如张亚勤老师提到AI在医药领域的落地,开复老师也提到过AI在多个场景的落地,两位老师前三名最看好的是哪些场景?多长时间?


李开复:一年之内我们会看到至少1个到2个Super APP,比ChatGPT更让我们惊艳。


张亚勤:我想5年吧。第一个是自动驾驶和机器人方面会有一系列的公司出现。因为大模型解决了一个特别关键问题,就是它有一些关键共识和常识。我们过去和机器人对话的时候,觉得常识的问题很难解决。包括自动驾驶、无人驾驶,有一些corner case、长尾问题难以解决。所以大模型会有很大的推动作用。


第二个就是生物医药方面,我觉得未来5年也会有一个大的提升。但是目前运用最多的是在生产力、在To C领域,未来To B有很大的前景。


AGI时代什么时候到来?


冯大刚:开复老师您觉得AI是否能让人类变的更幸福?比如人类的贫富差距会变得更小吗?


李开复:我相信,最终人类会走向“丰饶时代”,但是要经过10到15年很巨大的动荡。因为AI从正面来说,把我们从重复性工作中解放出来,让我们找到人类真正存在的意义,这是非常巨大的机会。


但是短期来看它会取代很多工作,取代工作这件事情本身,我想对每一个人来说都是非常负面的事情。


所以我觉得,未来10到15年,全世界每个人的工作可能都会拥抱AI,让你有十倍的生产力,或者被AI取代,面临失业的问题。我觉得一旦这个问题我们能够好好地化解度过,毕竟AI取代了工作,还是给社会创造了财富,甚至更多的财富。所以有可能未来世界会丰衣足食,我们不用再担忧饥饿、贫穷的问题,未来可能每个人有更多的时间做自己想做的、适合做的事情,不必浪费时间做重复性的工作。


冯大刚:我们希望的AGI时代什么时候会到来?等待的时间里,我们普通人应该做什么?


张亚勤:我不知道,我觉得可能10年,也可能20年,具体时间我不清楚。但我觉得首先最重要的一点就是,我们要有我们自己的观点,要学会怎么问问题,怎么去追问,对每件事要有自己独特的观点。另外就是一直保持学习。现在我每天都要看新的东西,包括要读论文,5年前学的东西已经没有用了。


我觉得人类一定会越来越幸福,未来20年的人类是一个新的物种,是Human Intelligence + Artificial Intelligence,像我们看山顶洞人,或者是我们看100年前还没有手机没有电的时候的人类,是不同的物种。所以未来人类一定会更加的幸福。我们也不需要工作5天,可能工作1天或者2天,我们早期工业革命刚来的时候是工作7天,后来到了6天,然后5天,现在欧洲已经4天。


所以我觉得以后工作会变少,人们会花更多的时间做自己更享受的事情。我是乐观主义者,我们看看这演播厅里所有的创新,都是技术带来的创新,都是乐观主义带来的,悲观主义是没有未来的。


素材来源官方媒体/网络新闻
继续滑动看下一个
元界
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存