其他
闭关一年创业大模型,姜大昕站在AGI呼啸的风中
The following article is from 智能涌现 Author 周鑫雨
文|周鑫雨
编辑|苏建勋
来源|智能涌现(ID:AIEmergence)2024年2月,在准备一场分享会的PPT中,前微软全球副总裁、如今的阶跃星辰CEO姜大昕,把他看到的一句评论放进了自我介绍:“在微软混得风生水起,怎么想不开创业?”从位于北京丹棱街5号的微软大厦,走到阶跃星辰如今的办公地点,只需要10分钟。但从加入微软到创业,姜大昕用了16年。形容自己为“极端i人”的姜大昕,16年来极少出现在聚光灯下,但他主导研发的产品,是大众耳熟能详的微软搜索引擎Bing、智能语音助手Cortana、微软云Azure,以及办公全家桶Microsoft 365。作为微软亚洲互联网工程研究院(STCA)的副院长和首席科学家,姜大昕又是一位极具人才号召力的学者。在数据挖掘和自然语言处理(NLP)领域,他在顶刊发表了近200篇论文,如今与他并肩创业的,还有曾任字节跳动总监的朱亦博,以及出身微软STCA的焦斌星。这是姜大昕创业后首次接受媒体采访,在和“智能涌现”两个小时的交流中,我们几乎没有按照既定的采访提纲走,在姜大昕身上,感性和理性有着平衡的配比,这让我们的聊天变得尤为有趣。姜大昕会记得那些对他影响深远的生活碎片。谈及从微软出走创业,他引用了大学好友的一句话“这个世界上每天刮很多风,但这个风刮到你家门口,一辈子就那么一两次”;说到GPT带来的冲击,他形容自己:“感觉整个世界在我身边呼啸而过,留下自己在风中凌乱。”当然,他也有技术高管对所从事领域的严谨:讲到AGI怎么推动,他立刻展示了自己画的PPT和路线图;提到训练数据的来源,他能脱口而出全球网页的总量,以及中文语料在全球的精确占比。姜大昕给公司规划的路径,是摸着OpenAI的石头过河,走一条“单模态—多模态—多模理解和生成的统一—世界模型—AGI(通用人工智能)”的路。姜大昕为"智能涌现"展示的AGI路线图。拍摄:苏建勋他提到,很多OpenAI的信息看似杂乱,实际上就是沿着这条脉络去发展:Sora的发布,是为了迭代多模生成的能力;投资机器人公司Figure,是为了布局具身智能;首席科学家Ilya带队人类对齐项目Q*,则是为补足System 2(大脑的复杂任务规划能力)而准备。“不能只看OpenAI的形,要看神。”姜大昕对“智能涌现”总结。相比其他大模型玩家的高调入场,阶跃星辰在过去一年几乎隐形,但事实上,阶跃星辰的入局时间并不晚。据“智能涌现”了解,阶跃星辰早在2023年年初,就拿下了多家顶级VC的投资;这意味着在资本抢跑的时间点,围绕资金、人才、数据等维度,阶跃星辰的储备不会逊于任何一家底层模型厂商。在过去喧嚣的一年中,阶跃星辰选择埋头研发产品。2023年7月,团队正式开始训练模型。两个月后,综合性能超过GPT-3.5的千亿参数大模型Step-1落地;11月,千亿参数的多模态模型Step-1V又告成。在2024年3月23日的全球开发者先锋大会上,阶跃又给出了语言大模型Step-2的预览版——这也是国内初创公司,首次交出的万亿参数模型的答卷。“同行都在曝光狂奔的状态,你会焦虑吗?”我们把这个疑惑抛给姜大昕。“不会。我觉得把门关上来奔,可能奔得更畅快一点。”姜大昕说。大模型创业团队中,最不缺的就是AGI信仰者。王小川通往AGI的途径,是盖一幢不同垂直模型的“模型大厦”;月之暗面的杨植麟,则押注了长文本。姜大昕对AGI的态度是?他认为,孕育出GPT的Transformer架构,只能到达世界模型,但到不了AGI。“就像Sora融合了Transformer和Diffusion,AGI一定是不同模型的融合。”遵循Scaling Law(规模定律)堆参数的下一步,姜大昕觉得,模型需要真正融合多模态的生成和理解能力。两个小时的访谈结束得有些匆忙,姜大昕在接到一个电话后,匆忙和我们告别赶赴下一场会面,离开的时候,我们看到姜大昕办公室门牌上的符号——那是一个他手绘的Logo。后来得知,它的灵感来自阶跃函数(Step Function)——神经网络中最早的激活函数,用折线图表示时,就像往上攀登的一级台阶,这也成了公司的名称和Logo。访谈开始前,我们问了姜大昕文章开头的问题:“在微软混得风生水起,怎么想不开创业?”“我们从来没说要做一个小公司,我们就是奔着AGI去的,不然我们这些人聚在一起干嘛呢?”姜大昕告诉我们。以下是“智能涌现”与阶跃星辰创始人、CEO姜大昕的访谈内容:
把门关上来奔,可能奔得更畅快些
智能涌现:我们看到资料,阶跃星辰成立的时间是2023年4月,具体是什么时间开始筹备的?姜大昕:起点大概在2023年春节那会儿,可能会更早一些。2022年底,我就开始考虑两个选择,一个是留在微软,还有一个是出去创业,但没有最后下决心。到了春节的时候,ChatGPT变得很火,那时你每天都被很多信息包围,我就有点坐不住了。微软的文化是追求科技进步,但是它是大公司,有既定的发展战略,在一个方向会走得非常远,很难说我个人决定要干什么;我觉得这一轮属于划时代的变革,大概是过年的时候想清楚,应该自己出来创业,就开始找人、找钱,开始注册公司。以前有一个报道说我离职创业,底下有人评价:“在微软混得风生水起,怎么想不开创业?”我可以用同样的问题问我们核心团队的每一个人:在大公司都混得挺好,为什么要创业呢?智能涌现:微软很多同僚都在这波浪潮出去了,比如Harry(沈向洋)南下去了IDEA研究院,周明成立了澜舟科技,梅涛离开京东成立了HiDream.ai。身边这些人的动态,对你来说会不会也是一种刺激?姜大昕:会。微软出去创业的人也不少,创业人之间还是有交流的,我多多少少也受他们影响。包括我大学同学也有创业的,他在2022年底和我说的一句话,我觉得挺好玩:“这个世界上每天刮很多风,但这个风刮到你家门口,可能一辈子也就那么一两次。你不用顾虑,风来的时候你就上车,先上车再说,都不用想得很清楚”。当然我没有他那么极端,但我记住了他的话,“风刮到你家门口,一辈子也就那么一两次”。在那之前有元宇宙、Web 3、区块链,这些东西都很火,微软内部也在做,但就没有那么触动我,让我觉得一定要亲身去做。智能涌现:大模型为什么能让你那么心动?姜大昕:最初看到ChatGPT的时候,我就随便问了两个问题。第一个问题是“How old are you?(你几岁了?)”,这个问题实际上是一个坑,因为一般Retrieval Based(基于检索)的聊天机器人就会瞎答,一会儿说9岁,一会儿说10岁。有些表现好一些的聊天机器人,事先就内置了一条Rule,用户随便问,回答都是16岁。但它的回答和以前完全不一样。我记得它说:我是2019年训练完的,今年是公元2022年,所以我3岁。我不死心,又问了“你明年多大”。这个问题放在以前是能“搞死”所有聊天机器人的,没有一个答得对。这个问题的难点在于要理解明年是“今年+1”,然后再把数字代进去算一遍,这个减法的过程就是推理。它又回答出来了。智能涌现:当你看到ChatGPT的效果,你做的下一件事是什么?姜大昕:跟它对话当天我是很懵的,就觉得怎么可能?它一定在作弊!后来我把所有相关的paper都拿出来重新读了一遍,最开始的时候是GPT-3的研究,后来是看InstructGPT(OpenAI基于GPT-3微调后的模型)的论文,最后我再回过头来看Scaling Law,看涌现能力。把所有的东西拼起来后,我就觉得没有那么神奇,就能想明白ChatGPT为什么能做到1750亿的参数,怎么用Pre-train(预训练)加上这套东西。后来这件事情为什么我要亲自去做?纸上得来终觉浅,觉知此事要躬行。我想我自己也能做,没准还能做得更好。智能涌现:1750亿的参数、Pre-train的方法,在几年前还是非共识性的东西,现在已经变成了所谓的第一性原理。在几年前,OpenAI首席科学家Ilya Sutskever提出这些的时候,很多人觉得他是疯子。姜大昕:是的,那时候我也和国内一些研究员聊,包括早期和智源研究院的学者们。2020年GPT-3出来的时候,国内已经聊得热火朝天了,我们在微软也是,但聊完之后觉得这东西又大又蠢,还不如BERT好使,我们就耸耸肩膀继续搞BERT去了。因为我们当时做产品,我们知道GPT-3从研究的角度是个划时代的东西,因为它第一次做到了通用。但是我们觉得这个东西没做好,比如用在搜索上,它比BERT差远了。智能涌现:从决定要创业,到正式注册公司的4个月里,你做了什么?姜大昕:当时我觉得还缺人。团队的构建我们叫做“铁三角”,就是系统、算法和数据。我自己可以负责算法,但我们至少缺一个做系统的,一个做数据的。做数据还好,我们搜索引擎团队负责搜索排序相关性的leader,焦斌星,主动找过来跟我讲:搜索做不下去了。他找到我后,我跟他聊了大概两个小时,我发现我们想法一样,就觉得上个时代已经结束了,搜索已经做到头了。找做系统的人我们花了很大周折。算法搞定了只是一方面,最后还要能把系统搭起来,而且要是一个高性能计算的系统,这个非常重要。而且当时我们觉得千亿参数肯定不是重点,至少要到万亿,甚至十万亿。参数一旦上去,系统就非常重要。但是我又不是做系统的,我通过好几个人,最后找到了朱亦博。他以前也是微软亚洲研究院的,当时在谷歌。我和他聊,发现他也要做大模型,而且他是真的做过万卡,还不止做过一次。他问我,万卡实在是没挑战,我都做两次了,你们要干嘛?我说我们要搞AGI。我又说我们是一个创业公司,万卡当然要做,我们的系统和算法能够紧紧绑在一起,来我们这儿你可以天天和算法同学talk。他一听这挺好,后来他就在我们这儿做系统负责人。智能涌现:系统对于大模型的关键之处在哪里?姜大昕:算力是什么?就是拿到几千几万张卡,顶多组成了一个个机器。当参数达到千亿、万亿量级的时候,有三个东西在权衡,一个是计算,一个是内存,一个是通讯。如果按照先计算、后存储、再通讯出去的流程,那就太慢了。系统就是在三者中间取一个平衡,让三者并行,提高算力的利用率。另一方面,一万个人指不定还有人头疼脑热,上万台机器运行,有机子坏了很正常。机器坏了之后怎么做到不影响全面?系统能够将任务自动迁移到好的卡上,自动拉齐,然后重新去计算。这个过程人是无感的,这也是一个很强的技术活,你得感觉到它哪里坏了。智能涌现:团队是怎么磨合的?姜大昕:如果读博也算职业生涯的话,我们几个第一阶段都在做研究,博士毕业后有的在研究院待过一段时间,有的直接进了产品组,在里面做了大概10年。大家既有研究的视角和思维的深度,又有一线做产品的经验,同时还有管理几十人到几百人的团队,管理经验很丰富。所以他们几个人过来之后,我可能在大方向上会跟他们一起讨论,但具体到执行方面,他们比我懂,不需要我告诉他们该怎么做。反倒是我被信息包围的时候,我还要问他们,你告诉我这个东西到底是怎么回事,该怎么做。智能涌现:现在团队有几人?姜大昕:150人左右。智能涌现:你怎么看这个规模?姜大昕:大模型不是人海战术,OpenAI提了个词叫做“人才密度”,说的就是整个公司不用太大,但是人才密度要高,每个人都要A-class,组建一个精英团队。我也很赞同这个说法,金字塔尖的几个人的高度,决定了整个模型的高度。不是说你有100个人就一定能干掉10个人。如果100个人的高度远不如那10个人,你的模型就是上不去。智能涌现:所以阶跃现在的团队构造是什么样的?姜大昕:前端+后端,前端就是产品,后端就是模型。智能涌现:在2023年一整年的时间里,很多公司在刚成立的时候就已经高调对外了。阶跃一年之后才正式对外释放一些信息。同行起码都在展现狂奔的状态,你会焦虑吗?姜大昕:我一点都不焦虑,我们也没停,我们也在狠狠地奔。而且我觉得把门关上来奔,可能奔得更畅快一点,省了很多干扰和关注。在这段时间我觉得我不需要从外界获取什么,我很清楚我要做什么,我们的路线图很清晰,团队也都ready。我知道路线图是正确的,我就往前走。所以我们的速度其实很快,只是我们没有对外发布。具体而言,我们从2023年7月1日开始训练千亿参数模型Step-1,8月底训完了,一次就成功。GPT-3.5是个分水岭,后面很多人就爬不上去了
智能涌现:2023年是神奇的一年,前有疫情的放开,大家沉浸在乐观的情绪,但后又有投资行业的下滑,这意味着融资的窗口期很短。所以年初那么多模型公司踊跃露面,也会有钱的诉求和人才的诉求。姜大昕:大家的焦虑我能理解,而且我特别同意上半年乐观,下半年悲观。但上半年大家为什么乐观?因为大家经历了和我当时一模一样的阶段,GPT-3.5出来的时候很震惊,后来发现几个月我也做出来了,没那么了不起。但他们没有看到后面还有很长的一条路要走。往下,越来越多的人做到GPT-3.5,再往下应该怎么做?不知道。然后全世界都在追赶GPT-4,又不知道该怎么追赶,也追不上,就开始慢慢悲观了。这次看到Sora以后,很多人觉得“这个差距是不是越来越大了”,就开始质疑这件事。怎么落地?怎么商业化?大家觉得不知道该往哪走了。智能涌现:你悲观吗?姜大昕:我们不悲观。我觉得GPT-3.5就是个起点,是个拉力赛的热身。后面需要长期走下去,Scaling Law一直往上走。每走一步、参数量每一个数量级的提升,换来的都不是线性增长。其实GPT-3.5的资料是很多的,但GPT-3.5之后是个分水岭,这之后所有的信息都封闭了。你看GPT-3.5,OpenAI还是发了paper,如果他们不发paper,我觉得大家还会懵很久。前几天也有人判断GPT-3.5会是一个分水岭,最后国内有决心、有能力走到万亿的大模型企业不会有很多。智能涌现:阶跃的Step-1对标的是GPT-3.5,训练一次成功的策略是?姜大昕:我还是那个观点,GPT-3.5不代表什么,它就是个热身,它是个入场券。GPT-3.5的算力用两三千张A800就可以搞定,数据用公开数据也可以搞得定,算法层面LLaMA这种开源架构已经有了。这些条件,在InstructGPT的paper等材料里都写得很清楚了,你老老实实地复现一遍,基本就能达到。智能涌现:Step的效果怎么样?姜大昕:那个时候国内已经有一些模型了,我们内部评了一下,在榜单上我们能排前三。但我们选择不发布,因为我们觉得这就是一个起点。我们后来做了两件事情,一个是开始做多模态,之后2023年11月我们的多模态模型也做完了。另外一个事情是,我们开始积聚能量做万亿参数的大模型,但万亿的准备时间很长。智能涌现:准备万亿参数大模型所积聚的能量指什么?姜大昕:还是算力、系统、算法和数据。算力差不多要达到等效A800的数万卡集群,而且卡一定要放在一个集群里,因为一旦跨集群,它的通讯就跟不上了。智能涌现:数据呢?来源是什么?姜大昕:现在大模型的中文语料是非常匮乏的,大家如果用公开语料库,一般用Common Crawl,简称“CC”的数据集。但里面中文语料只占5%,其中90%是垃圾数据,真正能拿来训练的最终只有0.5%。要解决中文语料不足的问题,第一点,你要有全球视野,用全球互联网上高质量的语料来弥补中文语料的不足。全球互联网大概3亿个网站,质量也参差不齐,只有100万个网站的质量是可以用来训练大模型的。这100万个网站在哪?是谁?这个只有搜索引擎公司知道,我们会根据权威度为每个站点打分,相当于有了一个索引。第二点,即便是高质量网站,质量也参差不齐,所以最初网页需要清洗、去重,这需要一条流水线,而且这个活非常细,因为不同的网站内容都不一样。这是搜索团队的基本功。目前国内语料严重不足,但我们团队有做Bing的经验,覆盖的是全球的网站。智能涌现:如果为了做中文语料,搜狗和百度的中文语料会不会更好一些?姜大昕:大模型对语言不敏感。对它来说,不同语言只是一种编码,现在大模型的翻译做得非常好,不管你用哪种语言喂给它,再让它用中文吐出来,没问题。智能涌现:不少公司都会强调他们在中文语料里的积累非常强,所以这个逻辑站不住?姜大昕:没有那么大差别,不是说你有90%的中文语料,而我只有30%,你就比我好3倍。他们更好的是诗词这些从英文语料上不能获得的中文语境。但比语言更重要的是获取高质量语料、知识的途径。现在全世界大多数的知识还是在英语里。智能涌现:那么在算法层面,阶跃采用的是Transformer架构吗?姜大昕:是。智能涌现:之前智谱AI的CEO张鹏就说,中国如果延续Transformer架构,是永远超不过OpenAI的,毕竟人家有先发的积累。你怎么看这个观点?姜大昕:长远的看是正确的。甚至我觉得要实现System 2,用的应该不是Transformer。比如我们要实现生成和理解的统一,像Sora的做法就是把扩散模型和Transformer做了融合。Transformer大概能做到世界模型,但AGI不行,至少它得是一个模型和另外一个模型,或者另外多个模型的和。智能涌现:现在国内所有做大模型的CEO都会被问到一个很俗的问题:“你想成为中国的OpenAI吗?”,所以不免俗地也问你一下。姜大昕:对。今天OpenAI出一个消息,大家就开始焦虑,明天出一个,大家又看不懂了。我觉得要学OpenAI的神,不要跟着它出一个这个、出一个那个。我们公司从来没说要做一个小公司,我们就是奔着AGI去的,不然我们这些人聚在一起干嘛呢?不用每个人的想法都高度一致,那反而会出问题。
智能涌现:最近以朱啸虎为代表的“市场落地派”、以杨植麟为代表的“技术信仰派”产生了一些迥异的观点,包括前段时间我们跟王小川聊了一下,他又提了另外的一个面向,你也都有关注对吗?姜大昕:我有关注。智能涌现:你有没有印象比较深刻的观点?比如朱啸虎对这件事情就是特别典型的投资人的思维。姜大昕:我不觉得他们是对立的。一般人都不会绝对地选择我只看现在或者只看未来,多半还是一个长期和短期的结合,而且在不同的时间点可能做的选择也不太一样。智能涌现:它体现了现在大众对于实现AGI这件事情,有的人比较悲观,但有的人又比较乐观。姜大昕:我觉得都有道理,不一定要贴标签,就说投资人都比较悲观、比较短期,其实有的投资人也是比较长期的。前两天我看到一个比喻挺好:现在的AI发展阶段是半杯水,有些人觉得已经半杯了,未来它也涨不上去;有些人觉得现在只是半杯,终究会达到。就看你相信哪一点。智能涌现:你相信哪个?姜大昕:我相信水杯肯定会满,AGI是会实现的。但是在这个过程中,你说我们要去做应用,这也是一定的事情,因为技术和应用一定是要结合的,尤其在大模型时代。我们觉得有两点:一,由应用来牵引模型。我们做的是通用模型,通用模型说白了就是什么都会做,但什么都做得不精,它强调的是通用性,那就需要和应用结合起来牵引这个模型,让它在特定方面做得更强。二,做成应用以后就会有数据的回流。对于人工智能、机器学习而言,数据是非常重要的一方面。在追求整个模型做大、做强的过程中去做应用,是必须的。智能涌现:实现AGI的路径是什么?姜大昕:(他为“智能涌现”展示了一张AGI的路线图)我举个OpenAI的例子。最近OpenAI动作很多,一会儿DALL·E 3,一会儿Sora,一会儿又投一个机器人,一会儿说有个Q*。大家就觉得好像看不清OpenAI背后到底要干什么,他们在下什么棋?是不是有个统一的东西在里面?
阶跃星辰画的OpenAI发展路线图。图源:阶跃星辰
我的股东没有天天问我“商业化做得怎么样了”
智能涌现:团队这么低调,招人都是人传人的方式,在融资上怎么跑赢?怎么说服投资人?姜大昕:我们的团队去跟顶级的VC谈,把我们的认知写成商业计划书。别人问我们要干什么?我们就说我们要干这些事情。我们为什么能干到这些事情?最后选择投我们的人,应该都算是长期主义的投资人,他也觉得这件事情是个铁人四项,要有最优秀的团队聚在一起,而且大家要有路径、有信心往前走,他们也愿意长期地去投资。我们很幸运,已经得到一些理念价值观一致的投资人支持。大家都认可技术和产品才是本质,大模型赛道不应变成一个简单融资PK的赛道。智能涌现:公司融资是在2023年三四月份?姜大昕:对。智能涌现:现在回头看,如果当时再晚三个月去融资,情况会不会很不一样?姜大昕:我很难再回过去看那个时间点,这个很难假设。智能涌现:现在对于你来说最重要的事情是融资吗?姜大昕:是技术和产品。智能涌现:阶跃在产品路径上选择的似乎是To C。姜大昕:这是一个蛮新鲜的尝试性的打法,首先我们有取舍。从大的角度来说,我们目前更多的还是聚焦在模型上。产品我们肯定做,一个是我们需要有产品来牵引我们模型的发展,第二是产品的数据来反哺我们的模型。至于做什么样的产品?首先,我们不想做传统的定制化模型加上私有化部署这样的逻辑,我们还是想保持这个团队是相对比较精英、人才比较集中的团队,类似于OpenAI这样的团队。所以我们选择不做传统意义上的To B,会比较聚焦在To C上。现在在To C层面,一个是我们有自己的To C产品,另外一个是我们在行业中还有一些合作伙伴,比如财联社、中国知网、中文在线。为什么有合作伙伴?因为它们也有很多用户,它们也有To C的场景。我用一个词叫“探索”,和我们的合作伙伴一起在探索这件事情。智能涌现:所以阶跃不碰To B?姜大昕:我们不做传统To B,不做一单单接单的传统定制化和私有化部署。但是我们认为大模型对金融、出版等行业很重要。这些行业的头部企业也有兴趣,说他们有需求,愿意跟你一块去探索大模型究竟怎么落地。首先我们选择的行业不会很多,每个行业挑上一两家就够了。现在每个行业都是选了一家真正头部的,它们有意愿、数据和实力跟我们合作。智能涌现:这种合作的模式是怎样的?姜大昕:比如我们和界面财联社成立了JV(合资公司)。共同训练金融行业大模型,来解决金融行业的一些业务或解决财联社本身To C的问题。财联社也有一个App,我们用大模型探索怎么更好地帮它的用户收集财经信息,提供一些投资顾问等等。我们想要很多的场景,这有点像做一个生态,相当于我们提供基础模型,但是别的企业愿意跟我们合作,各有各的方法,有的可能就是调用我们的模型,有的不光是模型,在数据上也可以分享,我们再训一个行业模型。它们的需求不一样,最后这个生态我觉得也是丰富多彩的。智能涌现:跃问和冒泡鸭AI这两款产品似乎也是走AI角色扮演的路子。姜大昕:现在To C的产品在国内和美国就三类,一类是ChatGPT这样的,叫效率工具类,一类像Character.ai主打聊天、拟人、情感陪伴,还有一种是AIGC,生个图、生个视频。我们也比较谦虚,大家都这么做,一定有道理,那我们也做,我们去看用户到底用产品来做什么,他们到底需要我们干什么。所以我觉得不管做什么To C产品,它和模型之间的关系有个比喻,就是皮囊和灵魂。现在这些聊天类产品,你把brand去掉放在一起,能分得清谁是谁吗?所以我们的产品最终还是要让灵魂变得更有趣。智能涌现:这意味着产品,这个“皮囊”没那么重要?姜大昕:这是我自己的感觉,现在灵魂还没有呢,大家都差不多。也许产品经理不同意我的看法(哈哈哈)。我一个朋友非常郑重地警告我,说不要对你的产品经理指手画脚,你不是一个做产品的人,管好技术就OK了。我不是一个typical user(典型的用户),对产品没有资格指手画脚。当然我还是要试图去理解产品经理的逻辑,如果我不理解,你就拿数字跟我说话。不过我们两款产品还在比较早期的探索阶段,还没有开始做大规模的投放获客。智能涌现:现在谈大模型的商业化会不会很早?姜大昕:早,商业化得先有产品,现在AI Native(AI原生)的产品要先有模型,所以我们是反过来的,先把精力放在模型上,模型如果很强,在模型的基础上去做产品,在产品的基础上再讨论怎么商业化。智能涌现:大模型要快速商业化是VC的共识吗?姜大昕:我们股东现在还没这样。智能涌现:那商业化就不是VC的共识?姜大昕:反正我没看到我们股东天天问我商业化做得怎么样了。但我们肯定会关注产品,不是说我现在只做模型什么都不看,那不可能,产品应该怎么做,那也很重要,也在探索。为什么会发布产品?我们也是想得到用户的反馈。智能涌现:To B的商业回报是立竿见影的,但是To C的回报似乎更渺茫一些?姜大昕:To C这个东西有不同的观点。有的人认为互联网时代,包括移动互联网时代有过很多To C的产品,它们的成功路径都可以借鉴,它们的商业模式都可以拿来试一试。也有人说不对,那是互联网时代的,AI时代是一种全新的商业模式。但我觉得现在这个东西到底是什么,没有人说得清楚。就像GPT,我见到那个Demo之前,前一天你要我预测AGI什么时候出现,我会告诉你要十几年,甚至几十年。但是那天看到那个Demo以后,你再问我,我说也许两年,也许三年。所以我觉得现在这个时代就是这样,AI一天,人间一年。智能涌现:那么这个行业有什么是确定的?姜大昕:我相信技术带来的两个巨大的变量。一个是人机交互的方式改变了,原来人和机器交互要通过程序员。现在不用,自然语言就可以。甚至将来人机交互不再是一个数字化的交互,变成具身的交互,机器人可以在物理上跟你交互。第二,内容生成的门槛被极大降低了,不管是文字的生成,还是视频的生成,它的门槛被极大降低了。Sora出来以后,我跟电视台的很多编导谈,他们都非常兴奋,觉得以前我们把脑子里的想法拍出来,成本是非常高的。现在我只要调调Sora,这个东西就出来了,可以释放我多少的创造力。这也是一个巨大的变量。虽然看不清楚现在具体要做什么,但我相信这两个变量终归会以某种方式释放出来,产生超级应用,这是肯定的。智能涌现:我们再聊聊身份的转变。你在微软16年,现在创业1年。身份从高管转变为一家创业公司的CEO,你有什么感觉?姜大昕:创业比在微软的进展更快。现在每天都有很多新的内容出来,我在微软不会关注这么多东西。其次我体会到自己做还是很重要的,我再重申前面说的,很多东西你看到了,不代表真的理解了,你还是要自己去做。比如数据这个例子。2022年一堆人跑出来说数据不够了,Scaling Law不work,没有那么多的数据让它再往上Scale。我们当时听了不以为然,因为还不知道人家在训GPT-4。我们心里想,互联网上亿的网站、万亿的网页,数据怎么就不够用了?但等到我们做到GPT-4的时候,发现数据真的不够用。但是2023年大家又跑出来说数据的问题已经解决了。因为有两个东西,一个叫做多模态,视频数据是海量的,另一个叫做人造数据。所以你不自己做,只是听说的话,可能就不理解。智能涌现:自己做会让你感到兴奋。姜大昕:对,我当时感觉整个世界在我身边呼啸而过,都在往前冲,我在原地很茫然,留下自己在风中凌乱,我不知道我在干什么。智能涌现:现在你和风一起冲了。姜大昕:现在你至少可以看看风往哪冲,有时候风冲的方向跟我好像还挺一样的,很高兴。36氪旗下AI公众号