「我们的挑战在于一窝蜂做事,要构建利于创新的文化。」
对话、文 | 卫诗婕、Li Yuan编辑 | 卫诗婕
当 OpenAI 以 ChatGPT 惊艳世界、成为举世瞩目的创新力量时,中国的创业圈里一度热议:为什么这样的创新没有出现在中国?
创新需要前瞻、定力、和某种程度的赌性。成立于 2015 年的 OpenAI 以非营利机构的姿态出世,在早期,OpenAI 曾鼓励学者们主动探索各类前沿方向,两年后,在数亿美金即将烧完的刺激下,团队最终选择将所有资源和人力聚焦于团队信仰的技术方向——大语言模型,这才孕育出后来的 ChatGPT。
如果把目光放到中国,一家非营利机构几乎进行了同样轨迹的探索,只是时间轴晚了三年。
2018 年,智源研究院在北京成立。独立于政府、商业、和高校之外,智源从出生便将自身定义为一所民间非营利的新型科研机构——前微软亚洲研究院创始人之一、刚从金山 CEO 的位置上退休的张宏江主导了这一切。他坚持认为,真正的科研创新需要跳脱出传统的权力体系、具有真正的理想主义,才可能「加大创新成功的可能性」。
2020年,智源启动「悟道大模型」系列,是中国最早实践大模型路线、并坚定下注的机构。 那是 GPT-3 刚刚面世的时代,一万张卡的训练劝退了中国诸多学者。智源却坚定地选择支持一些学者,从 80 张卡追起,调动大量资金以支持训练大模型。如今,大模型创业潮里的灵魂人物:唐杰、刘知远、黄民烈、杨植麟等,都曾是「悟道」项目中出现过的身影。
「中国创业者能在这波大模型创业中走向潮头,多亏了智源这座黄埔军校。」一位创业者这样告诉极客公园。
但某种意义上,ChatGPT 的爆火打乱了智源的计划。
彼时张宏江在美国,再回到国内时已是遍地创业。一夜之间,大模型成为共识。当时,智源一位骨干刚见完几位要再次出山的创业者,在电话中对他说,「怎么办,他们一定会挖我们的人。」
「慌什么。」张宏江淡淡地答,挖角在意料之中。
从智源成立的第一天起,张宏江就意识到,前沿探索一旦做成,研究院的人才必定会被挖角——不仅因为商业机构能够开出更高的薪水,更因为人才的稀缺性。尽管在理智上可以接受,但当这一切真的发生——当一位张宏江极为重视的年轻技术骨干被挖走时——他还是为此「消化了很久」。
自 2019 年起,智源开始花大量时间组建「智源学者」——目的是汇集中国最杰出的人工智能学者群体,并筛选出一波有学术潜力的年轻人,并将资源投入给他们。在张宏江看来,传统的学术体系对年轻人不够友好:盘踞于金字塔顶层的学者们虹吸式地聚集了所有资源,而年轻学者在最有热忱和动力的年龄却无法真正展开高效的学术研究。
典型的一个例子是,智源青年学者刘知远在三年前还未评上清华大学副教授,但当他向智源申请立项训练大模型,当即获批 10 台 V100,即 80 张卡以支持他训练 CPM-1 大模型,这意味着上千万人民币的资源投入——「如果没有智源,以我当时的学术职称很难调度这么大的资源。」
以反共识的方式支持这一切,张宏江顶住了巨大的压力——这份决心源自于他的坚信:创新的投入需要坚定,而坚定需要摒弃功利心。
今年 6 月,端午假期的第一天,我们在三里屯璞舍酒店的大堂见到了他。灰色 T 恤衫、短裤、高帮白袜和球鞋,1960 年生人的白发已经爬上额角。这场访谈的不久之前,坚持五年的智源大会终于在今年的 AI 热潮下成功破圈——Sam Altman、深度学习三巨头中的两位图灵奖学者纷纷空降。
我们不仅聊到了这场智源大会、智源研究院的故事,也谈到了这次大模型创业潮中的星星之火,更探讨了创新该以何种方式被计划。
以下为访谈实录,经极客公园整理编辑后发布 :
极客公园:成⽴智源之前,你已经退休了,⽽且刚从⾦⼭那样劳⼼劳⼒的地⽅离开,为什么选择再次出⼭? 张宏江: 从金山退休到做智源,中间隔了差不多一年半,我当时是非常享受状态的——一边做企业的顾问,一边做源码资本的投资合伙人,同时也能花点时间在美国跟两个儿子在一块儿,然后又去周游世界。直到 2018 年夏天 7 月份,一场有关人工智能的座谈会在北京市举办,会议的目的是探讨如何提升当下的科研水平。当时我受邀参与,会上,我提及了美国有个 OpenAI,是一个非营利民间机构,这种形式很新颖。在我看来,国内大学里面研究者虽多,但坦率说,都是一个个小单元,很难集中力量干大事。而企业更多是聚焦自己目前的业务,很难在基础前沿方向上做足够坚定的探索。所以当时我提到,中国可能也需要一家新型的科研机构,独立于高校、企业和政府,追求更系统的大目标。 极客公园:对于打造一个理想的研究机构,你当时有什么想法? 张宏江: 我当时想的第一件事,就是能不能做一个社区,把搞人工智能的这些学者都聚到一起,从中找出真正有想法、有干劲的领军人物。第二步是在社区的基础上,能像美国的 DARPA 一样,把他们组织起来做一些事情。第三步才是找到一些目标导向的项目,开始做实。智源也是依照这三步来走的。当然当时我并没有想自己来做。 张宏江: 我找过不少人,问他们愿不愿意做这事;但我后来发现,这其中的难度远超我想象。接连被拒绝后,就这么半推半就,我自己做了理事长。张宏江: 要做前沿的科研会涉及大量的资金,前沿的科研探索也不是一定能成功,敢不敢赌这东西,能不能坚持、坚定地判断,对研究的管理人员是真正的考验。2020 年 6 月,GPT-3 发布后,智源当时决定要把所有资源和人力聚焦在做大模型——也就是后来的「悟道」大模型系列。大模型当时在学术圈还是比较另类的一条路线,也不是所有人都接受。 悟道发布后,有人一看智源花这么多钱,就有一些噪音说这个方向不对,甚至说智源的决策不清晰、产出不清晰、将来的(发展)不清晰。整个智源包括我,都顶着很大压力。 张宏江: 智源受到的所有挑战都是对于我们自信心的一种挑战。悟道 1.0 已经花了不少的资金,2.0 要想真正让所有人能用,还需要工程的力量——我们当时的预算根本不够撑这件事。要往下走,就需要更多的钱。 但如果回看我们 2022 年 6 月份做的计划,70% 的预算就用来做两件事:大模型和支持大模型的架构。按照我们的路径图:希望 2023 年的 9 月份大语言模型能够上线,在这基础上,能做一个对话机器人——这与 OpenAI 的路径是一致的,GPT-3.5 就是大模型,ChatGPT 就是对话机器人。 所以今天回看,我们的路径图可能是对的,只是说我们比它晚一年。不过 ChatGPT 的发布,的确带动了整个业界的行动节奏,也一定程度上打乱了我们的节奏。 极客公园:我挺好奇, ChatGPT 爆火后,你真实的心境是怎样? 张宏江: ChatGPT 发布时我在美国。我意识到这个事在中国可能会非常热闹。回来之前我在想,或许我们可以像 OpenAI 一样,组个团队把这件事做成公司。但我回国后两三个礼拜,中国已经遍地是(大模型创业)公司了。当别人做成功的概率可能比你还高时,你为什么还要凑这个热闹。 张宏江: 对。我很快静下来了,觉得 ok 至少我自己不用搭团队去做了,他们要搭团队他们就去做,我能帮就帮。极客公园:但在帮(别人创业)的过程中,智源被挖角了。 张宏江: 一个年轻人的离开让我忧郁了很长时间。他是我们很强的一位技术骨干。而他被挖走恰恰就是因为我曾经当着那个创业者的面狠狠夸奖了这个年轻人。极客公园:你有挽留他吗? 张宏江:当然挽留他了,一方面我挽留他,另一方面我也鼓励他,因为他有他的梦想,又年轻,可以试错。 极客公园:听说你消化了挺长一段时间。 张宏江: 对。我希望那个年轻人能在这儿接着再做两年,他可能就能做出世界领先的多模态大模型了。我问他,你想做一个公司的工程 VP 或者是 CTO,还是想做一个科学家?极客公园:他怎么回你? 张宏江: 他选择要做一个 CTO。(邀请他的)那是一个很被人看得上的创业者,所以从这个意义上我会很理解他。极客公园:你从什么时候开始关注到 OpenAI 的? 张宏江: 2016 年底我决定退休后,去硅谷游学的时候,曾经在伯克利和 OpenAI 做强化学习的团队聊过。他们创始的使命就很清晰,AI 作为如此重要的一个改变人类的技术,不能让一两个巨头所垄断(主要指谷歌)。坦率说,当时我不觉得他们能成功。但是我喜欢那种非营利组织的组织方式——不附属于一个企业,又不附属于一间高校,也不附属于一个政府。游离于所有的功利圈之外,又专注于做一个方向。 张宏江: 我当时就想过,但我觉得可能得十年以后,等到某个富豪能够想通了,把钱拿出来(做这件事)。结果在 2018 年,机缘巧合下,智源就成了。极客公园: OpenAI 早期经历了从研究方向的发散到收拢,最终选择大模型方向 all in 资金和人力;智源也经历了一个类似的过程? 张宏江: 我们在 2019 年底就开始讨论,希望从我们当时所有研究方向中(机器学习、信息系统、数理基础、系统架构、芯片),能选出一个聚焦的方向。这事到 2020 年 GPT-3 发布时变清晰了:铁军、唐杰、刘知远、文继荣这些在我们平台上的学者,大家意识到这是一个(里程碑),所以我们很快就搭出一个团队,机器学习和信息系统两波人一起来做这件事,开始做「悟道」大模型系列。 现在大家会认为 GPT-3 是一个里程碑,但事实上,当时所有科研部门、四小龙等公司,可能感知没有那么强烈。 张宏江: 我是在悟道 2.0 发布时信了这件事——因为 GPT3.0 它再强,它是别人做的,我们自己复现出来,路子就走通了。在此之前我并不是彻底不信。因为我自己并没有把这个算法本身从头到尾走一遍。作为一个科研的管理者,你自己并不一定是这个领域里面最强的专家,但你要能找到这个领域最强的专家,并百分之百地信任他们。 当他们几个人,智源的两位院长,黄铁军和唐杰,加上文继荣和刘知远等智源学者,都跟我说这件事(值得坚持)的时候,我就信了。 极客公园:我之前有机会跟文继荣老师聊过,他说在 GPT-3 出来时,国内真正懂 AI 的这些人已经开始意识到大模型这条路是能走得通的,接下来只是工程问题。 张宏江: 我认为大家那时候还是懵懵的,因为 3.0 并没有很强的涌现能力,大家只是认为这个方向值得探索。至于大家能不能看到 GPT-4,或者能不能看到跟 AGI 的这种(联系),我想那是很遥远的。 极客公园:他有提到一点,那个时候包括智源在内,国内有几个团队已经开始立项要做大语言模型了,但这些团队没有足够的信仰把这事坚持着非常认真地做下去。 把时间拨回到 ChatGPT3.0 发布时,我们确认这件事值得做,但也意识到需要大量的资源 ,而获得这样量级的资源并不容易,智源当时拿出一半的经费来购买算力。 算力和招人都需要钱,只能在两者之间取舍。招人也有困难,你跟别人说「我们做大模型」,大家未必有共识,很多人会问「三年以后智源还在不在?」。我们回头看一个正确的决定,会觉得理所当然,是一个无比清晰的决策;但过程中的每一步决定与坚持,其实都伴随着大量混沌的综合因素——尤其科研领域重大投入的决策是无法笃定预测结果的,充满惊险与冷暖自知。 极客公园:你自己内心觉得三年以后,这个机构还会在吗? 张宏江: 我想我会以我的努力去争取这件事。坚持做正确的事情,就会有生命力,有生命力就有希望,有希望就有一切。极客公园:你觉得是什么造成了今年年初中国在这波⼤模型潮中的失声?是信仰,还是资源不足? 对智源来说,的确是因为当时的资源不足。其他大公司没有做出来,也许是勇气和认知的问题,又或许是其他原因。 极客公园:大模型创业圈现在总谈智源系,智源就像一个原点一样,向很多创业公司、大厂发散出影响力和人才,输出了技术谱系。但这些人才都是你辛苦聚集起来的,理性上和感性上分别是怎样接受这件事? 张宏江: 二月份,智源一位副院长打电话给我,说几位连续创业者要出山做这件事,肯定要挖我们的人。我说我们在做智源的第一天就应该想到了,(智源)做成以后我们的人一定会被挖角。我第二句话说的是,微软研究院过去20多年都是被挖的,但并没有把它挖垮。 总有一些想做研究的人,他们不会受到商业的干扰,我们总还能吸引一些有理想主义情怀的人。另外,至少我们可以说,北京的这个圈子里真正做过大模型的都是在悟道(这个项目)里做的。这是我们可以得意的地方。 极客公园:听起来智源像一个黄埔军校,你愿意它变成黄埔军校吗? 张宏江: 成为黄埔军校对我来说是一个成功的标志。如果智源的一些人到了某些公司成为了核心骨干,把公司做成了,我会非常开心。我们的代码、我们的系统被别人用来做他们的产品,做得很好我也会非常开心,这本来就应该是一家非营利研究机构的价值所在。 另外我也希望我们的一些成果能成为基石:比如我们不断有开源的模型出来,大模型开源技术体系出来,这些模型能成为公司或其它研究机构下一步研究和开发的基础。 极客公园:您提到微软亚洲研究院,之前我跟小冰的李笛也聊过,他们那批人最终选择出来是想干一番事业,原来在研究院仿佛已经能看到退休以后的状态了。 张宏江:这其实是两件事。在我看来,如果你的志向是做研究,那么当然可以在研究路径上做出自己的突破,研究本身就是一项可以投入一生的事业;你不断地有新的算法研究出来、有新的系统研发出来,你本来享受的就是这个过程,可能只是没有做公司赚的钱多而已。 极客公园:找到那些真正有志成为一流科学家的人更难,还是说服他来到智源更难? 张宏江: 第二个更难。发现一流的科研人员并不难,你看看最好的学者会议上发表好文章的是谁,谁在参加会议,一目了然。但能不能说服他们来,这是一件很难的事。拒绝智源的人太多了。我跟他们每个人都说得很清楚,我希望他们加入,我会尽我所能支持你在智源踏踏实实做三年。 极客公园:可是仅仅做成一件事,仅仅用三年的时间成为不了一流的科学家? 张宏江: 不,这件事如果他做得很漂亮,可能是一个系统,可能是一篇文章,让别人看出他的能力。他带着别人对他的这种信任,到任何其他的地方都可以做成事。另外我也有一些自信,如果他们三年做得很成功,也许就不愿意出走,就会继续做五年十年。 极客公园:悟道早期花了非常多的资金,应该有上千万(人民币)。一个中国的青年学者能有多大机会运作这么大的资源? 张宏江: 大模型的研发确实需要大量的资源,学校里的学者们,尤其是青年学者,是非常难拿到这样规模的资源的。极客公园:你在智源一直强调,好资源要留给青年科学家。这种想法是从什么时候开始有的? 张宏江: 一开始就有。我在这方面一直有偏见:中国 30 岁左右的学者的基础、学习能力、见识,都是老一辈难比的。今天我也是属于老一辈的,所以我也更希望跟年轻的人一起做事。在中国的科研体制内,盘踞在金字塔顶端的老一辈学者虹吸式地聚集了大量资源。所以,智源从最开始就组建智源青年学者系列,目的就是要把资源给年轻人,让年轻人挑大梁。 这中间智源,尤其是几位院长花时间比较多的,是把优秀的年轻人找出来,给他们充分的资源,支持他们坚持做最有想象力、最正确的事情。极客公园:今天在谈话当中您很多次提到了对年轻人的相信。这种相信最早源自于什么时候? 张宏江: 毕业后,我待过三个国家,丹麦,新加坡,美国。尤其在美国的文化里,大家很希望给年轻人空间和机会,去试错或者去冒险。我本人也是这种文化的受益者。另一个更强烈的因素是,中国过去 15 年互联网公司里成功的年轻人太多了,在他们身上你真的看到了这波年轻人的潜力和实力。在创业上是这样,在研究上也是这样。 有美国那种文化对我的影响,也有中国过去 30 年的发展变化带来年轻人的阳光,见识,冒险的精神和能力,增强了我的信心。 我持续地从年轻人身上学到很多东西,也更多地了解这个社会十年二十年的变化,有时候我们在我们同龄人的圈子里是看不到的。 极客公园:您经常说舞台要留给年轻人,德高望重的老科学家都已经不在一线了。但您也是 1960 年生人,是一个德高望重的人,这会不会有点矛盾? 张宏江: 我觉得不矛盾。我从第一天开始就告诉智源所有的人,智源所有的文章都不署我的名字。这里深层的意义在于,我希望我们这些已经过了事业高峰的人不要再去跟年轻人抢资源和名誉了,我对每位院长也有类似的要求,绝不止自己没有实质贡献的文章上署名。 极客公园:所以你是要当那个给年轻人搭舞台的「老人」? 05
「如果把智源变成营利,
我们跟满大街的
创业公司就没有区别」
极客公园: OpenAI 也进行了架构调整,其主体公司仍然是一个非营利机构,将子公司部分商业化,实际上 ChatGPT 正是出自于这家子公司。这样的结构对你有没有启示? 张宏江: 回头看看这种架构设计的本身,你会再次敬佩 Sam 这样的理想主义者。第一 Sam 个人不占股。第二,这种设计本身是为了做成一件事而不纯粹是为了赚钱。正因为他知道做成 AGI 这件事需要很多钱、很多人、持续做很长一段时间,虽然他自己是理想主义者,但他并不要求所有人都是理想主义者,他给参与者设计很好的回报——子公司的使命就是盈利,让投资人赚 700 倍还是多少倍就走人,公司就回到非营利。OpenAI 创始人 Sam Altman | 来源:视觉中国 很多人跟我说,我们智源能不能这样做?我说我当然希望这样做,但是今天只要我们开始融资,开始把自己非营利变成营利,我们就会时时面临投资者的压力,就跟今天满大街的创业公司没有区别。不要忽视一点,OpenAI 做这件事比别人早了三年,它已经屹立潮头,已经形成壁垒。而我们并没有。 极客公园:是因为竞争力不够,所以智源目前才不考虑走商业化的道路? 张宏江: 尽管我们在中国比别人早认识到这件事,积累了算法、多了一些数据,但简单追随 OpenAI 路径,显然是没经过独立思考的懒惰。跟风这件事,你一定要想清楚自己为什么跟风,能不能跟。如果我们三年前想这件事,也许我们自己能走通。今天你再走别人的这条路,就可能走不通。 不冷静的商业化反而让我们产生焦虑感,会让我们偏离方向。因为你只要有融资就必须得有商业回报,你能不能给投资者带来回报(是未知数)。 极客公园:我听说最近在智源内部,也有人在讨论智源要不要走商业化的路线。你觉得大家为什么会这样提?你担不担心外部的商业环境,会影响智源好不容易构建起的氛围? 张宏江: 的确有很多人问我,有人甚至说,智源赶紧要做一个公司,要不然人会流失,要不然拿不到资源。我同样反问:那我们跟大街上其他的创业公司有什么差异化?张宏江: 我就说你可以参加别人的公司或是创立自己的公司。我们还是非营利的一个研究机构。我会跟很多年轻人很耐心地解释,我们只能不断地耐心地去寻找同路人。张宏江: 和一年前我们想的一样。找一波有理想主义情怀的人,他愿意拿出三五年做一件事,不为了股票和物质回报,仅仅是享受做事的过程的这样一拨人。我们还希望在系统上能做一些突破,希望你会看到我们的多模态模型进步也会很快。极客公园:智源大会坚持做了五年,今年有了破圈的迹象。能感受到大会的学术品位,那天在现场我们也留意到一些细节,比如全程用英语交流、现场也没有那种 VIP 式的沙发座。 张宏江: 对。大概在这次智源大会的三四个礼拜前,我又看到了某个学术会议的报道图片,前面放了一排沙发,我把照片发给同事,我说确保我们第一排的凳子和后面的凳子没什么区别,只是贴一张纸条划分一下 VIP 嘉宾的区域。这些细节我会很留意,因为我希望这是一个纯粹的学术会议。极客公园:你提到过你很喜欢《异类》那本书里的一些观点,简单来说就是时代造就人,一些时代关键的转折点会密集地出现一波改变社会、改变世界的人。你身上的时代烙印是什么? 张宏江: 非常幸运,我的每一个转折都赶上了中国转折的最佳时间点——正好高中快毕业的时候高考恢复了,很幸运,考上大学了。等我本科毕业时,中国开始改革开放了,可以出国了。在国外待了十几年以后,中国本身经济发展,让我想回来了,于是找到了微软亚洲研究院的机会。每个点都踩对了,这和《异类》那本书是完全一致的。极客公园:你年轻时想做一个一流科学家,还是一个 CTO ? 极客公园: 中国在科技创新方面的科研投入基本跟美国持平了,至少我们看到官方的数字这样显示。但目前大家感觉效果不如美国? 张宏江: 斯坦福每年会有一个报告出来,AI index,会统计 AI 文章的发表总数。从数量来看,中国是碾压美国的。发表 AI 文章最多的十个机构,麻省理工你猜排在第几?排在全球第十,前九名全是中国的——显然,我们的 KPI 鼓励了数量,而质量和数量的不匹配是因为我们真正的创造力不够。而且把那些文章分分类,你就会发现哪一个领域热,这个领域的发表数就多。这样你的前瞻性就不一定够。 张宏江: 做智源这件事,我们希望通过几年做下来,我们的成果会更好,能吸引更好的人,这波人就是可以改变未来的。这样的坚持本身就是在改变整个科研环境和水平。极客公园:智源的追求还是要在研究上做出突破性的东西? 张宏江: 对。这是我们一开始的使命。其中的难点也在于,你在一个功利、非常浮躁的社会里怎么把这件事做下来,这也是让人兴奋的地方。 极客公园:您在学界、商界、投资界都待过,这些圈子相对来说很系统、有各自的规则。但今天的谈话你不停地重复理想主义,也一直在强调一种纯粹感? 张宏江: 如果你知道我在评价投资项目时的冷静,你会觉得我是如此(像)商人。理想主义与现实并不矛盾。我们的社会需要一些人认准一些方向,动用一切资源去做这个事。这些事情本身没有太多的理想主义色彩,而对现实世界又有着非常实际的影响。科研要想有效、能够真正地突破、能够持续地引领(趋势),这些本身就需要务实的做事方式。 我在骂人的时候是看不出理想主义形象的,完全是非常非常实用的。 张宏江: 本质上我希望用正确的方法做正确的事。只是在今天的形势下,用正确的方法来做智源(研究院),这看上去比较理想主义,仅此而已。
彩蛋
这次采访之后,张宏江开启了为期一周的英国之旅,结束之后他发了一条这样的朋友圈。
从 0 到 1 的过程,是令宏江沉迷的选择路径,重要的是不断起身看向下一个问题。 追问
极客公园:你怎么看现在的这一波大模型创业潮?
张宏江: 我觉得一定有人做成,一定有平台公司能够做成。
极客公园:有比较看好的创业者吗?
张宏江: 我不适合评价。
极客公园:接下来中国的大模型,你觉得可能挑战会有哪些?
张宏江: 挑战很多,有一些大家都想到的,比如算力,人才,数据。但我会觉得一个更大的挑战在于,一窝蜂做事(就像之前很多时候那样),这是我们跟美国在创新效率上竞争的一个劣势。
在美国,当一个领域里,大家看到有很强的领军者在往前走时,大家不会去重复他做的事,而是会寻找差异化。这使得整个创业生态还比较健康、有效。我们的一窝蜂会使得资源被分散。我希望我们的文化可以帮助创业者成长得更加理智和健康。
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO 热点视频
马云与马斯克三年前在世界人工智能大会上的对话中,曾谈及AI与就业相关话题。马云提及,他觉得人们应当每周工作三天每天工作四小时,AI的出现也应当让人们拥有更多的时间享受作为人类的生活。 点赞关注 极客公园视频号 , 观看更多精彩视频