查看原文
其他

四面楚歌的 Google 如何应战大模型?

高佳 飞哥说AI 2023-05-02

撰文|高佳

创意|李志飞



硅谷大模型的战场正如火如荼、烽烟四起,四面楚歌的Google被困垓下,身影落寞。

前有OpenAI和微软联手设局,把Google拖入生死战,后有Meta发力开源、搅乱战局,很快Amazon也将不甘寂寞加入混战。外界看来,面对ChatGPT的偷袭慌了阵脚的Google,此时多年的技术自信心倍受重挫,应战的前几步方寸已乱。

隔岸观火者,不禁会问,稳坐多年AI霸主的Google尚能饭否?

面对当前困局,以及从溃败于OpenAI的原因来看,一般的谋略建议可能是 Google 此时应将分散的兵力凝于一心,组成一支铁血悍军全力攻防。但是,我倒觉得Google可以重新排兵布阵,将Google Brain的研发资源兵分三路应战(后面解释why)。‍

第一路:内部升级方阵

大模型的能力有目共睹,Google 可以且必须在自己的各种应用(如Search、Youtube、Google Docs、Android、Google Maps等)里整合这些能力。


Google Brain可以组建一支专门的大模型研发团队,先把底层基础大模型炼好,目标应用场景就是内部各大产品线。同时,这支团队要与Google各大产品的Owner们联手一起,协助对基础大模型进行各种精修,从而达到上线标准。

在精修过程中,可以用到很多内部独有的数据源、为应用提供独特的接口、针对应用进行Alignment训练,以及各种推理优化。通过以上努力,将模型的质量和性能做到业界极致,重拾Google内部的技术自信心,以及外界的perception。


第二路:开源和平台方阵


除了内部升级方阵之外,Google Brain可以组建一支行业大模型团队,目的是做开源和开放平台,赋能各行各业,从而构建生态。


有别于内部升级模型追求极致的质量和性能, 开源和平台更多是广度的服务。而且,与对Meta的建议一样,对那些性能没有达到极致,但足够第三方使用的模型和系统,Google应该真心全意、倾其所能地开源:数据、训练和推理代码、丰富的模型checkpoints都毫无保留地提供(如果某些第三方数据不能直接提供,可以给出数据源链接以及预处理方式)。


开源看似简单,但对大公司却是一个复杂的过程,要从流程和法务角度做很多内部review和风险防范。另外,由于大模型还是一个新鲜事物,外部开发者需要很多帮助才能真正把开源玩起来。所以 Google 除了态度诚恳之外,还要真正投入研发、人力,把开源服务做到极致。


做开放平台也是类似,在价格上可以非常激进,对普通用户甚至提供限量的免费,对那些量比较大或者精修要求很多的平台则可大胆收费。开源和平台不冲突,只是针对不同需求和行业,目的都是服务好上下游,也给上下游足够的灵活性和安全感。从组织结构上,可将这一方阵放在Google Cloud Platform (GCP)团队。


也许有人疑问,开源和免费,Google是「活雷锋」吗?是的,按照目前的竞争局势下去,基础大模型的竞争壁垒会大幅度降低,大概率与Android一样,本身只是一个引流款,而没有商业模式,通过Google GMS消费端全家桶和Cloud GCP实现商业变现,或其他创新商业模式。既然基础大模型难有独立的可规模化的商业模型,与其迟疑不决,不如抢占「活雷锋」先机。


第三路:探索未来方阵


目前OpenAI已探索出一条「暴力美学」之路,未来十年,其规模大概率还可以再提升10个数量级(下次专门写为何是10个数量级)。前面的两支方阵是「拥抱确定性」,与OpenAI一样走向已被证明的极致暴力之路。但对Google来说,这不是唯一的路。


Google Brain可以另组一支方阵,专门针对模型结构、数据处理、分布式计算、推理优化等方面探索未来的可能性。这支方阵的目的是求新、求异、出奇制胜,可以先在小模型上进行百花齐放式的探索,一旦发现新的可能性,立刻在超大模型跟进。


分兵三阵的原因


大役临前,「分散精力」看起来是一记平庸昏招,但对Google实则不然,其中最主要的假设是Google Brain拥有10倍于OpenAI的研发能力。


规模1000人的Google Brain,有一众既能搞研究也能做工程的一流PhD,而OpenAI与LLM相关的研发规模仅百余人。如果将Google Brain的1000多人全部用于内部升级,于管理将是巨大的挑战。


做大模型是一项重于「人才密度」的事情,人多反而人浮于事,可能导致很多真正优秀人才跳槽硅谷其他公司,作他人嫁衣。兵分三路,各凭兴趣加入战队,既能留有人才,也为同时做三件事保留多种机会。


以上三个方阵的大致资源分配可以是60%,25%,15%。人员既定,没有新的cost;算力需求可能是单一方阵的2倍;数据预算可能是单一方阵的1.5倍。


三支方阵,各自目标明确,除了最底层的分布式训练架构统一外,其他方面互相协作最好(如基础大模型、数据等),如不能协作,有冗余也在Google承受之力以内。用不到两倍的资源换取超两倍的胜率,物超所值。


有人不免疑惑,这不就是Google Brain过去「一团散沙」的现状吗?其实不然,过去的一团散沙是Bottom-Up自发而成,没有具象的目标和组织方式,在敌军面前仅有技术自由的旗帜,并无强劲战斗力。而现在更多是Top-Down的战略分阵,各自目标和组织方式明确,战力倍增。


执行难度


当然,以上策略需要辅以极强的leadership和组织能力。具体来说,需要:


  • 一位强有力的CEO;
  • 每支方阵需要一位强将leader;‍
  • 内部各产品线owner和各支撑衙门的配合;
  • 内部高度统一思想,获得大多数前线工程师和一线管理者的内心认可与支持。
(如果任何一个条件打折扣,就当我没说)


如果内部执行不可能,那么另外一种可能就是通过投资并购的方式来构建方阵。


战术总结:「攻、守、机」连战连捷


内部方阵与自己各大产品结合,在大模型势不可挡的趋势下,此为「防」;开源和平台方阵拉拢上下游生态,打掉OpenAI的商业模式和迅速扩散的势能,此为「攻」;探索方阵在OpenAI路线之外探索其它可能,是为「机」。以此攻、防、机三面出击,若调度得当,方可蓄力而勃发,让Google走出目前的泥沼。


历史上,这不是Google的第一次四面楚歌,但也不会是最后一次巨鹿之战。



最后,一番思考后,我把思路抛给ChatGPT。于是, 它给Google Brain制定了新季度OKR ……




       

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存