四面楚歌的 Google 如何应战大模型?
撰文|高佳
创意|李志飞
大模型的能力有目共睹,Google 可以且必须在自己的各种应用(如Search、Youtube、Google Docs、Android、Google Maps等)里整合这些能力。
第二路:开源和平台方阵
除了内部升级方阵之外,Google Brain可以组建一支行业大模型团队,目的是做开源和开放平台,赋能各行各业,从而构建生态。
有别于内部升级模型追求极致的质量和性能, 开源和平台更多是广度的服务。而且,与对Meta的建议一样,对那些性能没有达到极致,但足够第三方使用的模型和系统,Google应该真心全意、倾其所能地开源:数据、训练和推理代码、丰富的模型checkpoints都毫无保留地提供(如果某些第三方数据不能直接提供,可以给出数据源链接以及预处理方式)。
开源看似简单,但对大公司却是一个复杂的过程,要从流程和法务角度做很多内部review和风险防范。另外,由于大模型还是一个新鲜事物,外部开发者需要很多帮助才能真正把开源玩起来。所以 Google 除了态度诚恳之外,还要真正投入研发、人力,把开源服务做到极致。
做开放平台也是类似,在价格上可以非常激进,对普通用户甚至提供限量的免费,对那些量比较大或者精修要求很多的平台则可大胆收费。开源和平台不冲突,只是针对不同需求和行业,目的都是服务好上下游,也给上下游足够的灵活性和安全感。从组织结构上,可将这一方阵放在Google Cloud Platform (GCP)团队。
也许有人疑问,开源和免费,Google是「活雷锋」吗?是的,按照目前的竞争局势下去,基础大模型的竞争壁垒会大幅度降低,大概率与Android一样,本身只是一个引流款,而没有商业模式,通过Google GMS消费端全家桶和Cloud GCP实现商业变现,或其他创新商业模式。既然基础大模型难有独立的可规模化的商业模型,与其迟疑不决,不如抢占「活雷锋」先机。
第三路:探索未来方阵
目前OpenAI已探索出一条「暴力美学」之路,未来十年,其规模大概率还可以再提升10个数量级(下次专门写为何是10个数量级)。前面的两支方阵是「拥抱确定性」,与OpenAI一样走向已被证明的极致暴力之路。但对Google来说,这不是唯一的路。
Google Brain可以另组一支方阵,专门针对模型结构、数据处理、分布式计算、推理优化等方面探索未来的可能性。这支方阵的目的是求新、求异、出奇制胜,可以先在小模型上进行百花齐放式的探索,一旦发现新的可能性,立刻在超大模型跟进。
分兵三阵的原因
大役临前,「分散精力」看起来是一记平庸昏招,但对Google实则不然,其中最主要的假设是Google Brain拥有10倍于OpenAI的研发能力。
规模1000人的Google Brain,有一众既能搞研究也能做工程的一流PhD,而OpenAI与LLM相关的研发规模仅百余人。如果将Google Brain的1000多人全部用于内部升级,于管理将是巨大的挑战。
做大模型是一项重于「人才密度」的事情,人多反而人浮于事,可能导致很多真正优秀人才跳槽硅谷其他公司,作他人嫁衣。兵分三路,各凭兴趣加入战队,既能留有人才,也为同时做三件事保留多种机会。
以上三个方阵的大致资源分配可以是60%,25%,15%。人员既定,没有新的cost;算力需求可能是单一方阵的2倍;数据预算可能是单一方阵的1.5倍。
三支方阵,各自目标明确,除了最底层的分布式训练架构统一外,其他方面互相协作最好(如基础大模型、数据等),如不能协作,有冗余也在Google承受之力以内。用不到两倍的资源换取超两倍的胜率,物超所值。
有人不免疑惑,这不就是Google Brain过去「一团散沙」的现状吗?其实不然,过去的一团散沙是Bottom-Up自发而成,没有具象的目标和组织方式,在敌军面前仅有技术自由的旗帜,并无强劲战斗力。而现在更多是Top-Down的战略分阵,各自目标和组织方式明确,战力倍增。
执行难度
当然,以上策略需要辅以极强的leadership和组织能力。具体来说,需要:
一位强有力的CEO; 每支方阵需要一位强将leader; 内部各产品线owner和各支撑衙门的配合; 内部高度统一思想,获得大多数前线工程师和一线管理者的内心认可与支持。
如果内部执行不可能,那么另外一种可能就是通过投资并购的方式来构建方阵。
战术总结:「攻、守、机」连战连捷
内部方阵与自己各大产品结合,在大模型势不可挡的趋势下,此为「防」;开源和平台方阵拉拢上下游生态,打掉OpenAI的商业模式和迅速扩散的势能,此为「攻」;探索方阵在OpenAI路线之外探索其它可能,是为「机」。以此攻、防、机三面出击,若调度得当,方可蓄力而勃发,让Google走出目前的泥沼。
历史上,这不是Google的第一次四面楚歌,但也不会是最后一次巨鹿之战。
最后,一番思考后,我把思路抛给ChatGPT。于是, 它给Google Brain制定了新季度OKR ……