四面楚歌的 Google 如何应战大模型？

Original 高佳飞哥说AI 2023-05-02

撰文｜高佳

创意｜李志飞

硅谷大模型的战场正如火如荼、烽烟四起，四面楚歌的Google被困垓下，身影落寞。

前有OpenAI和微软联手设局，把Google拖入生死战，后有Meta发力开源、搅乱战局，很快Amazon也将不甘寂寞加入混战。外界看来，面对ChatGPT的偷袭慌了阵脚的Google，此时多年的技术自信心倍受重挫，应战的前几步方寸已乱。

隔岸观火者，不禁会问，稳坐多年AI霸主的Google尚能饭否？

面对当前困局，以及从溃败于OpenAI的原因来看，一般的谋略建议可能是 Google 此时应将分散的兵力凝于一心，组成一支铁血悍军全力攻防。但是，我倒觉得Google可以重新排兵布阵，将Google Brain的研发资源兵分三路应战（后面解释why）。‍

第一路：内部升级方阵

大模型的能力有目共睹，Google 可以且必须在自己的各种应用（如Search、Youtube、Google Docs、Android、Google Maps等）里整合这些能力。

Google Brain可以组建一支专门的大模型研发团队，先把底层基础大模型炼好，目标应用场景就是内部各大产品线。同时，这支团队要与Google各大产品的Owner们联手一起，协助对基础大模型进行各种精修，从而达到上线标准。

在精修过程中，可以用到很多内部独有的数据源、为应用提供独特的接口、针对应用进行Alignment训练，以及各种推理优化。通过以上努力，将模型的质量和性能做到业界极致，重拾Google内部的技术自信心，以及外界的perception。

第二路：开源和平台方阵

除了内部升级方阵之外，Google Brain可以组建一支行业大模型团队，目的是做开源和开放平台，赋能各行各业，从而构建生态。

有别于内部升级模型追求极致的质量和性能，开源和平台更多是广度的服务。而且，与对Meta的建议一样，对那些性能没有达到极致，但足够第三方使用的模型和系统，Google应该真心全意、倾其所能地开源：数据、训练和推理代码、丰富的模型checkpoints都毫无保留地提供（如果某些第三方数据不能直接提供，可以给出数据源链接以及预处理方式）。

开源看似简单，但对大公司却是一个复杂的过程，要从流程和法务角度做很多内部review和风险防范。另外，由于大模型还是一个新鲜事物，外部开发者需要很多帮助才能真正把开源玩起来。所以 Google 除了态度诚恳之外，还要真正投入研发、人力，把开源服务做到极致。

做开放平台也是类似，在价格上可以非常激进，对普通用户甚至提供限量的免费，对那些量比较大或者精修要求很多的平台则可大胆收费。开源和平台不冲突，只是针对不同需求和行业，目的都是服务好上下游，也给上下游足够的灵活性和安全感。从组织结构上，可将这一方阵放在Google Cloud Platform (GCP）团队。

也许有人疑问，开源和免费，Google是「活雷锋」吗？是的，按照目前的竞争局势下去，基础大模型的竞争壁垒会大幅度降低，大概率与Android一样，本身只是一个引流款，而没有商业模式，通过Google GMS消费端全家桶和Cloud GCP实现商业变现，或其他创新商业模式。既然基础大模型难有独立的可规模化的商业模型，与其迟疑不决，不如抢占「活雷锋」先机。

第三路：探索未来方阵

目前OpenAI已探索出一条「暴力美学」之路，未来十年，其规模大概率还可以再提升10个数量级（下次专门写为何是10个数量级）。前面的两支方阵是「拥抱确定性」，与OpenAI一样走向已被证明的极致暴力之路。但对Google来说，这不是唯一的路。

Google Brain可以另组一支方阵，专门针对模型结构、数据处理、分布式计算、推理优化等方面探索未来的可能性。这支方阵的目的是求新、求异、出奇制胜，可以先在小模型上进行百花齐放式的探索，一旦发现新的可能性，立刻在超大模型跟进。

分兵三阵的原因

大役临前，「分散精力」看起来是一记平庸昏招，但对Google实则不然，其中最主要的假设是Google Brain拥有10倍于OpenAI的研发能力。

规模1000人的Google Brain，有一众既能搞研究也能做工程的一流PhD，而OpenAI与LLM相关的研发规模仅百余人。如果将Google Brain的1000多人全部用于内部升级，于管理将是巨大的挑战。

做大模型是一项重于「人才密度」的事情，人多反而人浮于事，可能导致很多真正优秀人才跳槽硅谷其他公司，作他人嫁衣。兵分三路，各凭兴趣加入战队，既能留有人才，也为同时做三件事保留多种机会。

以上三个方阵的大致资源分配可以是60%，25%，15%。人员既定，没有新的cost；算力需求可能是单一方阵的2倍；数据预算可能是单一方阵的1.5倍。

三支方阵，各自目标明确，除了最底层的分布式训练架构统一外，其他方面互相协作最好（如基础大模型、数据等），如不能协作，有冗余也在Google承受之力以内。用不到两倍的资源换取超两倍的胜率，物超所值。

有人不免疑惑，这不就是Google Brain过去「一团散沙」的现状吗？其实不然，过去的一团散沙是Bottom-Up自发而成，没有具象的目标和组织方式，在敌军面前仅有技术自由的旗帜，并无强劲战斗力。而现在更多是Top-Down的战略分阵，各自目标和组织方式明确，战力倍增。

执行难度

当然，以上策略需要辅以极强的leadership和组织能力。具体来说，需要：

一位强有力的CEO；
每支方阵需要一位强将leader；‍
内部各产品线owner和各支撑衙门的配合；
内部高度统一思想，获得大多数前线工程师和一线管理者的内心认可与支持。

（如果任何一个条件打折扣，就当我没说）

如果内部执行不可能，那么另外一种可能就是通过投资并购的方式来构建方阵。

战术总结：「攻、守、机」连战连捷

内部方阵与自己各大产品结合，在大模型势不可挡的趋势下，此为「防」；开源和平台方阵拉拢上下游生态，打掉OpenAI的商业模式和迅速扩散的势能，此为「攻」；探索方阵在OpenAI路线之外探索其它可能，是为「机」。以此攻、防、机三面出击，若调度得当，方可蓄力而勃发，让Google走出目前的泥沼。

历史上，这不是Google的第一次四面楚歌，但也不会是最后一次巨鹿之战。

最后，一番思考后，我把思路抛给ChatGPT。于是, 它给Google Brain制定了新季度OKR ……

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

四面楚歌的 Google 如何应战大模型？

您可能也对以下帖子感兴趣

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

生成图片，分享到微信朋友圈

四面楚歌的 Google 如何应战大模型？

您可能也对以下帖子感兴趣