查看原文
科技

硅谷AI科技之旅纪行

李建忠 李建忠研思 2023-05-29

疫情三年,禁锢浦东长江入海口弹丸之地,耳闻目睹身边各种怪现状,不仅情绪糟糕、思维也僵化。2023年春节一过,我就早早规划了五月硅谷之行。之所以选择硅谷,一方面,Boolan在这里的合作伙伴和朋友最多;另一方面,继ChatGPT去年底发布之后,AI在这里迎来了寒武纪大爆发。对于自诩为“技术未来主义者”来说,放眼全球,不二的选择就是硅谷。

由于中美航线仍然处于“斗气”状态,直飞美国机票很贵,但对于超级旅行者的我,这难不倒我。转机东京既可以享受一下地道的刺身,也可以省下将近一半的费用。之前来湾区经常住机场Hyatt,其地理位置在旧金山Downtown和Palo Alto中间地带,非常方便来回穿梭,和SFO机场之间也有24小时的Shuttle Bus,硅谷之行就在这里安营扎寨。

我还是低估了旅行的强度、活动的密度、朋友的广度,本以为凑数算个“科技休假”,没想到过的比996还要紧张忙碌,权当是一种疫后的“报复性旅行”吧。因为冠了“AI科技之旅”的名字,同时鉴于篇幅所限,我仅择取其中有“技术含量”的部分,按照“不违背和朋友的保密原则”,分以下几个部分记载如下。

一、OpenAI的研发机制

到达硅谷的第一站,就参加了一个预约已久的重磅活动,现场来了很多大佬:包括OpenAI 联合创始人、首席科学家Ilya Sutskever,微软首席科学家、人工智能战略的核心推手,同时也是美国总统科技顾问成员Eric Horvitz。两位图灵奖得主:GUI与面向对象的奠基人,Smalltalk之父Alan Key,以太网和镭射打印机的奠基人,第一台个人计算机Alto设计者、施乐 PARC创世成员Butler Lampson。还有在程序员圈子中大名鼎鼎的查尔斯.西蒙尼,微软历史上第一任首席架构师,领导了早期Windows以及后来的Word,Excel 的开发,也是第一个上太空的程序员(顺便提一下,程序员熟知的匈牙利命名法就是西蒙尼发明的)。

这个活动的初衷是为了纪念由施乐PARC研发的第一台个人计算机Alto,但同时因为身处AGI(通用人工智能)的前夜,活动也邀请了很多人工智能大佬。活动不可避免的焦点是拿OpenAI和施乐PARC的研发机制,以及二者划时代的产品ChatGPT和Alto进行比较。我个人认为这是本次活动最大的亮点,也是最有收获的地方:其深刻地揭示了OpenAI的产品研发机制。

产品工程组织 vs. 研究院

很多人对OpenAI有一种误解,认为它很像一些大学或者研究院一样的学术研究机构,因为它在AI领域的论文影响力很大。其实按照AI论文发表数量来说,OpenAI在全球排不上号(但是如果按照AI论文引用次数来说,OpenAI在全球排行第9)。

但Ilya深刻地纠正了大家的这种误解。他在对比OpenAI和施乐PARC时,非常强调OpenAI聚焦产品的工程组织,而非它的学术成就。他特别强调OpenAI是在“Build”,而施乐PARC是“Invent”。了解施乐PARC历史的朋友都知道,虽然PARC研究中心发明了第一台个人电脑Alto、GUI(图形用户界面)、鼠标、以太网、激光打印机等等彪炳史册的“创新”,但是施乐PARC也仅仅是Invent出来它们最初的概念原形,却没有持之以恒地将它们Build成可以scalable的大众可用的产品,这导致绝大多数发明被乔布斯、比尔盖茨等摘了最后的果实(个人电脑成就了苹果,GUI成就了微软,以太网成就了3Com,等等不一而足)。从产品的角度来看,很多后人甚至认为PARC研究中心是施乐的“败笔”。

与OpenAI首席科学家Ilya Sutskever交流

而Ilya和OpenAI的创始团队(包括Sam Altman、Greg Brockman)对类似施乐PARC的研究院性质的“败笔”有着非常深刻的警觉和认识。这使得OpenAI从成立第一天起就致力于通用人工智能AGI产品的打造,并围绕这一愿景来构建自己的组织。包括围绕GPT技术进行的一系列创新:PreTraining(预训练), Supervised Finetuning(监督精调),Reward Modeling(奖励建模), Reinforcement Learning(强化学习)。这些创新在学术人眼里(比如著名的图灵奖得主Yann Lecun)谈不上是特别大的创新,因为它们都是围绕如何打造AGI产品进行的“工程创新”,但正是这些造就了ChatGPT的出道即巅峰。我认为这才是 OpenAI 这个团队让人生畏的地方,不仅是对通用人工智能的技术信仰,不仅仅凑了一堆顶级人才,而是对围绕 AI 的整个研究、工程、产品、组织,有着极具远见的思考。

OpenAI和施乐PARC的深刻区别,我觉得也回答了为什么ChatGPT出自OpenAI,而不是出自Google Brain、DeepMind、或者微软研究院。很简单,后面几个都是施乐PARC的“翻版”—— 执迷于新奇的发明,却没有对“用户可用的产品”的强有力聚焦;沉浸于学术论文竞赛,却忘了理论创新和工程技术之间的巨大鸿沟。

无独有偶,最近听说阿里裁撤了达摩院,我觉得这是一个无比正确的决定。其实纵观科技史,由公司成立的学术性的研究院,虽然听上去很光鲜,但绝大多数都是失败的。我记得早在2013年我在波士顿参加MIT一个活动时听过Data Domain的创始人、将公司以21亿美元卖给EMC公司的“身价最高的华人教授”李凯谈过自己的研究“所有科技公司巨头在成功之后都执迷于成立自己的研究院,来试图孵化创新产品,但这些研究院没有一个成功的,真正的产品创新从来没有在研究院诞生过”,我记得他当时就预言Google Research不会成功。虽然当时来看这个预言有点大胆,但放在更长的历史长河来看,我觉得这个说法很有远见。

二、Google 的 AGI 战略

在硅谷聊AI肯定绕不开Google这一AI 前现代的恐龙。显然自去年底OpenAI发布ChatGPT,向AGI发起冲击后,Google就面临巨大的战略困境。正好这次硅谷行程,赶上了Google针对AGI战略困境的几波大动作调整。

这次硅谷行程,前有Google 将AI研究重镇Google Brain合并入DeepMind,两位大将Jeff Dean改任Google首席科学家;深度学习之父、图灵奖得主Jeffrey Hinton离任;后有Google I/O大会推出PaLM等一系列大模型相关的框架和产品升级。可谓一波未平,一波又起。

首先是组织调整,Google将自己悉心经营多年的AI战略级堡垒Google Brain合并入收购来的英国公司DeepMind(曾因AlphaGO一战成名)。Google Brain的负责人Jeff Dean也改任首席科学家。前面谈过我的观点,Google Brain隶属于Google Research,研究院性质,和施乐PARC类似,逃脱不了研究院的命运。虽然从情感上,这种调整难免让很多Google人倍感失落,特别是神级人物、长期主导Google技术底座、创造了MapReduce、BigTable、TensorFlow、TPU等一系列技术里程碑的Jeff Dean在此次调整中也大权旁落,让包括我在内的很多技术人深感悲凉(顺便说一句,我个人非常尊重Jeff Dean,也和Jeff Dean本人有过几次email交流,深感他对技术的insight和对人的宽厚友善)。但从战略上来讲,我觉得这种“拆掉研究院,聚焦工程产品”的组织调整是非常正确的。虽然从道听途说的一些DeepMind及其创始人Demis Hassabis的一些故事来看,我个人并不看好DeepMind能够扛起对抗OpenAI的重任,我觉得Demis Hassabis也要低Sam Altman、Ilya Sutskever、Greg Brockman这三位联创组合好几个段位(纯属个人臆断)。

另外,深度学习之父、图灵奖得主Jeffrey Hinton(也是带领Ilya在深度学习领域登堂入室的恩师)也在战略档口离任Google,消息一出不免震惊业界,但个人觉得影响有限,毕竟Hinton在Google Research只是研究科学家的角色,加上年龄因素(76岁高龄),和Jeff Dean带来的巨大震荡不可同日而语。

其次是产品调整,Google I/O大会一口气推出自家大模型PaLM2,对标ChatGPT的Bard升级,对标微软Copilot的Duet AI等“AI万花筒”。和部分国内媒体为了抢流量而胡乱鼓噪的“炸裂”、“史诗进化”评价不同,我和相当一部分硅谷朋友交流,对Google这样的被迫应对、急就章式的“AI万花筒”并不看好。首先,Google I/O大会一直有着“PPT发布会”的“坏名声”,如果回顾Google I/O大会的历史,大家会发现很多I/O上发布的产品,真正面世、并且成为主力产品的寥寥无几;其次,这次大会提到的很多技术和产品,经常语焉不详、具体信息很少,比如最受关注的大模型PaLM2,和GPT 4.0大模型的技术指标对比如何?在具体产品中应用的效能提升如何?这些全没交待,有的只是一些远景和想象空间。

如果说我较为关注的I/O大会重点,那就是PaLM2包含的4种不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn)。特别是Gecko这样的小模型,在Google 拥有Android这样的移动平台下,是极其有战略意义的。但很遗憾,这些模型没有看到有意义的应用,也没有看到更多细节。

最后Google的开源战略也面临巨大的调整,不仅PaLM2 没有选择开源,Google也不再鼓励首先发论文(理论开源),而是优先发布产品——了解Google的人都知道,这个是更为深刻的变化。

下面谈谈我对于AGI时代Google的战略认识

首先,以GPT为代表的AGI会重塑很多行业,所有的应用都会被大语言模型所改变,这已经是硅谷人的共识。但是不同行业受大模型冲击的程度显然是不同的。我将这种冲击分为两类:一类是“渐进的增强式的改善”;另一类是“范式转换式的颠覆性改变”。如果将当前的应用分门别类:搜索、社交、电商、娱乐……等等。那么不难看出ChatGPT最可能带来“颠覆级范式转换”的领域是搜索;反而社交、电商等领域由于天然的双边网络效应,而在AGI时代呈现的是“渐进式改善”。

但正如“颠覆门户的不是更好的门户”,“颠覆搜索的也不会是更好的搜索”,以传统搜索为指标来看,ChatGPT在很多方面的表现无法直接超越Google(这也是部分Google人对ChatGPT不以为然的原因所在)。但产业发展的历史无数次告诉我们,范式创新的魅力就在于开辟全新的战场,在新战场中,巨头的优势将荡然无存。这也是“守城巨头”永远面临的“创新者窘境”—— 这种曾经发生在柯达、诺基亚、摩托罗拉、Yahoo、以及 Intel、丰田等等巨头身上的“创新者的窘境”现在正在叩响Google的大门。

虽然ChatGPT没有正面进攻Google的核心领域搜索,但是ChatGPT的用户数和日活、时长这些都在稳步增长,包括我和身边朋友的体验来看,使用ChatGPT之后,Google的使用行为日渐下降是不争的事实。这就是Google真正的危机。

而OpenAI一个很高明的战略是和微软深度合作,一方面拿到百亿美金量级的宝贵投资——玩AGI实在太烧钱了,即使硅谷顶级VC的资金量也根本无法满足OpenAI的胃口;另一方面,让Bing来正面进攻Google的搜索,而ChatGPT却可以避开Google的火力、全力以赴开拓AGI时代的平台级机会——OpenAI在Google和微软两大巨头中纵横捭阖的战略之高明,我觉得会在未来5~10年让所有人目瞪口呆。

当然也有一些朋友会认为即使Google在AGI领域抢不到头炷香,但Google毕竟是万亿美金的公司,就像微软在移动互联网领域落败,但并不影响今天的微软仍然是万亿美金俱乐部的三巨头之一。

我认为Google所处的战略位置和微软是非常不同的。首先微软传统上是一个toB公司,即使发生移动互联网这样的范式转换,但是微软很明智地抓住了“云计算”这一战略,而云对toB产品是一个相得益彰的支撑,而移动互联网对toB是一个渐进增强的改善、而非颠覆级的范式转换,所以移动互联网的落败对微软其实没有到伤筋动骨的程度。

而Google是个彻头彻尾toC的公司,从OpenAI的一系列大手笔布局来看,AGI发生范式转换的领域首当其冲的将是toC的用户入口。一旦用户入口发生范式转换,Google的搜索将被ChatGPT这样的AGI产品旁路绕过;就像当初Google搜索旁路绕过了Yahoo的门户一样。这样的范式转换一旦完成,Google的用户时长将出现断崖式下降,那时的Google帝国将岌岌可危。

历史的来看,所有的toC巨头在用户入口发生范式转换时,没有能够还稳居宝座的,从来没有,Google也不会例外。除非Google拿出更大的魄力绝地反击(类似乔布斯当年回归苹果那样的绝地反击)。

无论成败,这绝对是科技史上一出史诗级大戏,让我们拭目以待!

三、微软的 AGI 战略

微软在这一波堪比工业革命的AGI变革中,非常智慧、也非常幸运地找到了绝佳的位势。首先微软对自身有清醒的认识,虽然微软全球的研究院在AI领域布局多年,总人数也数倍于OpenAI的300多人(OpenAI 2022年底的总人数是375人)。但如上文所说,研究院的性质就决定了不可能做出OpenAI这样的巨大产品级创新。所以,当微软高层看到OpenAI在GPT方向上的颠覆式创新后,果断砸入100亿美金,占据49%股权。

这个股权也是Sam Altman等联创非常高明的设计,一方面不出让控股权(也有条款确保了OpenAI不会被微软收购);同时通过大比例的股权出让,和今后的利润分配许诺,也“利诱”了微软果断豪掷100亿美金,确保了OpenAI发展所需的巨量资金。

同时OpenAI和微软全系列产品的战略级合作,让微软获益匪浅,这从微软最近的Build 大会能够看出来。微软长期耕耘toB领域,从Windows、Office、到Github、Azure Service等一众生产力工具和云服务,非常适合AGI的Copilot的赋能增强。对于微软这样的“守城巨头”,不需要追求什么大的范式转换,微软只要能继续在AGI时代,稳居生产力工具的“宝座”,同时在云服务领域如果因为Azure 的大模型能力将亚马逊的AWS挤下神坛,那么微软的万亿美金江山可以在AGI时代延续。

而OpenAI通过出让股份和GPT技术给微软,既获取了宝贵的发展资金,同时实现了GPT技术在“自己不擅长也没有积累的”toB领域的变现,还有效地撬动微软在搜索正面市场阻击Google,从而使自己腾出战略力量在AGI生态级toC市场蒙眼狂奔。可谓一石三鸟。

从以上分析来看,微软和OpenAI的战略级投资与合作,可谓天作之合,各取所需。

四、AGI的生态发展和未来版图

目前的态势来看,以大模型的主力军团来看,硅谷的AGI 发展势力可谓三份天下:OpenAI与微软为一方、Google为一方,由Meta开源的LLaMA及斯坦福、伯克利的羊驼系列等构成的开源生态为第三方。

而与此同时,国内号称发布10亿参数以上的大模型已经达到79家(家家都声称原创,总之我不信,不知道大家信不信),我和硅谷人提起这个,大家惊讶的同时,也常常笑而不语(你懂得)。因为在硅谷,真正做原创大模型的其实不超过10家。而更多的公司聚焦在AGI各个赛道的产品生态上,比如:Midjourney, Character.ai,Stable Diffusion,Inflection AI等AGI创业公司灿若群星,而专注于toB领域垂直应用的大模型公司更是数不胜数。它们在AGI细分领域产品赛道的奔跑速度和实力其实不亚于很多巨头。

这也一直是硅谷引领科技发展浪潮的典型所在:巨头三国杀之外,往往有森林般的应用生态,一派“万类霜天竞自由”的景象。

这次硅谷行程,我也有幸与部分在这些AGI创业公司的朋友交流,这些AGI原生公司(所谓AGI-native)个个创意十足,锐气满满,让我大开眼界的同时,也对AGI的发展产生了更多的启发和思考。实际上,深刻理解这些应用生态,我觉得对于我们如何面对AGI时代,是更有指导意义的。

篇幅所限,我会在接下来的时间将我对于硅谷AGI产品和应用生态的所见所闻、所思所想,整理为一个报告,在6月16-17日上海举办的PM-Summit 2023 全球产品经理大会上,通过主题演讲《AGI时代的产品版图与范式》和大家分享,感兴趣但无法到会的朋友,欢迎登陆大会网站:www.pm-summit.org 首页底部“领取演讲PPT“(或点击阅读原文)。

这次硅谷之行收获满满,实现了我最初规划行程时的目标——“在创造未来的地方看未来”。是为硅谷AI纪行。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存