查看原文
其他

造梦者:美国AI大模型背后何许人也?

The following article is from 复旦中美友好互信合作计划 Author 何文翔、李亚琦

* “中美友好互信合作计划”是由复旦发展研究院和丰实集团共同打造的中美关系研究的学术平台


OpenAI发布大模型产品SORA(图源:Medium)





随着OpenAI最新的文生视频大模型Sora和Anthropic的人工智能模型Claude 3相继亮相,华裔力量赋能下的美国大模型团队接连推出“颠覆行业”的革命性产品,这些大模型背后的团队和企业也从幕后被媒体推向台前,站在了聚光灯下的中心。此外,国内大模型团队如文心一言、Moss等亦正加速追赶。当这群技术过硬、履历闪亮的“年轻成功人士”为世人赞叹时,其背后的典型特征与共通之处更值得被我们关注。


OpenAI:技术和人文的融合


1Sora团队:年轻又老成的多面手团队


Sora核心团队有15人,由Bill  Peebles和Tim  Brooks两人领衔。其中正是Brooks瞩目的多元标签让Sora团队被民间热议,但“斜杠青年”团队也确实能拓宽认知边界,激活创新想象力。Brooks涉猎广泛:摄影作品曾获“国家地理”颁奖、百老汇演出、B-Box国际奖项……他本人曾表示“幸运的是,人工智能与我对摄影、电影和音乐的热爱融为一体”。据已有资料,其他成员暂无显著的业余兴趣,但值得注意的是,Sora团队有非计算机科班的成员,这与ChatGPT等团队完全聚焦硬科技有所不同,如媒体界出身的Natalie Summers在团队中负责公关传播,Joe Taylor曾就读新媒体与计算机艺术专业。


尽管名校背景和学历基础对科技项目很重要,但Sora团队更强调年轻化,不排斥草根人才。在教育背景上,Sora团队的名校特色并不突出,具有如麻省理工大学、加州大学伯克利分校等名校背景的成员约占一半。Sora团队的学历亦同理,据已披露的资料来看,只有四位成员有博士学历,而Will  DePu、Schnurr和Taylor等成员均非博士。


然而,这支年轻团队却并不稚嫩,行业经验非常深厚,大部份成员在OpenAI前有多份任职履历。例如,两位团队负责人始终在美国顶尖科技公司闯荡,期间多次作出重要贡献:Brooks先后在脸书、谷歌、英伟达和现公司OpenAI任职或实习。在谷歌,他为Pixel手机摄像头提供强大的AI支持。在英伟达,他带领团队研发尖端的视频生成模型;Peebles先后在英伟达、Adobe和Meta实习。本科学历的Will  DePu在高中时便自主创业,成立Deep Research公司。可见Sora团队成功破解了年龄与经验的悖论,成员兼具年轻与老道的双重优势。


Tim Brooks的行业经历(图源:领英)


Sora团队目前仍在持续扩容,产品亮相的两天后,David Schnur便在X发布招聘启事,召集有大型视频基础设施经验的人员,可见该团队仍在研发道路上前进。而未来Sora团队的新人是否依然契合这支年轻又多才的技术生力军,则值得进一步关注。


此外,Sora团队还有几位Dall-E大模型团队的老将坐镇,因为Sora在一定程度上继承了Dall-E的衣钵,因而团队成员也有重叠。Brooks是Dall-E 3的作者,Aditya更是Dall-E系列的元老,主导了三代产品的研究。


2ChatGPT:全球化的硬技术“天团”


根据OpenAI官网显示,为ChatGPT项目做出贡献的人员共87人。据Aminer和智谱研究的联合报告分析发现,其显著特征是“年纪很轻”“背景豪华”“聚焦技术”“积累深厚”“崇尚创业”和“华人抢眼”。ChatGPT团队职位分工,研发人员共77人,占比88%,含1名公司联合创始人Wojciech  Zaremba(被评为2023年AI  2000机器人领域最具影响力学者);产品人员共4人(占5%)。另外,6人职位信息无法获取。从成员职位构成看,该团队未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。


从ChatGPT团队成员毕业高校分布看,斯坦福大学校友最多(14人),其次是加州大学伯克利分校(10人),第三是麻省理工学院(7人)。我国清华大学与卡内基梅隆大学并列第7名,各有3人。在团队成员毕业人数前10名的高校中,均有2人及以上的分布量,共计54人,其中7所高校位于美国;排名第10之后的高校均只有1人,其中不乏全球顶尖大学,如牛津大学、东京大学、康奈尔大学等。总体看,ChatGPT团队成员绝大部分拥有全球顶尖或知名高校学位;另外,其毕业院校相对分散,前3甲高校只占总人数的37%。


ChatGPT团队成员毕业人数前 10 名高校(来源:Aminer和智谱研究的联合报告)


ChatGPT团队中的华人表现抢眼。团队共有9为华人,占团队总人数10%。其中5人本科就读于中国内地高校,3人大学教育经历均在美国高校完成。


  ChatGPT 团队中的华人成员(来源:Aminer和智谱研究的联合报告)


报告分析称,ChatGPT团队成员主要来自外部公司(81%)、高校应届毕业生(13%)、科研机构(4%)和高校教职人员(3%)等(如下图所示)。其中人数来源最多的外部企业是谷歌,共10人跳槽加入;来源人数超过2人(含)以上的外部企业还有Facebook、Uber、Quora、NVIDIA、Microsoft、DeepMind  等知名科技公司。以应届生身份直接加入ChatGPT团队的共11人,其中5人来自加州大学伯克利分校、3人来自斯坦福大学,  麻省理工学院、卡内基梅隆大学和哈佛大学各1人。可见,ChatGPT团队成员不论是企业转入还是应届生直入,各方背景都相当“豪华”。


ChatGPT 团队成员流动示意图(来源:Aminer和智谱研究的联合报告)


3Anthropic团队:GPT系列的起源与超越


Anthropic发布的Claude   3系列模型,包含Haiku、Sonnet和Opus三个版本,在多模态和语言能力指标上全面超越了GPT-4。其中,作为系列中最先进的模型,Opus在处理复杂任务时能与人类媲美。科技界有观点认为,Claude  3模型的发布“意味着GPT-4时代的终结”,更是引发了各界对GPT-5发布的期待。


事实上,Anthropic的模型能追赶甚至超越GPT-4,很大程度上因为团队本就有OpenAI   技术路线的老员工组成。团队于2021年成立,早期成员均为OpenAI原班人马,并具有丰富的GPT系列经验与能力:Anthropic联合创始人兼CEO  阿莫代(Dario  Amodei)为OpenAI工作了5年,曾任研发副总裁,参与了GPT-2、GPT-3的研究。Anthropic团队中还有负责 GPT-3  基础设施训练的Tom Brown、参与数据处理的Benjamin Mann和参与算法研究的Nicholas Joseph等人。


甚至可以说,Anthropic团队班子引领了OpenAI的大模型浪潮。最初  OpenAI 希望将AI往游戏、机械臂等方面发展,而正是阿莫代和OpenAI首席科学家苏茨克维尔(llya  Sutskever)一同确定了让OpenAI专注于大语言模型研究。Anthropic因此也被称为最有可能与OpenAI竞争的公司。接下来两年,Anthropic将致力于让开发大模型的资源迅速补齐。截至2023年底,Anthropic从亚马逊、Google、Salesforce等投资者手中筹集70多亿美元,融资规模仅次于OpenAI。


美国大模型团队各有特色


据微软内部知情人士透露,微软组建了一个名为“GenAI”的团队,作为Azure  cloud unit的一部分,由公司副总裁Misha Bilenko领头,直接向公司CTO Scott汇报。据The  Information报道,新的GenAI团队专注于开发小语言模型(SLM),与OpenAI的GPT-4 等LLM类似,但使用的算力更少。


Bilenko曾经在有“俄罗斯百度”之称的Yandex担任人工智能研究主管,已领导Azure团队两年之久。这个“GenAI”团队的大部分成员,都是这两年一直在微软配合OpenAI团队落地的Azure工程师。除了实战经验丰富的员工,微软还调配了顶级AI研究员加GenAI团队,包括由Sébastien  Bubeck带领的微软研究院的研究人员。


在谷歌Gemini  方面,官方称整个Google团队(包括Google Research成员)通过大规模协作完成了这一项目。在谷歌发布的 Gemini  技术报告中,一共有837位作者参与了这一项工作,其中华人学者约有141位,包括谷歌首席科学家Ed Chi等人。团队分Leads、Core  Contributors、Contributors、Program Leads和Overall Technical  Leads五部分,其中Leads共有36人:Jeffrey Dean和Oriol Vinyals 作为Overall Technical  Leads,Demis Hassabis 和 Koray Kavukcuoglu是Program Leads。


Google发布大模型产品Gemini(来源:Medium)


从性别分布来看,Gemini Leads 36人中有女性8人,占总人数的22%;男性共28人,占78%。与ChatGPT 研究团队女性占10%相比,谷歌女性研究者相对较多。据AMiner 最新研究显示,36为员工中有目前有2人已经离职。


透视美国大模型团队的典型特征


华裔力量显著,且逐渐增强。OpenAI内的华人群体力量不容忽视。总体来看,领英(LinkedIn)平台上显示OpenAI   的1677名关联会员中,有23人毕业于清华大学,占比第九,超过了剑桥大学和耶鲁大学。按产品团队划分,15人的Sora团队中有4人来自中国;15人的Dall-E团队有9位华人;ChatGPT团队至少有61名华人,占比约四分之一。除此之外,英伟达、谷歌、Meta等科技公司的华人面孔也比比皆是。其中亦有不少脱颖而出者,如“现代AI先驱”李飞飞、英伟达联合创始人黄仁勋(Jensen  Huang)、Pika Labs创始人郭文景等。《南华早报》分析称,中国AI领域人才更偏向为美国的科技巨头企业工作,因为更容易“表现出色”。


英伟达联合创始人黄仁勋曾入选《时代周刊》2021年最具影响力的百人名单 (图源:《时代周刊》)


此外,未来印度裔的力量或将注入美国大模型团队。美国科技界的印度裔常被津津乐道,很大程度上是因为一众科技企业巨头的CEO均为印度裔,例如Alphabet&Google现任CEO  Sundar Pichai、Microsoft现任CEO Satya Nadella、Adobe现任CEO Shantanu  Narayen等均为印度裔。而在大模型方面,印度裔的OpenAI高级顾问Rishi  Jaitly曾在去年末表示,将带领OpenAI进军印度市场,目前也已经取得商标标准。素以高新技术著名的印度裔员工能否成为美国大模型团队的独立力量,值得拭目以待。


但是,就目前大模型团队的顶层架构来看,美欧精英化的程度依旧较高。在美国大模型巨头公司团队的族裔构成上,“年轻美欧男性”占据着与全美人口结构不相称的比例(例如,Sora团队除华人群体外几乎均为“美欧小哥”)。同质性的精英化一定程度上影响了大模型团队的设备和平台,算法和识别设计中存在争议性的种族歧视也无形中被嵌入。例如,Gemini曾生成有色人群身着纳粹风格制服的照片。一些业界人士也提出批评,特斯拉创始人马斯克(Elon  Musk)也屡屡批评Google AI的“种族主义编程”。


事实上,不仅仅是大模型团队,这是美国顶尖互联网企业的通病:团队逐渐变得更光鲜而缺乏多样性,重视利润而轻视社群。宾夕法尼亚大学的副教授杰西·林格尔(Jessa Lingel)称之为“士绅化”(Gentrification)。


除了以上具有人口学意义的特点外,在整个大模型行业上,人员流动性非常大,“潜力股”备受青睐。Sora的15人团队中,资料可见的成员均有高新科技行业任职经历。ChatGPT的83人团队中,81%来自外部公司(即“跳槽”而来)。而放眼整个OpenAI,员工的“跳槽率”也非常高,侧面证明了大模型行业的高流动性。值得注意的是,美国大模型行业的人才并未对模式成熟、资金流繁荣的巨头公司趋之若鹜,而是更青睐具有创新潜力、捕捉前沿脉搏的“潜力股”。例如,ChatGPT团队离职员工去向多为DeepMind、Github、Gretel.ai等企业,这些皆非光鲜亮丽的“大厂”。


从人才到生态:人工智能产业建设与竞争的逻辑


1
人才资源与流动:AI高地的起点与底盘


大模型企业耀眼的台前产品,台后则是团队的“人”发挥着关键作用。我国的人工智能顶尖人才主要聚集在高校和科研院所阵地,其储备量在国际上亦颇有竞争力。从全球数字科技人才机构分布看,中国科学院以4722人的数量名列第一名,以较大优势领先于排名第二的美国加州大学(2623人);进入全球前10强的中国机构还有两家,即中国科学院大学(1462人,第六名)、清华大学(1305人,第八名)。谷歌、微软公司的高层次人才数量排名分别位居全球第二名和第四名。


相比起美国,中国的人工智能的领军从业者往往具有以下几个特点:一是具有较深厚的技术背景,往往具有在国内高校、国企和研究所从事科研的经历,二是具有丰富的业界人脉,在国际学界和产业界上有一定声誉,三是年龄在30-50岁之间,在产业深耕多年,促进产学研的深度融合。


美国方面,其科技顶尖科研团队同样聚集在高校和科研院所,以美国顶尖高校(如斯坦福大学、卡内基梅隆大学、加利福尼亚大学、麻省理工大学、哥伦比亚大学、康奈尔大学等)为主,而目前越来越多大模型人才开始流向科技巨头(如谷歌、微软、IBM等)下设的科研机构。


值得注意的是,中国高科技人才仍存在外流趋势,这将对未来日益占据国际竞争中心的人工智能建设产生重大影响。通过梳理ChatGPT团队内华人成员的成长路径,发现他们往往在本科阶段就读于中国大陆高校,后赴美深造并获得硕士或博士学位,毕业后便加入美国诸如  Dropbox、OpenAI等创新型公司。例如,曾任Gemin多模态视觉方向联合负责人的Jiahui  Yu。他本科毕业于中国科学技术大学,博士毕业于伊利诺伊大学香槟分校。他曾在Adobe Research、Snap Research、Jump  Trading、百度研究院、Nvidia Research和Google  Brain等公司实习,并于2023年10月加入OpenAI。这反映了全球人工智能产业的人才流动格局,美国一直全球最大的人才净流入国。


全球人工智能人才流动的趋势和格局示意图(图源:Brookings)


2
从人才到产业:AI高地的“四梁八柱”


自2018年以来,中美科技研究合作便受较大冲击。2021年拜登上台以来,美国政府着力调整和优化其科技人才竞争政策,试图保持其对全球科技人才的吸引力,并重塑全球科技领导力。着力吸纳人才的同时,拜登又限制科技人才的流动,加筑关键领域人才封锁。与特朗普的“一刀切”式排斥性人才政策相比,拜登则延续对华遏制思路,试图在构建小范围开放人才生态和国家安全之间取得平衡。因此,在人才在新一轮发展意义显著与人才流动的严峻形势的双重叠加下,我国需要以人才为起点,进一步构建人才精良、技术领先与产业兴旺的人工智能大生态域。


在人才教育方面,我国需要升级人工智能教育体系,加强技术人才培养。而在人才吸引方面,则需在创新、创业、专利、商业等支持上尽快补齐短板,及时掌握大模型人才的职业选择、发展诉求等,从薪酬福利、考核评价、营商环境等方面入手,引导海外的中国技术人才反哺国内大模型事业。


科技人才教育和吸引是构建大人工智能生态的第一环,要构建大体量、高水平的人工智能高地,还进一步完善人工智能顶层设计,合理规划产业发展布局;推动人工智能立法,创造良好政策法规环境;激发人工智能创新活力,深化产业融合赋能。此外,在美对华科技频频施压的同时,我们仍应强化人工智能国际间合作,寻求更宽层次的发展空间,构建人工智能共同体。



参考文献

Heaven,  Will Douglas. 2023. “The inside Story of How ChatGPT Was Built from the  People Who Made It.” MIT Technology Review. March 3, 2023.  https://www.technologyreview.com/2023/03/03/1069311/inside-story-oral-history-how-chatgpt-built-openai/.

“智谱研究报告:揭秘ChatGPT背后的AI‘梦之队’  - 热点 - 科研解读 - AMiner.” 2023. www.aminer.cn. February 2023.  https://www.aminer.cn/research_report/6402a8397cb68b460f9b2a87.

Livemint.  2024. “Microsoft Reportedly Wants to Develop Smaller and Cheaper AI  Language Models.” Mint. January 24, 2024.  https://www.livemint.com/technology/tech-news/microsoft-creates-new-gen-ai-team-to-develop-smaller-and-cheaper-language-models-openai-large-language-model-ai-report-11706075901101.html.

Grant,  Nico. 2024. “Google Chatbot’s A.I. Images Put People of Color in  Nazi-Era Uniforms.” The New York Times, February 22, 2024, sec.  Technology.  https://www.nytimes.com/2024/02/22/technology/google-gemini-german-uniforms.html.

Clark,  Jeffrey. 2024. “Google Executive’s Posts about ‘White Privilege,’  ‘Systemic Racism’ Resurface after Team’s Botched AI Launch.”  FOXBusiness. February 23, 2024.  https://www.foxbusiness.com/media/google-executives-posts-about-white-privilege-systemic-racism-resurface-after-teams-botched-ai-launch.

CoCo  Feng, Ben Jiang.2024."OpenAI’s Sora pours ‘cold water’ on China’s AI  dreams, as text-to-video advancements prompt more soul-searching." South  China Morning Post. February 24,2024.

https://www.scmp.com/tech/big-tech/article/3253034/openais-sora-pours-cold-water-chinas-ai-dreams-text-video-advancements-prompt-more-soul-searching.

Issac Hanson.2024."OpenAI faces protests for military applications, but the market is growing." Verdict. February 19,2024.

https://www.verdict.co.uk/openai-faces-protests-for-military-applications-but-the-market-is-growing/?cf-view.

Jonathan  Yerushalmy.2024"AI deepfakes come of age as billions prepare to vote in  a bumper year of elections." The Guardian.February 23,2024.

https://www.theguardian.com/world/2024/feb/23/ai-deepfakes-come-of-age-as-billions-prepare-to-vote-in-a-bumper-year-of-elections.

Brandt,  Jessica, Pavneet Singh, and Melanie W. Sisson. 2022. “Succeeding in the  AI Competition with China: A Strategy for Action.” Brookings. September  2022.  https://www.brookings.edu/articles/succeeding-in-the-ai-competition-with-china-a-strategy-for-action/.


猜你喜欢

江天骄:Sora来了,但全球人工智能治理仍然“碎片化”
江天骄:人工智能 技术爆发 监管加强
金力:把AI训练成做题家是科技进步,把人训练成做题家是教育的落后
沈逸:AI发展要规避两大误区
姚旭:密切关注欧盟《人工智能法案》如何平衡监管与发展
“屠龙者”的选择?OpenAI“宫斗”背后人工智能的三重选择


往期回顾



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存