夹缝中的英伟达中国|智涌深度
文|杨逍
编辑|苏建勋 杨轩
穿着大花袄,转着红手绢,入乡随俗的英伟达CEO黄仁勋脱下他标志性的黑色皮衣,在全体上海员工的哄闹中,跳起了东北大秧歌。这是时隔4年,黄仁勋再度光临英伟达中国年会。
在英伟达内部,黄仁勋此次“访华”是高度机密,“当主持人说有请我们最亲密的家人后,很多人都在猜测是谁”, 英伟达内部员工告诉36氪,“直到老黄出现,全场沸腾,完全没想到他会来。”
英伟达的员工大多视黄仁勋为偶像。他的到来将年会气氛推向顶点,也给英伟达中国员工和合伙伙伴吃了一颗定心丸。5天时间,他连赶了3场年会。
美国的芯片禁令,让这家芯片巨头过去一年,在中国市场举步维艰,黄仁勋2023年6月原定的访问中国大陆的行程取消后,甚至有员工在视频会上问道:“你还能来中国吗?”
但黄仁勋的意外光临,打消了员工的疑虑,也在这个充满寒意的冬天,向整个英伟达中国员工传递出了积极的信号。
英伟达无疑是2023年全球最受瞩目的公司。大模型火爆带来的芯片需求激增,让它在这年赚得盆满钵满,前三个季度总营收达到388亿美元,同比增长85.5%。
英伟达股价更是水涨船高,一年时间翻了3倍,截止2024年2月2日收盘,英伟达股价已突破660美元/股,有望成为又一家突破2万亿美元市值的科技巨头。
英伟达员工“靠股票致富”一度成为行业热闻,令人艳羡。但在中国,英伟达所面临的局面却颇为尴尬。
显卡两次被禁售,一度让英伟达在中国几乎无货可卖,业绩遭遇了巨大下滑。公司新改良的PCIe L20(面向中国市场的用于AI推理特供版GPU,以下简称“L20”),在大模型训练市场销售艰难。
黄仁勋访华后仅10天,市场上便立刻传出HGX H20(面向中国市场的用于AI训练特供版GPU,以下简称“H20”)的消息。但H20仅面向大客户开启预定,至少等到2024年下半年才能到货。接近英伟达的人告诉36氪,销售们都表示中国市场四季度“废”了。
英伟达主要通过代理商出货,其官方合作伙伴的员工管业曾私下透露,“第一次被禁后,我们冲了一波业绩,但第二波被禁后,英伟达几乎全系列数据中心的卡全部砍了,我们每天问老板,可以卖什么?”
无事可做,也让英伟达部分员工,尤其销售和客户服务相关部门产生了巨大的隐忧。部分企业端的销售开始卖起了软件和InfiniBand网络产品(用于服务器间互联的通信产品,以下简称IB网络),但这聊胜于无。
核心产品两次被禁后,一次视频会议上,英伟达中国员工向黄仁勋发问,“你会裁员吗?”
这是夹缝中的英伟达中国员工最真实的情绪反应,他们担心自己的前途,尽管黄仁勋一再强调“不会裁员”,但当时代的重锤落下,英伟达中国就如同两个大洲板块碰撞下的边界,除了承受挤压,别无他法。
“无卡可卖”的2个月
在英伟达生态圈多年,管业(化名)从未经历过如此艰难的时刻。
2023年10月底,美国对中国发起了第二次AI芯片出口管制,除了此前已被禁的A100和H100,专为中国市场推出的改良版芯片A800、H800芯片被列入名单,就连消费领域的4090卡也成为牺牲品。
这让作为英伟达合作伙伴的管业感受到了一丝绝望。因为只卖英伟达产品,管业所在公司的一切业绩都系英伟达之上。
可如今英伟达企业端根本没卡可卖,“当时嫌弃A800难卖, 现在我们每天都得问老板,还能卖什么”, 管业感慨道。
一时之间,整个产业哀鸿遍野。在当下最火热的大模型训练市场,英伟达的服务器是最重要和几乎唯一的算力武器。买不到英伟达,就意味着没法训练大模型,在这场百模大战中失去先机。
为了缩小损失,第二次禁令到来后,英伟达内部立刻行动起来,更改符合规定的产品。
“大家几乎一夜之间从床上爬起,把产品重新翻新一遍,软件、硬件部门忙着重新配置GPU,后端忙着对硬件进行稳定性测试,完全是新品发布会前最忙的节奏。”一位英伟达员工回忆道。
不到2个月时间,英伟达便迅速推出了面向中国游戏市场的特供版本4090D,补上了市场的空缺。
比起游戏业务,数据中心业务的路无疑难了很多。被禁一个月后,产业便出传英伟达会为中国市场再推出三款改良版的企业端GPU芯片—— HGX H20、L20 PCle和L2 PCle的消息。
具有推理功能的L20 PCle卡迅速在市场上推出,但能用于大模型训练的H20,直到黄仁勋访华10天后的1月29日,才在市场上开始预定,但仅有大客户具有预定资格。
A800、H800被禁后的2个多月里,多位从业者告诉36氪,英伟达中国市场几乎所有数据中心显卡都被禁,目前能卖的GPU只有L20。
这是一款推理芯片,它的显存容量和访存带宽与被禁的L40S几乎没有差异,价格还便宜了一半,很适合用在AI的搜索、推荐等模型。接近英伟达的人士林琼称,第一批L20到货后很快就被字节、百度、腾讯等大厂分完了。
只要不用在大模型推理市场,L20就有着极高的性价比。可当英伟达中国不得不用它打大模型市场时,一切就变得艰难。
“我们做了很多测试来证明L20可以用于训练,但客户根本不买单”,英伟达内部员工冯元夏满怀无奈。
英伟达的员工很少会遇到如此艰难的时刻。这家芯片巨头一手发明了GPU产品,质量又向来过硬,员工销售时一向底气十足,很少有心里发虚和郁闷的经历,“明明是豪华车,却不得不跑在经济车赛道”,一位英伟达员工颇为无奈。
“A800、H800至少还能用,L20的性价比实在太低了。”一位对芯片需求较为了解的算力供应商周毅明告诉36氪。就连头疼卖什么的管业也表示:“见客户根本不说这个,没意义,他们只关心算力。”
除了算力性能不达标,L20卡推荐的是4卡机的方案,一台服务器只能放4张卡,这意味着要达到同等算力,它需要更多的机柜、更多的电和更多的场地,运营成本会更高。
管业苦笑,英伟达销售说这些成本用买卡省下来的钱就都抵消回来,不过是没东西可卖、不得已而为之的说法。
黄仁勋访华后才姗姗来迟的H20显卡,虽具有大模型训练功能,但现在完全没货,最早可能要6月份才能交付客户。“产能有限,肯定是生产最赚钱的产品”, 接近英伟达的人士林琼感慨。
无奈之下,中国的客户们开始了另一种选择——购买非官方渠道的英伟达GPU。
周毅明告诉36氪,在第二次禁售之前,国内客户都还老老实实购买为中国市场准备的A800、H800,但二次禁令后,大家索性放开了,直接购买H100产品。
“很多公司跑到海外,向国内卖英伟达GPU,每个月通过不同渠道都有H100进入中国。”
买不到货的客户也开始考虑起在海外建立数据中心,解决买卡难问题。AI领域从业者金杰表示,“很多人找我询问,有没有在海外建数据中心的合作伙伴资源。有大规模训练需求的公司可能不敢出海训练,但零散训练需求的企业,还是愿意试水。”
办法总比困难多,但无论是在海外购买的英伟达GPU,还是可能从中国走出去的数据中心客户,其业绩都将不再属于英伟达中国。
英伟达中国能做什么?
面对这种被动场景,英伟达中国能做的却十分有限。
最直接的,在何时推出、推出何种合规GPU这件事上,英伟达中国没有任何话语权,只能被动等待与美国总部的沟通。原本英伟达计划H20与L20一同在11月发布,但由于美国政府的限制,英伟达不得不调整计划,将H20的发布时间推迟。
哪怕不是这一特殊事件,英伟达中国的自主权和决策权也相对较弱,这从它的组织架构便可窥见。AMD有大中华区总裁,英特尔和高通有中国区董事长,但英伟达中国没有一个能代表中国区与美国总部进行沟通的总负责人。
严格意义上,英伟达中国并非独立闭环的组织,它的各个业务是总部各职能部门的延伸,每个业务都向总部职能线负责人汇报,一个仅十几个人的小团队也不例外。如果将各职能部门都视作八爪鱼的一脚,英伟达中国则更像是每个脚上的触须。
在这种架构下,英伟达中国更多承担的是执行功能,不具有决策权。一位英伟达中国早期员工告诉36氪,“很多事情都是有结果了才会通知中国,决策正确与否,全靠总部想明白。”
以商务为例,哪怕中国大陆已占到英伟达营收的20%左右,是其全球第二大市场,英伟达中国也没有一个商务总负责人,其消费业务和企业卡业务等条线销售负责人,都要汇报给亚太区的副总裁。换句话说,在中国,商务条线的高管只在业务负责人级别。
因为业务需求的暴增,英伟达北京办公室的员工相比2021年的约230人扩张了一倍,这其中很大一部分是销售和解决方案团队等前端员工。
“但在申请扩招时,英伟达总部很难理解,为什么需要这么多人?”英伟达内部员工很苦恼。销售们也经常在沟通中自嘲,自己在公司没有价值。
此外,商务在日常工作中的自主权也有限。英伟达的产品是统一定价,商务不能对产品打折,甚至他们在签单时也不能保证到货期,也只能向总部申请货源。
这种自主权缺失的问题,在市场营销等部门同样常见。
有英伟达前员工抱怨,“有时候想做一点本土化营销的东西,如微博营销、节庆等,总部并不认同。他们所做的亚马逊电商活动又不符合国内受众胃口。”尽管很多国外巨头在中国区都存在类似的问题,但英伟达无疑是其中对权限收缩较紧的。
“其实这就是一家硬件公司,市场、销售这些都是锦上添花,重要的还是产品够好或者够便宜。”一位英伟达前员工告诉36氪。
与市场、商务等业务相比,研发是这家公司的人才核心。英伟达中国曾被寄予厚望,总部一度将重要的芯片放在中国研发。
上海团队成立不到5年时,英伟达正研究全球第一款40nm GPU芯片,当时便将数字后端工作交给了中国团队。这也是英伟达在40nm制程的第一颗芯片,有着特殊性。不过这款芯片的研发并不顺利,当时台积电40nm工艺难产影响了芯片研发进程,就连已退休的张忠谋也不得不回到公司解决工艺问题。
“但总部给了机会,这件事在英特尔、AMD是不可能发生的。” 莫风鸣表示。
英伟达愿意给中国团队机会,但在海外法律等限制因素影响下,总部不得不思考哪些业务可以放在中国,英伟达中国也很难参与GPU最核心的架构设计和研发,这也让部分员工因“只能做边缘工作”、“只能当螺丝钉”等原因离职。
据莫风鸣介绍,英伟达中国部分员工曾有机会参与高端CPU的研发,但被美国政府关注到后该业务作废,重新收回美国总部。
发展到最后,“前端越靠前的越在美国,我们参与后端。”莫风鸣表示。
如今,英伟达上海的后端团队也是英伟达最大的后端设计团队,几乎英伟达每一款芯片等流片都需要中国后端测试、验证团队的参与。英伟达中国也有一些独特性的业务职能,在总部退出视频编解码业务后,英伟达中国成为公司内部唯一拥有完整编解码人员配置的团队。
何去何从?
两次产品被禁,英伟达中国的员工都问了黄仁勋同一个问题,“你会裁员吗?”
英伟达的产品不在中国生产,卡全靠进口。一位内部员工担忧道,“如果哪天老黄舍得放弃中国市场,当场关闭,就什么也没有了。”在代理商看来,英伟达减少部分员工也并不影响其运转,“他们即使只做大客户的生意,也有很大订单。”
在2023年,裁员一直是科技大厂避不掉的话题,AMD 、英特尔、高通、德州仪器等公司接连裁员。如AMD对RTG部门,即负责GPU的设计开发的团队进行优化;德州仪器则裁撤了中国区MCU研发团队,将MCU产品线迁往印度。有“英国英伟达”之称的人工智能(AI)芯片独角兽Graphcore,也裁减了大部分中国员工,退出中国。
面对如此复杂的局面,黄仁勋给出的答复却是“不会”,且表示公司仍将扩招。
他的态度罕见地鲜明、直接。对比2018年美国总部问是否会裁员时,当时黄仁勋并未给出直接答复,只是举例不会轻易裁员,2008年金融危机时也是通过全员降薪度过的危机。
这的确安抚了人心,尤其是研发人员。一位英伟达的研发告诉36氪,禁令后大家很担忧裁员,“但现在安全感挺高,老黄在公司说话非常有分量。”研发所从事的产品软硬件开发,通常以项目制为周期,其工作目标不以业绩为导向,产品面向全球,所受影响其实相对较小。
最焦虑的是与客户接触最多的销售员工。“他们只有做底层开发的软件工程师不会担忧,像商务和SA都非常焦虑。”管业告诉36氪。
SA是英伟达与商务配合的部门,帮忙推广产品、测试产品性能等。“他们的工作和本地客户联系非常紧密,如果没有芯片可卖,工作会受到影响。”一位英伟达内部员工告诉36氪。有的销售员工则担心“明年我还在不在都是问题”。但没人知道答案。
禁售后,原本“事无巨细,半小时没回复客户消息就会投诉你”的英伟达商务们,陷入了迷茫。当代理商询问产品消息、情况,得到的都是“不要问我”、“等官方回复”、“问我们市场同事”的回答。
在此之前,他们完全是另一个状态——每天行程安排很满,“哪怕干到夜里3点,第二天早上照样8点起来、回复工作消息。”
这种焦虑的情绪,在可用于训练市场的H20卡开启预定后,得到了一定的缓解。
1月29日,黄仁勋访华10天后,新华三宣布将为东方国信首批提供 H20 GPU 系列算力服务器。这是首个关于H20预定的消息,也意味着,在不远的将来会有更多中国客户可以订购到H20。
不过,H20在算力上还是进行了压缩。H20的峰值算力仅英伟达H100的15%,但显存带宽维持不变。
“老黄非常想保住中国市场,每生产一块H20,就意味着少生产一块H100。H20的价格相比H100非常有诚意,现在可以说是赔钱保市场。”一位英伟达的员工表示。
市场对H20的态度还算积极。一位行业人士告诉36氪,此前大家对于H20的预期就很低,但这个卡价格上划算,相较国产芯片重新适配Cuda生态和做无数次的大规模测试,H20的成本是可控的。
不过即使能买到,禁令和合规也会像达特茅斯之剑一样垂在英伟达中国和国产厂商的头上。“合规卡的生命可能在18个月左右,之后会被新的合规卡取代”,上述行业人士表示。
两年两禁,也彻底打破了国内客户的幻想。接近需求端的从业人士宫浩满怀不满和无奈,“今日割5城,明日割10城,总不能别人限制什么我们用什么”。如今,客户纷纷开始尝试国产GPU产品,“哪怕不好用也要用起来”。
更换国产GPU是一件成本很高的事情,Cuda生态是英伟达强大的壁垒,企业和GPU公司驻场团队要磨合至少半年,开发算子和打磨产品都需要时间。如今,有国产GPU公司已经开始与互联网大厂合作,为其写算子库,让GPU显卡能变得好用起来。
随着市场转向,国产GPU卡的租赁和购买价格也水涨船高。AI领域从业者金杰告诉36氪,华为GPU卡的算力租赁价格已经跟A100、A800相差不大。
为了抢夺可能失去的市场,一位接近英伟达销售的合作伙伴透露,H20的降价可能会很快到来,这在之前的英伟达,是很少出现的情况。
除了在风雨中飘摇着的GPU卡,如今,商务们也正努力寻找新故事和潜在用户。为了寻求自救,英伟达商务也开始宣传起了IB网络和SDK等软件。
网络传输能力是英伟达的一大技术优势,英伟达如今将IB网络拿出来单独售卖。网络传输有以太和IB组网两种产品,在做大模型训练时,采用IB组网能有更快的数据传输效果。但大部分客户,都倾向于采用以太网络。英伟达这项业务的营收非常少,“九牛一毛”,很难养起一家公司。
除了IB网络,软件产品也是英伟达的商务们今年发力的重点方向。
售卖软件是英伟达的一项新业务。2022年英伟达第一次被禁前后,英伟达开始将软件产品作为一项独立产品售卖,到2023年8月左右,英伟达还对软件产品进行了调价。
接近英伟达的人士告诉36氪,2023年英伟达的合作伙伴做了很多小型峰会来推广软件产品。如具有在线协同工作功能的NVIDIA Omniverse等。不过由于售价太高,推起来难度也较大。
现有市场之外,英伟达中国也开始找寻新的发展方向——自动驾驶。
这是英伟达投入已久的潜力业务,英伟达的自动驾驶芯片Orin一直声名响亮,在高端智能驾驶市场几乎独占鳌头,但其整体解决方案一直在业内被人诟病。此次在中国部署的自动驾驶团队,主要就是从事量产及解决方案业务。
2023年12月,加入英伟达不足4个月的吴新宙,火速带着数个部门VP回国,加速自动驾驶业务招聘事宜。如今其招聘已取得初步成果, 2个月时间,英伟达便招募了超100名员工。
一位猎头告诉36氪,他们的招人策略也从以往的看综合素质,到要求快速进人,补齐团队空缺,更具体的是具有量产服务经验、能打仗的团队,很多团队为了进人甚至放宽了对英语的要求。
“卷”,是对自动驾驶团队的核心要求,这跟英伟达此前的文化截然相反。现实也的确如此。在一向以WLB(生活、工作平衡)的英伟达中国,他们开始了周六、周日加班的节奏。
卖软件、解决方案、IB网络,加强自动驾驶领域重要性,都是英伟达中国对抗GPU市场下沉的努力,因为它懂这种经历将带来何种打击。
在GPU概念还不为人知、CPU当道的2015年,美国就曾为了限制中国超算的发展,禁止英特尔向中国四家超算公司出口高性能计算芯片。
这给英特尔带来巨创。当时,采用中国E级超算天和2号所采购的英特尔Xeon处理器和至强Phi加速器芯片,占到英特尔该芯片约一半的销量。次年,英特尔Phi 7290、7250加速器价格腰斩,Phi 7290更是于2017年直接停产。而中国也逐渐发展出了自研的CPU芯片。
尽管去年12月,8天内连续访问了日本、新加坡、马来西亚和越南四国,但黄仁勋清楚的知道中国市场的重要性,他曾在接受金融时报采访时说,“如果失去了中国市场,我们并没有应变计划。中国只有一个。”
从成立以来,英伟达中国就在一直向上,并在如今了达到顶点。但当一切变化迅速袭来,面对本属于自己的时代,以及随时可能流走的机会,英伟达中国目前只能承受、适应。
在时代的枷锁下,如英特尔的Phi芯片一样,在板块挤压下坠入海沟,大概是英伟达中国最不愿看到的事情。
(文章中出现名字皆为匿名)
36氪旗下AI公众号