互联网大厂都在造什么芯片?
The following article is from 远川研究所 Author 任彤瑶
后疫情时代,不造两颗芯片似乎都不好意思叫大厂。最近,字节和快手也加入了造芯群聊。
字节的芯片团队划出了服务器芯片、AI芯片、视频云芯片三大类。快手发布了视频云服务品牌StreamLake,推出云端智能视频处理SoC芯片SL200。据其官方介绍,这款芯片视频压缩速率是“世界上最快的”。
钞能力大厂的加入直接推高了芯片设计人才的薪酬待遇,去年,百度的3个芯片相关人才被截胡,据HR部门透露,原因是“他们给的太多了”。
千方百计转行的集成电路专业学生,突然发现自己成为了大厂香饽饽。这让吃瓜群众多少有些猝不及防,硬科技的大旗怎么说扛就扛了?
01
大厂都在造什么芯?
关于大厂造芯这件事,首先要明确两个基本事实:
1.互联网公司造芯片是件很正常的事,不仅中国公司造,谷歌和亚马逊也造。
2.不过,互联网公司造的芯片,跟解决“卡脖子”问题没有太大关系。
早在2013年,谷歌就开始研发用于AI场景的TPU芯片,解决公司内部日益庞大运算需求与成本问题[1]。
当时,谷歌旗下已经有图像搜索、谷歌照片、云视觉API、谷歌翻译等和AI挂钩的业务,在这之后又收购了知名AI独角兽企业DeepMind,要支撑这么多产品和服务,数据中心的算力恐怕得再翻一倍。
2017年的乌镇围棋峰会,强化版AlphaGo2.0以碾压式优势三比零全胜,对弈结束后柯洁放声痛哭,靠的就是TPU芯片。
亚马逊也在2013年推出了Nitro1芯片,同样是服务自身业务。时至今日,亚马逊已经坐拥网络芯片、服务器芯片和人工智能机器学习芯片三条产品线,8年倒腾出9颗芯。
几年后,这股造芯热传递到国内,大厂陆续加入群聊。
2017年,百度和老牌半导体公司赛灵思合作了一款XPU芯片,并在此基础上自研了云端全功能AI芯片“昆仑”。
昆仑1经由三星代工成功量产,在百度搜索引擎及云计算上已经部署了两万片。2021年,智能芯片及架构部门干脆被拆分出来独立融资,估值130个亿,同时昆仑2进入量产。
阿里巴巴则全资收购了中天微(拥有大陆唯一自主嵌入式CPU IP Core),把它和达摩院芯片团队合并,成立全资子公司“平头哥半导体”。
目前平头哥共有玄铁(处理器IP)、羽阵(RFID芯片)、倚天(ARM服务器芯片)和含光(高性能AI推理芯片)四个产品系列。据称玄铁系列处理器出货量已超20亿,超过200家企业在用。
腾讯去年一口气发布了AI推理芯片“紫霄”、视频转码芯片“沧海”、智能网卡芯片“玄灵”三款产品。还先后入股了国产DRAM厂商长鑫储存、DPU独角兽云豹智能、芯片新秀光舟半导体等,还高薪收编造芯人才。
抛开大厂在产业链上的投资,单纯看自研芯片,它们的特点非常相似:大部分都是通用性不高的专用芯片。
举例来说,所谓通用芯片,如英伟达的GPU,可以胜任游戏、渲染、AI、挖矿等多个场景;而专用芯片大多仅用于某个非常细分的场景,比如世纪初曾诞生过一类名为PPU(Physics processing Unit)的芯片,独立于CPU和GPU之外,专门处理3D游戏中对物理效果的模拟。
平头哥自研的“含光800”就专门服务于淘宝的按图识别商品的功能“拍立淘”,5分钟就能完成10亿张“拍立淘”商品图的识别,而传统的GPU处理需要1小时。
比如淘宝的按图识别商品功能“拍立淘”,这是阿里决战购物节的法宝之一。用上平头哥的AI推理专用芯片“含光800”后,5分钟就能完成10亿张“拍立淘”商品图的识别,而传统的GPU处理却需要1小时。
简单来说,专用芯片牺牲了通用性,强化了某一特定功能。英伟达做芯片的时候,既要服务谷歌、亚马逊,也要服务特斯拉和蔚来,还要考虑广大游戏玩家和矿老板,这就是“通用性”。
而放在专用芯片上,研发AI推理芯片,不会考虑做AI训练这个场景。阿里给淘宝业务做芯片,也不会考虑拼多多用着顺不顺手。
由于极度专精,专用芯片的技术门槛相对有限。在设计这一环上,用在边缘侧、还有终端的很多芯片,干脆采用ARM和RISC-V等精简架构,指令集都是开源的;而一些专用性比较强的芯片,甚至完全可以采用自研架构。
所以,互联网公司自研芯片,最大的目的恰恰是他们目前正在做的事情:降本增效。
02
还是为了省钱
今年4月,谷歌发布了自研视频处理芯片Argos VCU,替换掉了数千万个英特尔CPU,一举为谷歌节省了200亿人民币的资本开支。亚马逊通过自研芯片处理Alexa语音助手的运算,成功替代了英伟达的芯片,降低了30%的成本。
自有芯片推出一年时间内,亚马逊云服务全年降价次数超过9次,成功带动下游客户一块降本增效。
所以,性价比才是大厂造芯的第一动力。比如,腾讯的“玄灵”就是把虚拟化这种不太重要的功能,让自研的专用芯片处理,那么成本更高的CPU就可以腾出精力,处理更重要的事情。
腾讯、字节和快手都在投入音视频云处理专用芯片,追求在更高压缩率、更小带宽下传输内容,要知道大厂们的带宽支出常年占比近10%,快手的带宽量级已经接近上百TB[3],有了专用芯片帮忙可以省不少钱。
简单来说,在流媒体播放、语音识别等特定场景中,可以用CPU/GPU这类通用芯片处理,代价就是效率不高、成本不低。因此,当业务量大到一定程度后,自研的专用芯片就是性价比更好的选择了。
在独立自主语境下,舆论期待大厂们和高通/AMD这类通用芯片设计公司硬碰硬,但这并不符合商业逻辑。
即便是苹果这样的公司,他们研发M1芯片的时候,也是从一些细分场景入手,比如突出剪辑、视频处理等特定场景上的更强表现,以及和macOS的适配,而不是全方位“吊打英特尔”。
虽然苹果声称新的M1芯片对比此前的处理器性能有数倍提升,但芯片刚问世时,MacBook Pro只有低配版采用了M1芯片;高配版仍然搭载英特尔i5-1038NG7处理器,并且价格贵得多。在Mac mini上也类似,其高配版仍在使用第八代的英特尔六核i5处理器。
以苹果的体量,尚且要避开锋芒差异化竞争,以卵击石的后果可想而知。
小米曾经高调进入SoC的开发,外界盛传,小米重注押宝的手机SoC澎湃S2在多次流片试产后以失败告终,保守估计烧掉了三亿人民币的研发费用。
另一个典型的失败案例是三星,2015年,三星首次推出猫鼬M1架构,并在部分旗舰手机GalaxyS7和Note7中采用,矛头直指苹果的A系列SoC。
猫鼬架构一路迭代到了M5,但性能一直落后于高通和苹果,最终在2019年被彻底放弃。
三星的Exynos芯片
国内绝大多数的芯片设计公司,发展策略都是瞄准一个细分场景,从通用性不高的芯片开始做,比如壁仞科技、天数智芯、沐曦等国内初创GPU企业,大多都绕道瞄准B端\G端数据中心的GPGPU需求,砍掉了数据中心里并不需要的图形处理功能,在一些垂直领域足够和巨头杀几个来回了。
对这些公司来说,从专用芯片做起是一条更实际的路径,一上来就高举高打,在通用场景里和巨头硬碰硬并不明智。事实上,英伟达的GPU一开始也是游戏场景里的专用芯片,然后扩展到了AI、虚拟货币等场景。
互联网公司的确很有钱,但造芯片的花销更大,先进制程芯片尤甚。
7nm工艺芯片流片一次需要3000万美元,5nm的流片成本更是达到4725万美元,就这还没有计入前期购买芯片IP的成本、购买芯片设计软件EDA的成本、动辄百万年薪的芯片设计人才的工资成本等等一系列投入。
对造芯来说,一年花一个亿,只够在新手村练级。
通常情况下,只有苹果、华为这样的公司,能依靠产品的庞大出货量覆盖研发CPU等通用芯片的成本。而对缺乏终端产品的互联网公司来说,再财大气粗,恐怕也算不清通用芯片这笔越滚越大的账。
03
没那么厉害
研发一款芯片并不难,难的是研发一款面向消费市场的高利润芯片,这不仅需要技术的突破,还需要终端产品的配合,对应的软件生态,长期的资本投入。
最近几年,芯片自主的热情空前高涨。平心而论,过去十多年里国内半导体产业有不小的进步,但贡献并不来自互联网新贵,而是那些积累已久的产业老兵。
最典型的是海思,它的成立甚至早于华为的智能机业务。Ascend D系列首次搭载海思的四核手机处理器芯片K3V2,因体验太差网友骂成一片,据说震怒的任正非曾当着众多高管的面,把这款手机砸在余承东脸上。
海思造芯的前提则是,华为拥有支撑高额研发费用和试错成本的运营商业务,它在华为的收入结构中常年占比超过40%。
DRAM领域,合肥长鑫在2019年量产国产DDR4内存芯片,在应对“卡脖子”这件事上意义重大。兆易创新则是全球前三、中国第一的NOR FLASH企业,紫光展锐也成为了高通、联发科之后全球第三大主流手机SoC解决方案商。
而在芯片封测环节,长电科技在2016年收购了新加坡的星科金朋,一举成为全球第三的封测厂,拿下了高通、联发科、英特尔、博通等等国际大厂的订单。另一家公司富瀚微实现了对AMD封测厂的收购,帮助国产企业实现了在7nm CPU以及GPU高端芯片封测的突破。
高风险、高投入、长周期是半导体行业的铁律,每个环节都壁垒极深,这显然不是习惯了高举高打、快速扩张的互联网公司能够适应的。
然而,当芯片设计套上了独立自主的语境,互联网大厂反而成为了声浪最大的,俨然硬科技的带头大哥。
所以,针对大厂造芯这件事,还是得从两方面看待:
一方面,绝大多数公司的自研芯片,本质上是基于新场景的创新。比如大规模的虚拟化需求、AI需求,视频图片编解码需求。这种创新虽然离“吊打英特尔”差了十万八千里,但为行业积累人才储备,再不济让苦了十几年的芯片工程师拿拿大厂期权,也是好事。
同时,半导体是个高度分工与高度全球化的行业,要求互联网公司去和全世界顶级的芯片设计公司硬碰硬,让他们去实现CPU等通用芯片的自主可控,显然也不是现实的。
无论是字节、阿里、还是快手,都没有自己的终端产品,他们靠什么覆盖芯片的研发的成本呢?这不符合商业逻辑。
但另一方面,做了几个相对边缘的芯片就大吹特吹,也实在是没必要。
如果真想在硬科技上有所建树,是不是应该先想想,高薪招进来的芯片工程师,是汇报给技术部门,还是汇报给公关部门?
推荐阅读
华强北MCU冰血暴:“芯片赌徒”的狂欢、谎言与挣扎
Arm起诉高通,要求销毁相关芯片设计盘点一些创新的MEMS产品和趋势
添加微信回复“进群”
拉你进技术交流群!
国产芯|汽车电子|物联网|新能源|电源|工业|嵌入式…..
在公众号内回复您想搜索的任意内容,如问题关键字、技术名词、bug代码等,就能轻松获得与之相关的专业技术内容反馈。快去试试吧!
如果您想经常看到我们的文章,可以进入我们的主页,点击屏幕右上角“三个小点”,点击“设为星标”。
欢迎扫码关注