查看原文
其他

一份邀请函引发的中国芯片新猜想

The following article is from 量子位 Author 关注前沿科技

来源:量子位
云端AI芯片,已经成为兵家必争之地。
据ABI Research统计,从全球市场发展来看,这块“大蛋糕”将在2024年达到191亿美元的规模。
因此,全球范围内的主要芯片玩家们纷至沓来,早早地开始布局于此:
英伟达、谷歌、英特尔、AMD、百度、亚马逊……
经过数年时间的发展,由于英伟达GPU拥有丰富的产品线、强大的软件生态等优势,目前在云端AI芯片市场处于“一家独大”的局面。
但与此同时,GPU对于云端AI芯片也并非完美,存在着功耗大、价格昂贵等问题。
相对的,FPGA和ASIC因其低功耗、可编程等优势,使得一些国外的新晋厂商采取异构计算打法切入,推出了更加适合云端通用计算的AI芯片。例如:
Cerebras Systems、Graphcore、Habana(已被英特尔收购)、Wave Computing等。
随着云计算和AI的结合不断深入,云端AI芯片的市场潜力不容小觑。在国外科技巨头持续发力云端AI芯片之时,中国公司也敏锐地嗅到了这一市场方向,与美国同行们几乎同时起步。
随着深度学习的不断发展,AI越来越多地渗入到数据中心来,渗透率将高达25%-30%,是一个非常庞大的市场。
这就是被市场看作中国芯片黑马——燧原科技所提出的观点。
他们仅耗时18个月,便一次性流片成功,打造了国产AI云端训练芯片——邃思。
可谓是在中国芯片界一战成名。
而就在最近,量子位收到了一张来自燧原科技的邀请函。
起初小编未太在意。
但定睛一看,燧原科技貌似要有大动作了!

从一张邀请函中引发的猜想

初看这份邀请函,最先映入眼帘的便是“芯云长天”这个醒目的标题。
先从“芯云”二字入手:
  •  “芯”应当是指芯片。

  • “云”则是云端之意。

毕竟燧原科技位居“云端AI芯片”玩家之列,这种解释应当是没错了。
而“长天”二字,原意为:辽阔的天空。
结合前面的“芯”、“云”二字,应当是希望在云端AI芯片的天地中大展宏图。
再来看下邀请函中的第二个细节
标题文字背后的这些曲线,似乎也有点文章,像是许多条收敛曲线。
咦?把这些元素规整一下,线索来了。
看来想要求解答案,还得从燧原科技的“起点”着手。
公开资料显示,燧原科技是于2018年3月19日,在上海正式成立。
在成立1个月之后,拿到种子轮融资的燧原科技,便马上进入到了研发芯片的阶段。
仅仅过了20个月,也就是在2019年12月,就发布了自研的第一款云端AI训练芯片邃思DTU,去年9月又宣布其云端训练加速卡“云燧T10”落地商用。
这种速度着实是有些惊人了。
要知道,业界设计一款GPU/CPU,从设计到最后的量产,平均要耗时3年甚至更久。
更何况,邃思DTU还是从无到有地设计了全新的架构、处理器和指令集。
而且这款芯片不仅仅是研发周期短,技术指标也是十分亮眼:
  • 单卡单精度(FP32)算力达20TFLOPS

  • 半精度及混合精度 (BF16/FP16)算力80TFLOPS

  • 最大功耗为225W

  • 12nm工艺,2.5D先进封装

而在邃思DTU的基础上,燧原科技分别又在云端训练推理两大阵营,发布了其自研产品。
训练方面,分别是面向云端数据中心的AI训练加速卡云燧T10和基于OCP(开放计算项目)OAM(开放加速模组)标准设计的AI训练加速模组云燧T11
在推理方面,燧原科技所推出的产品,则是云燧i10
它是一款面向云端数据中心的高性能人工智能推理加速卡,可广泛应用于计算机视觉、自然语言处理、语音识别与合成、知识图谱等多类型云端推理场景。
除了硬件上的产品,燧原科技在软件方面也推出了驭算——计算及编程平台。
据公开资料显示,驭算支持主流深度学习框架,并针对邃思芯片进行了特定优化。
整个平台不仅包括常用的算子加速库,还可以为数据中心大规模训练集提供调度机制。
1张云端训练芯片、2款云端训练产品、1款云端推理产品,再加1个计算/编程平台。
这就是燧原科技在成立三年多时间内解锁的成就。
而从这一路发展的路径来看,燧原科技最先攻坚的云端AI芯片中,属于最艰难的部分——训练芯片。
讲真,有被硬核到。
好了,挖完第二条线索,我们继续。
目光暂且移至邀请函的上方,最为醒目的便是这个半圆了。
虽然单看这个形状猜不出太多深层的含义,但直观其颜色和质感,是那种黑科技硬核感没错了。
但俗话说的好:“站得高,看得远”。
把“镜头”抬高一些!
真正的第三条线索,它来了!
与前方绵延的山脉连在一起看,这不就是个数字“2”吗?
现在再结合刚才半圆的黑科技质感,莫非是……
最硬核的芯片要有到动作?
再大胆的猜测,莫非是要把邃思DTU来个升级?
若真如此,那可将会是一个“连锁反应”。
因为最核心的云端AI芯片升级,其训练等产品自然也会在性能上有大幅度的提升。
同时,对大规模算法模型的支持能力也会显著增强;而更进一步的,内存、宽带等属性也得跟上升级的步伐。
但比这些更具意义的一点会是:
在国内,这将会成为首个实现二次迭代的云端训练芯片。
这是因为芯片的种类众多,不同芯片的技术门槛也不一样,AI芯片亦是如此。
而国产AI云端训练芯片,也正如文章开始讲述的那样,由于GPU等芯片的成熟,这个高端细分领域却一直是处于一片空白的状态。
也正如此,国产AI云端训练芯片用“一片蓝海”来形容也是不足为过的。
若是邃思DTU真的能够完成二次迭代,除了解锁“全国首个”之外,更长远的角度来看,更是能让业界看到中国AI芯片设计的高水准
以上便是量子位“从一张邀请函引发猜想”的故事。
在第一代训练产品“云燧T10”发布的18个月后,上述对于新品的各种猜测,是否会成真,一切答案将在7月7日的产品发布会中揭晓,让我们拭目以待!




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存