查看原文
其他

这家国内芯片厂商算力技术大突破,推动AI“智力”升维 | 星科技•芯片半导体

联想之星 2023-10-20


前沿科技

芯片半导体



近日,国内芯片厂商亿铸科技创始人、董事长兼CEO熊大鹏博士接受了数字化观察网的采访,解读了亿铸科技首发的“存算一体超异构架构”,并介绍了亿铸科技存算一体AI大算力芯片的优势——特别适合大模型且能够支持浮点计算。




亿铸科技创始人、董事长兼CEO熊大鹏博士


亿铸科技成立于2020年6月,总部于2023年3月18日在苏州高新区开业,定位于用存算一体架构设计AI大算力芯片,旨在解决当前AI大算力芯片存算的能耗高、部署难、算力提升空间有限的问题。


作为国内首家面向数据中心云计算、中心侧服务器等场景的存算一体AI大算力芯片企业,亿铸科技首次将ReRAM和存算一体架构相结合,通过全数字化的芯片设计思路,为业界提供大算力、高精度、超高能效比、易部署的AI大算力芯片;2023年初,以ChatGPT为代表的AI大模型风靡全球,这对AI大算力芯片提出了更多挑战,亿铸科技又首次提出了“存算一体超异构架构”的人工智能芯片发展思路,这是继ASIC、FPGA以及GPGPU架构之后,在摩尔定律几近终结的当下,为我国人工智能大算力芯片的进一步发展提供了全新的技术发展路径。


亿铸科技拥有优秀的研发、工程及顾问团队。研发能力覆盖了工艺器件、架构设计、电路设计和软件生态等全链条;工程团队核心成员平均拥有25年以上的高端集成电路设计和量产经验,有着丰富的应用和产品化实战经历。


01

国产AI算力芯片大突破


第四次科技革命以创新为特征,作为第四次科技革命中的主要技术,人工智能的创新突破令人鼓舞。目前,国外ChatGPT已迭代至GPT-4阶段,具备更加强大的功能。


大模型的爆火背后的算力需求巨大。数据显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),需要7-8个投资规模30亿、算力500P的数据中心才能支撑运行


芯片能力直接影响着高算力训练效果和速度,国内外芯片是否能够撑起大模型的算力需求,成为行业内备受关注的问题。


熊大鹏博士表示,亿铸科技自主设计研发的存算一体AI大算力芯片取得重大技术突破,或将基于75W-100W目标实现接近1P的算力。这意味着该芯片算力接近甚至超过国际某大厂最先进的AI芯片,但功耗只有它的十分之一不到。该芯片在算力上开启了一条天花板更高的技术路径,能效比也将有大幅度的优化和提升。


业内人士分析,这种存算一体AI大算力芯片基于传统工艺28nm,就可实现算力与世界龙头并肩,功耗还要更低,实属国产AI算力芯片的希望。

02

国产芯片厂商技术迭代


目前,中国AI算力格局面临着四重困境:技术上,摩尔定律到达极限;地缘政治上,中美博弈;产业供应链先进制程,国内无法实现自主;再加上ChatGPT为首的大模型带来巨大的算力需求,国产AI算力芯片被四方围剿。在这样的情况下,中国AI算力芯片的发展其实是在做一场前赴后继的“万里长征”。

纵观AI算力芯片在国内的发展史,大致可以将AI算力芯片国产化分为几个时代

最开始的AI芯片国产化1.0时代,是继Google推出ASIC芯片后,国内寒武纪、灵汐、华为等国内厂商陆续跟上脚步,针对云端AI应用推出ASIC架构芯片。

接着AI芯片国产化进入了2.0时代。在看到以英伟达为代表的GPGPU架构在AI算力芯片上有着不错的性能表现后,国内多个厂商例如天数智芯、珠海芯动力、壁仞等纷纷布局GPGPU芯片,主打CUDA兼容,不断试探着AI算力芯片的极限。


在前两个时代中,国产AI芯片厂商都在竭力顺应时代潮流,前赴后继地跟随国际大厂的步伐,不断研发新型芯片解决AI算力芯片的挑战;然而由于依赖先进制程、能效比迭代缓慢、软件生态进展缓慢,急需新的技术路径迭代

现如今,随着ChatGPT等大模型掀起热潮,我们站在了AI芯片国产化3.0时代的门口,面对愈发严重的AI算力难题以及越发严峻的地缘政治处境,国产芯片厂商自主意识更为强烈,希望能够自发提出芯片解决方案。 

03

“存算一体超异构”推动AI“智力”升维


亿铸科技自发提出的存算一体架构、存算一体超异构计算,能为AI大算力困局“排忧解难”:存算一体架构,将存储和计算的融合,能够打破传统架构下的三堵墙,彻底消除访存延迟,并极大降低功耗。同时,由于计算完全耦合于存储,因此可以开发更细粒度的并行性,获得更高的性能和能效

超异构计算,能够把更多的异构计算整合重构,从而各类型处理器间充分地、灵活地进行数据交互而形成的计算。

简单来说,就是结合DSA、GPU、CPU、CIM等多个类型引擎的优势,实现性能的飞跃

  • DSA负责相对确定的大计算量的工作;
  • GPU负责应用层有一些性能敏感的并且有一定弹性的工作;
  • CPU啥都能干,负责兜底;
  • CIM就是存内计算,可以实现同等算力,更低能耗;同等能耗,更高算力。另外,CIM由于器件的优势,能负担比DSA更大的算力。

熊大鹏博士表示,其优势包括两个方面:一是在系统层,能够把整体的效率做到最优;二是在软件层,能够实现跨平台架构统一。

亿铸科技选择将两大技术结合,即“存算一体超异构”的想法,与AMD董事长兼CEO苏姿丰提出的“系统级创新”不谋而合:在ISSCC 2023,苏姿丰提出这一概念,即从整体设计的上下游多个环节协同设计来完成芯片性能的提升,并给出使用该概念实现数量级的效率提升案例。

也就是说,若将存算一体、Chiplet(芯粒)、3D封装等技术同步使用,很有可能带来数量级的效率提升,从而突破性能瓶颈


首发存算一体超异构概念的亿铸科技,提出了自己的技术畅想:

若能把新型忆阻器技术(RRAM)、存算一体架构、芯粒技术(Chiplet)、3D封装等技术结合,将会实现更大的有效算力、放置更多的参数、实现更高的能效比、更好的软件兼容性,从而抬高AI大算力芯片的发展天花板。

据了解,国内目前已公开的能够实现存算一体AI大算力的芯片公司仅有亿铸科技,该公司基于RRAM的存算一体AI大算力芯片将在近期回片

期待国内更多玩家加入存算一体AI大算力芯片的赛道,满足未来的“ChatGPT们”以及下游应用场景的算力需求,同时响应国家绿色算力号召,在“双碳”政策下,更快实现AI“智力”升维。

本文来源:数字化观察网



END



相关阅读





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存