清华研发出“全球首颗”,这种芯片要火了?
这两日,一则消息刷爆了芯片圈,清华又有新成果。
什么东西,有什么用
存储墙:冯·诺依曼架构的存算分离会导致外部存储器运行速度远远小于处理器的运算速度,系统整体会受到传输带宽瓶颈的限制,导致算力会远低于处理器标定的理论算力; 功耗墙:冯·诺依曼架构中,数据在处理器和外部存储器中频繁高速传递,会导致系统功耗很高。同时,摩尔定律触碰1nm,芯片特征尺寸已进入量子效应显著范围,引起一系列次级物理效应,包括栅隧穿泄漏、载流子界面散射、强场速度饱和、源漏寄生电阻占比增大等,导致功耗密度快速上升。
三星2021年2月发布HBM2-PIM,将4片常规DRAM die和4片具有计算功能的DRAM die通过TSV通孔垂直组合在一起。其运行频率为300 MHz,每个裸片上 (PIM-DRAM die) 有32个PCU。2022年初,三星电子发表首个基于MRAM的存算一体芯片,采用28nm CMOS工艺重新构建MRAM阵列结构; Mythic2021年5月获得7000万美元的C轮融资,2021年6月发布由72个AMP切片构成,每个切片内部集成一系列闪存单元、ADC阵列、1个32位RISC纳米处理器、1个16位SIMD矢量处理器、SRAM和1个片上网络 (NOC) 路由器,算力达25TOPS; IBM公司2018年通过PCM实现在数据存储的位置执行计算来加速全连接神经网络训练,该芯片能效比是传统GPU280倍,单位面积算力是传统GPU100倍; 2016年,英特尔基于SRAM实现了支持逻辑操作的存储器,并在此基础上实现了支持无进位乘法运算的计算型缓存。
今年5月,后摩智能正式发布首款存算一体智驾芯片——鸿途H30。12nm工艺制程下,该芯片物理算力达256TOPS,在Int8全精度的计算提供下,计算延时只有1.5ns,能效比为30~150TOPS/W,比业界同等精度计算条件下的水平提高了3倍以上,而且它是车规量产支持L4,而这也存算一体在大算力这一领域走在了前列; 苹芯科技已开发实现多款基于SRAM的存内计算加速单元,致力于为人工智能行业提供了低成本、高效率、低能耗、高性能的芯片解决方案; 九天睿芯拥有自有专利的模拟预处理与6T SRAM存算一体技术,解决了传统计算架构的瓶颈和耗电散热难题,做到更低的延迟和更快的处理速度; 达摩院研发的存算一体芯片是全球首次采用混合键合(Hybrid Bonding)的3D堆叠技术,将计算芯片和存储芯片 face-to-face 地用特定金属材质和工艺进行互联。
参考文献
[1] 人民日报:https://mp.weixin.qq.com/s/Km1VHS02wDsGE66Fr-d-7w
[2] 清华大学:https://mp.weixin.qq.com/s/w0VZNIQ1KbClJJ8c05hPqg
[3] 恒烁半导体(合肥)股份有限公司:首次公开发行股票招股说明书(申报稿).2021.10.19.https://data.eastmoney.com/notices/detail/A21521/AN202110191523750446.html
[4] 高雅丽,李晨,王之康. 解决重大原创问题 勇闯创新“无人区”[N]. 中国科学报,2021-06-01(004).DOI:10.28514/n.cnki.nkxsb.2021.001764.
[5] Acta Phys. Sin., 2022, 71(14): 140101. doi: 10.7498/aps.71.140101
[6] 温新宇, 王亚赛, 何毓辉, 缪向水. 忆阻类脑计算. 物理学报, 2022, 71(14): 140501. doi: 10.7498/aps.71.20220666
[7] 张宇琦, 王俊杰, 吕子玉, 韩素婷. 应用于感存算一体化系统的多模调控忆阻器. 物理学报, 2022, 71(14): 148502. doi: 10.7498/aps.71.20220226
[8] 信息通信技术与政策:专题丨存算一体技术产业发展研究.2023.7.24.https://mp.weixin.qq.com/s/mZJMeES8IUOw6MIQLKZu6A
· END ·