全球首款 GDDR7 DRAM面世,三星造!
去年,三星公布了为 GPU 和服务器开发 GDDR7 DRAM的计划。今年早些时候,该公司透露了有关这些存储芯片的更多细节。今天,三星宣布已完成 GDDR7 DRAM 芯片的开发,该芯片将用于未来的汽车、游戏机、个人电脑、服务器和工作站。它是世界上第一家完成此类先进存储芯片开发的公司。
三星的GDDR7 DRAM 拥有破纪录的 1.5TBps 带宽,比 GDDR6 DRAM 高出 40%。得益于 PAM3(脉冲幅度调制)信号方法的增强,它的每引脚速度为 32Gbps。PAM3 是一种新的内存标准,允许在同一信令周期内发送多 50% 的数据。GDDR6 等上一代内存芯片使用 NRZ(不归零)信号发送方法。这些新型内存芯片的能效也比 GDDR6 DRAM 芯片高出 20%。三星还为其新芯片提供了较低电压的选择,该芯片专门针对笔记本电脑和其他此类设备而设计。
为了减少热量产生,除了 IC 架构优化之外,三星还在封装中使用了新型 EMC(环氧树脂模塑料)材料,它具有高导热性。所有这些改进使热阻降低了 70%,从而提供了更稳定的产品,即使在高压力的操作条件下也能表现良好。三星的重要客户将于今年开始测试DGGR7 DRAM芯片进行验证。我们预计这些新芯片将用于Nvidia 的RTX 50 系列 GPU。
三星电子内存产品规划团队执行副总裁 Yongcheol Bae 表示:“我们的 GDDR7 DRAM 将有助于提升工作站、PC 和游戏机等需要出色图形性能的领域的用户体验,并且预计将扩展到未来人工智能、高性能计算 (HPC) 和汽车等应用。下一代图形 DRAM 将根据行业需求推向市场,我们计划继续保持在该领域的领先地位。”
扩展阅读
GDDR7 更多技术细节曝光:
36Gbps与PAM 3编码
当三星去年 10 月嘲笑GDDR7 内存的持续开发时, Cadence 没有透露即将推出的规范的任何其他技术细节。但他们最近透露了有关该技术的一些额外细节。事实证明,GDDR7 内存将使用 PAM3 和 NRZ 信号,并将支持许多其他功能,目标是达到每个引脚高达 36 Gbps 的数据速率。
简短的 GDDR 历史课
在较高的层面上,近年来 GDDR 内存的发展相当简单:更新的内存迭代提高了信号速率,增加了突发大小(burst size)以跟上这些信号速率,并提高了通道利用率。但是这些都没有显着增加存储单元的内部时钟。例如,GDDR5X 和后来的 GDDR6 将其突发大小增加到 16 字节,然后切换到双通道 32 字节访问粒度。虽然每一代技术都面临着挑战,但最终行业参与者已经能够通过每个版本的 GDDR 提高内存总线的频率,以保持性能的提升。
但即使是“简单”的频率增加也越来越变得不那么简单了。这促使该行业寻找除了加快时钟之外的解决方案。
借助 GDDR6X,美光和 NVIDIA 将传统的不归零 (NRZ/PAM2) 编码替换为四级脉冲幅度调制 (PAM4) 编码。PAM4 使用四个信号电平将有效数据传输速率提高到每个周期两个数据位,从而实现更高的数据传输速率。实际上,由于 GDDR6X 在 PAM4 模式下运行时具有 8 字节 (BL8) 的突发长度(burst length),因此在相同数据速率(或者更确切地说,信号速率)下它并不比 GDDR6 快,而是设计为能够达到比 GDDR6 可以轻松实现的更高的数据速率。
四级脉冲幅度调制在信号丢失方面优于 NRZ。对于给定的数据速率,由于 PAM4 需要 NRZ 信号传输波特率的一半,因此产生的信号损失显着减少。随着更高频率的信号在通过导线/走线时衰减得更快——而且按照数字逻辑标准,内存走线的距离相对较长——能够在本质上是较低频率的总线上运行,最终使一些工程和走线更容易实现更高的数据速率。
权衡(trade-off )是 PAM4 信号通常对随机和感应噪声更敏感;为了换取较低频率的信号,您必须能够正确识别两倍的状态。实际上,这会导致给定频率下的误码率更高。为了降低BER,需要在Rx端进行均衡,在Tx端进行预补偿,这会增加功耗。虽然它未用于 GDDR6X 内存,但在更高频率(例如 PCIe 6.0)下,前向纠错 (FEC) 也是一项实际要求。
当然,GDDR6X 内存子系统需要全新的内存控制器,以及用于处理器和内存芯片的全新物理接口 (PHY)。这些复杂的实现在很大程度上是四级编码直到最近才几乎完全用于高端数据中心网络的主要原因,在这些网络中有支持使用这种尖端技术的利润。
GDDR7:PAM3 编码高达 36 Gbps/pin
考虑到上述在使用 PAM4 信号或 NRZ 信号时的权衡,事实证明支持 GDDR7 内存标准的 JEDEC 成员反而采取了一些折衷的立场。GDDR7 内存设置为使用 PAM3 编码进行高速传输,而不是使用 PAM4。
顾名思义,PAM3 介于 NRZ/PAM2 和 PAM4 之间,使用三级脉冲幅度调制(-1、0、+1)信号,允许它每个周期传输 1.5 位(或者更确切地说是 3 位以上)两个周期)。PAM3 提供比 NRZ 更高的每周期数据传输速率——减少了迁移到更高内存总线频率的需要以及由此带来的信号丢失挑战——同时需要比 PAM4 更宽松的信噪比。总的来说,GDDR7 承诺比 GDDR6 具有更高的性能,同时比 GDDR6X 具有更低的功耗和实施成本。
对于那些记分的人来说,这实际上是我们看到的第二个使用 PAM3 的主要消费技术。出于类似的技术原因,USB4 v2(又名 80Gbps USB)也在使用 PAM3。那么 PAM3 到底是什么?
PAM3 是一种数据线可以承载 -1、0 或 +1 的技术。该系统所做的实际上是将两个 PAM3 传输组合成一个 3 位数据信号,例如 000 是一个 -1 后跟一个 -1。这变得很复杂,所以这里有一个表格:
当我们将 NRZ 与 PAM3 和 PAM4 进行比较时,我们可以看到 PAM3 的数据传输速率处于 NRZ 和 PAM4 的中间。在这种情况下使用 PAM3 的原因是为了在没有 PAM4 需要启用的额外限制的情况下实现更高的带宽。
话虽如此,三星承诺的具有 36 Gbps 数据传输速率的 256 位内存子系统将使用多少功率还有待观察。GDDR7 规范本身尚未获得批准,硬件本身仍在构建中(这正是 Cadence 等工具发挥作用的地方)。但请记住,AI、HPC 和图形的带宽需求量很大,带宽将永远受到欢迎。
优化效率和功耗
除了提高吞吐量外,GDDR7 有望采用多种方式来优化内存效率和功耗。特别是,GDDR7 将支持四种不同的读取时钟 (RCK) 模式,以便仅在需要时启用它:
始终运行:始终运行并在睡眠模式下停止;
禁用:停止运行;
Start with RCK Start command:主机可以在读出数据之前通过发出RCK Start命令来启动RCK,并在需要时使用RCK Stop命令停止。
Start with Read:当 DRAM 收到任何涉及读出数据的命令时,RCK 自动开始运行。它可以使用 RCK Stop 命令停止。
此外,GDDR7 内存子系统将能够并行发出两个独立的命令。例如,Bank X 可以通过在 CA[2:0] 上发出 Refresh per bank 命令来刷新,而 Bank Y 可以通过同时在 CA[4:3] 上发出读取命令来读取。此外,GDDR7 将支持线性反馈移位寄存器 (LFSR) 数据训练模式,以确定适当的电压电平和时序,以确保一致的数据传输。在这种模式下,主机将跟踪每个单独的眼睛(连接),这将允许它应用适当的电压以更好地优化功耗。
最后,GDDR7 将能够根据带宽需求在 PAM3 编码和 NRZ 编码之间切换。在高带宽场景中,将使用 PAM3,而在低带宽场景中,内存和内存控制器可以切换到更节能的 NRZ。
虽然 GDDR7 承诺在不大幅增加功耗的情况下显着提高性能,但技术观众最大的问题可能是 新型内存何时可用。由于没有来自 JEDEC 的硬性承诺,因此没有预计 GDDR7 发布的具体时间表。但考虑到所涉及的工作和 Cadence 验证系统的发布,预计 GDDR7 将与 AMD 和 NVIDIA 的下一代 GPU 一起进入现场并不是没有道理的。请记住,这两家公司倾向于以大约两年的节奏推出新的 GPU 架构,这意味着我们将在 2024 年晚些时候开始看到 GDDR7 出现在设备上。
当然,鉴于如今有如此多的 AI 和 HPC 公司致力于带宽需求高的产品,其中一两家可能会更快发布依赖 GDDR7 显存的解决方案。但 GDDR7 的大规模采用几乎肯定会与 AMD 和 NVIDIA 的下一代图形卡的量产同时发生。
免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。
推荐阅读
关注全球半导体产业动向与趋势
欢迎关注【半导体芯闻】
公众号ID:MooreNEWS