查看原文
其他

超大容量SSD的兴起

Andy730
2025-01-01

在最近多家公司召开的一季度财报电话会议上,了解到数据中心突然对容量为60至100TB的SSD产生了浓厚的兴趣。然而,并未呈现一个强有力的解释来阐明这一现象背后的原因,尽管五家领先的闪存公司中有四家表示这是由AI技术所驱动的(Kioxia尚未报告)。有人指出,这些SSD用于训练应用,而另一些人则说它们用于推理。

值得注意的是,这些SSD的容量远超HDD。目前市场上发货的最高容量HDD仅为30TB。随着SSD逐渐接管低容量应用,HDD的平均容量在过去十年间稳步增长。如今,HDD市场正逐渐萎缩至归档存储领域,也就是那些对速度要求不高,但需要大量低成本存储容量的应用场景。下面的图表清晰地展示了过去几年间西部数据HDD的平均容量增长情况。

接下来,让我们看看这四家NAND闪存制造商在财报电话会议上对超大容量SSD的看法。这些观点将按照时间顺序进行呈现。

美光(Micron)

在其3月20日的财报电话会议上,美光管理层表示:

“我们在2023年达到了数据中心SSD市场的历史性高收入份额。在本季度,我们基于232层技术的6500 30TB SSD的收入同比增长超过50%,为AI数据湖应用提供了业界领先的性能、可靠性和耐久性。”

由此可见,美光正在通过销售大量的30TB SSD型号,实现了收入的巨大提升。

SK海力士(SK hynix)

以下是从4月25日SK海力士财报电话会议中摘录的笔记内容。

“购买者主要为本地化数据中心客户。随着AI从训练转向推理,存储正在向本地化转移以实现安全性和定制化。这一趋势推动了对更快速SSD需求的不断增长,原因是非结构化数据的增加以及新企业级SSD的低功耗特性。这对NAND供应商而言是一个积极的发展,可能是结构性变化的迹象。”

从长远来看,AI的增长推动了对NAND的需求与较慢的存储相比不断增加。此外,数据中心空间限制的需求也促使了对36TB到128TB更高密度的需求。这些高容量需求将采用QLC而非当前的TLC,SK海力士将推出一款独特的60TB Solidigm eSSD。

简而言之,SK海力士认为需求来自于本地化数据中心的推理需求。

西部数据(Western Digital)

以下是从4月25日西部数据财报电话会议中摘录的笔记内容。

“企业级SSD需求已经回升,预计2024年下半年将大幅增加出货量。

目前,AI正受到极大关注,目前我们对其还不太了解。客户正积极寻找30至60TB的产品。PCIe Gen5 BiCS6 SSD得到了客户的良好反馈,已被超大规模数据中心客户进行了资格认证测试,同时在企业级领域也展现出强劲需求。

这些产品主要被用于训练应用。”

与SK海力士的观点大相径庭,西部数据认为需求主要来源于训练,而非推理,并且在超大规模计算和本地化(企业级)应用中均有体现。

三星(Samsung)

以下是三星在4月30日的电话会议内容,整合了正式报告和笔记:

“三星计划扩大服务器SSD的销售规模,并计划通过开发和提供64TB超高密度SSD产品,及时响应AI领域的市场需求,预计这些产品将在第二季度推出。

随着AI模型的日益增多,训练数据的大小也相应增加,进而推动了数据存储需求的增长。因此,我们收到了大量客户对8TB和16TB解决方案的咨询。

在推理方面,由于需要存储大量数据库,我们观察到客户对64TB、128TB超高密度SSD解决方案的咨询量也在增加。

预计今年我们的服务器SSD出货量将同比增长80%,而QLC服务器SSD的销售量预计在下半年将比上半年激增3倍。”

总体而言,三星预计高容量SSD将为训练和推理应用带来显著提升,其中8-16TB SSD将主要用于训练,而64-128TB SSD则更适合于推理应用。

从这四家制造商的反馈来看,虽然他们对市场为何突然需要超大容量SSD的看法并不完全一致,但他们都认同这一市场正在迅速扩张。

当然,这些NAND闪存制造商对此趋势持乐观态度,因为一款60TB的SSD将使用超过480个1Tb的NAND闪存芯片,这意味着非常可观的芯片销售量,相当于消耗了大约半个晶圆(wafer)。

Chris Evans

Jim,

有个有意思的现象,自2018年起就已经有30TB的SSD,然而HDD市场直到近期才达到相同的容量水平。然而,企业级SSD存在DRAM问题,或者需要在间接单元大小上做出妥协,Solidigm建议使用分层/缓存作为解决方案。Pure Storage和IBM已经推出了自己的闪存解决方案,其性能远超市场上的企业级SSD(预计Pure在夏季推出的产品将达到150TB),IBM的FCM3/4提供的压缩容量约为88TB。

我认为,企业级存储系统供应商在部署大于30TB的驱动器时将面临一系列问题,因为系统的容量将受限于其架构。如果供应商无法直接在单个驱动器级别上增加容量(而需要增加一个存储机架或RAID条带),那么对于客户和供应商来说,成本都将非常巨大。此外,如果单个驱动器的价格超过1万美元(就像第一批16TB驱动器那样),那么保修流程必须严密(系统供应商和客户都无法容忍在保修期内出现驱动器故障,他们会坚持要求更换)。

DRAM/功耗问题也将是一个需要重视的难题。因此,供应商是否需要专门设计“企业级阵列SSD”?市场规模是否足以支撑这种设计?而那些超大规模计算厂商呢?他们何时会开始设计自己的SSD(如果他们还未涉足这一领域),他们会选择与SSD供应商合作,还是只购买NAND并自主开发定制控制器?

这个市场上有许多待解决的问题,目前尚不清楚它将如何发展!

Jim Handy

感谢你这位业内杰出的存储分析师给出的深入洞察。

你的观点都很有道理。行业内的一个“不良习惯”就是给自己设置了一些不灵活的限制,比如固定的扇区大小,这阻碍了存储容量的可预测增长,并且不善于充分利用SSD内部的DRAM。我预计将来会出现许多巧妙的解决方案。KV存储在这方面应该会有所帮助。

至于价格,当前NAND闪存芯片的售价大约为10美分/GB,因此一个100TB的SSD的NAND芯片成本将超过1万美元,还需考虑到“预留空间”(OP)。我预计这款SSD的售价将大致是这个数字的两倍,即2万美元,这确实令人咋舌!

遗憾的是,NAND芯片制造商发出的混乱信号使得我们很难判断这些100TB的SSD主要是被超大规模计算厂商还是本地化用户所购买。如果是超大规模计算厂商,那么你是对的,他们可以像多年来使用标准SSD那样自主制造它们,或者选择使用专有的解决方案。如果是本地化用户,情况则更为复杂,部分原因是他们通常会为硬件和软件都选择现成的解决方案。我将进一步深入研究这个问题。

感谢你的参与。

-----

Source:Jim Handy; New Interest in Monster-SSDs; May 1, 2024


--【本文完】---

近期受欢迎的文章:

  1. 存储器大战:NAND闪存和DRAM

  2. 2024年数字存储与内存展望(二):闪存、DRAM、NVMe、NVMe-oF、CXL、计算型存储

  3. 2024年AI基础设施展望:PCIe 5.0 NAND闪存引领生态创新

  4. 闪存与AI相互影响,及闪存价格前景

  5. 高密度HDD与QLC闪存对比:功耗差异



更多交流,可添加本人微信

(请附姓名/单位/关注领域)

继续滑动看下一个
Andy730
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存