查看原文
其他

新变化

调研纪要 2024年12月16日 23:32
科技变革点太多太多了,一个月的AEC调研也只是一小部分(虽然几乎全部涨停)。
什么是AEC?目前英伟达NVL72中主要使用DAC无源铜缆,但有两种有源铜缆亦值得关注,其一为ACC(曾用于NVL36*2架构的Switch Tray互联),其二为AEC。1)ACC是在线缆Rx端加入一定能力的线性Redriver来提供信号的均衡和整形中继,延长端到端的传输距离,一般来说ACC可以在DAC的基础上增加2-3米传输距离;2)AEC是在线缆两端加入CDR(时钟数据恢复)对电信号进行重新定时(Retimer)和重新驱动,其所能补偿的铜缆损耗能力一般比ACC更强,并且可以有效阻隔抖动的传递,所以能支持的端到端连接距离比ACC更长。
趋势:数据中心内部部分场景要求传输距离变长;AEC作用逐渐凸显。总结来看,AEC相比DAC多了Retimer芯片,能够支持长达7米及以上的互联,适用场景如机柜间互联(参考之前NVL36*2,未来多个72+机柜互联距离有望延长)、替代部分原先的短距光模块场景(CPU服务器与GPU服务器之间互联等、服务器与TOR交换机互联-如谷歌TPU)。
空间:非NV需求持续旺盛;24-28年AEC的CAGR为45%。根据LightCounting,2024-2028年DAC和AEC的市场规模CAGR分别为25%/45%。我们观察到,北美非NV的AEC需求持续旺盛,亚马逊Trainium 2 AI集群、微软的训练集群、谷歌TPU集群、xAI的训练集群均已在接触或使用。AEC目前主要集中于400G速率,25年或逐渐向800G/1.6T迭代,预计将带来新一轮需求。

产业链相关公司包括:1)铜连接传统标的:沃尔核材(乐庭-芯线)、神宇股份、精达股份(镀银铜导线)、瑞可达、华丰科技等;2)部分光通信企业切入:新易盛、中际旭创等。海外链公司:Retimer芯片及成缆:Credo、博通、Marvell等。


还有两个新的变化:

1)GB系列 compute tray

2)rubin系列第二代芯片图刚出来,大家会看到先进封装在产业趋势中的主导地位


关于近期博通和豆包的一些思考

博通业绩超预期引发关注,以及字节豆包的一系列这都向我们指出了三个点:

1)市场需求由训练到推理asic的变化

2)云服务厂商自研/定制的需求逐步加快

3)nv配套售卖的机制可能会被云服务厂商独立采购逐步打断

如果说训练侧的优胜劣败是由算力大小可以大致拍定,那推理侧就不只是比拼技术,更比拼云服务厂商自身模型进行获客和变现的能力,最终可以看到百花齐放的竞争。获胜者通过自身大模型完成商业闭环,资本开支的增速就能展望的更加长远,这也是为什么近期“豆包”那么引人关注的原因。


海外AI算力硬件看好的两个方向

1)简单题:ASIC(AVGO&MRVL)及对应的供应链的投资机会

看好的原因第一来自于市场空间的扩大。往往一个趋势是从上调TAM开始的,比如AMD在2023年12月6号上调AI加速器的市场规模从23年的450亿到27年的超4000亿,第二天涨了10点,随即迎来主升浪;

先是博通,2027年AI收入600-900亿,仅包含谷歌、Meta、字节三个客户。如果假设第四第五客户OpenAI和苹果,一家线性外推200-300亿,那就是1000-1500亿,这还不包括未来三年新增客户的量。而现在一年的AI相关收入仅仅为122亿。如果份额70%,那就是是3年5倍以上收入提升的巨大机会;而连接占15-20%的比重,也就是150-300亿;

再是Marvell4月份给的指引,2028年的TAM是750亿,它长期20%占比,也就是150亿,芯片占比57%,交换机和连接占比35%,现在看来是太保守了;

看好的原因第二来自于往后产业链通常伴随着上修订单。从2023年开始,通用GPU从H100到H200,记不清多少次CoWoS上修。或许ASIC也将开启类似的上修之路。

Avgo24年在台积电订了65k的CoWoS,ASIC谷歌TPU的价值量约80亿;而25年,这个数字或许达130亿;

Marvell24年在台积电订了17k的CoWoS,ASICAWS的Tranium2的价值量约7亿;而25年,这个数字将达到34亿;

2)难题:GB200切GB300,及GB300切R系列的供应链价值量变化的投资机会

老大哥NVDA虽是确定性的投资机会,但因为算得比较白(提现到数字是连续三个季度只超彭博预期5%),同时26年的确定性仍不清晰,最快或许是25年的年中才能见分晓(因为CoWoS设备的能见度是6-9个月)。所以算下来有空间,但是没有那么多;

投资机会更多来自每次机柜迭代后的供应链变化,新增(类似GB200切GB300的BBU和超级电容的新增需求变化)和存量的价值量转移(类似服务器厂商不断变化的份额);


简单梳理一下OCP ORV3 N公司供应商服务器电源各家进度

目前入围NV供应商的公司有五家,分别是TD,GB,MGMT,WCL,BDYDZ

Td:和英伟达联合开发,目前正在出货的产品都是TD的,而且TD服务器电源(CRPS+ORV3)这块订单爆满,上个月主动舍弃了思科的单子。

GB:目前还在主机厂测试,出现了热方面的问题,其实我知道这个事情已经挺久了,但是迟迟没解决,现在出现问题应该是很多人通过非GB渠道都求证到了这个信息,具体问题按照我了解到的信息大概说一下,目前GB单电源测试是没问题的,上了服务器系统测试后,会随机间歇性的出现某个电源过热问题,这个原因迟迟无法得到解决,据台湾那边口径反馈,GB原先3KW就存在一部分热的问题,目前考虑是平台底子问题,目前光宝就两种解决办法,第一种就是硬着头皮打补丁,但是从技术角度来考虑底子的问题比较难修复的,容易后续出货以后逐步丢单,第二种就是重头再来,但是应该会耗时很久(目前光宝科在出的基本都是3kw的电源)

BYDDZ:他们对外宣称他们可以做整体解决方案,电源、连接器、液冷散热都能做,集成柜子对外销售,但是目前还没通过英伟达认证,公司自己对市场说年底会去N那边送样,今年该公司服务器组装业务指引给市场预期是10亿营收,明年整体按照他们给的指引大概是50亿营收,大概反推出NVL72的柜子大概是1000多台,通过后看他们是拿到卡还是只出柜子给客户,他们目前业务模式和鸿海是竞争关系,所以目前很多人认为鸿海并不会去采用他们的电源去出货,BYDDZ更多还是给自己服务器做集成配套。

WCL:目前没听AC-DC说有进展,主要重心在BBU(和日本武藏合作)和DCDC

MGMT:目前在主机厂测试的三家之一,MGMT本身没开发3KW直接干到了5.5KW,出货进度按照目前产业调研信息会比之前预计快(不知道是否是GB迟迟解决不了问题导致提前出货)。



继续滑动看下一个
调研纪要
向上滑动看下一个
选择留言身份

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存