首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
1
2
1'"
3
1'
4
@妖精视觉
5
@亘古
6
@artag
7
抖音
8
@佛山综合
9
@两性
10
张靓颖
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
1
2
1'"
3
1'
4
@妖精视觉
5
@亘古
6
@artag
7
抖音
8
@佛山综合
9
@两性
10
张靓颖
分类
社会
娱乐
国际
人权
科技
经济
其它
宾曰语云被法学教授投诉:严重侵权,“违法犯罪”!
二湘:朱令去世一周年,清华学子控诉清华在朱令案中的冷血和无耻
“上海王”柯庆施之死的真相
毕业论文辅导| 你又不是伞,硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞!
缺人:60r/次,立结~
生成图片,分享到微信朋友圈
查看原文
其他
Intel 将推出中国特供版 Gaudi 3
Original
小智
云头条
2024-08-23
英特尔准备推出两款专供中国市场的 Gaudi 3 AI 加速器芯片,为了符合美国制裁政策,它们的性能将大打折扣。
英特尔的 Gaudi 3 白皮书详细介绍了这两款获准在中国市场销售的芯片。
这两款中国特供版处理器分别名为 HL-328 和 HL-388,分别采用 OAM 规格和 PCIe 规格,前者将于 6 月推出,后者将于 9 月推出,另外还有采用 PCIe 规格的 Gaudi 3。
总体而言,HL-328 和 HL-388 看起来与其他芯片大致一样,搭载同样的 128GB HBM2e VRAM、3.7TB/s 带宽、96MB 缓存、PCIe 5.0 x16 接口以及解码标准。
唯一的区别在于热设计功耗(TDP)方面,OAM 卡和 PCIe 卡这两款的 TDP 都是 450瓦。与其他型号相比,这个数值已大幅削减。并非面向中国市场的 PCIe HL-338 其 TDP 为600瓦,OAM 规格的 HL-325L 和 HL-335 其 TDP 为 900 瓦。中国特供版 Gaudi 3 型号的 TDP 比较低,这大概可以解释为什么没有液冷版。
尽管白皮书中没有明确说明,但为了遵守美国政府在处理器方面的出口管制,几乎可以肯定需要做出相应的变化。美国政府的出口管制禁止美国公司中国出口性能超过某个标准限制的芯片。
HL-328
和
HL-388
仍然使用两
块晶片(
die
)
,
就像
其他
Gaudi
3
变种
一样
,因为内存和缓存配置
并没有变化
。使用两
块而不是一块晶片有助
于降低性能密度,从而使芯片
符合
4800
总处理能力
(
T
PP
)这一
更高
的
出口限制。
4800 TPP 这一限制意味着芯片不得超过 150 TFLOPS 或更高的 16 位性能,而由于 Gaudi 3 在 BF16 下可以达到 1835 TFLOPS,英特尔将需要大幅降低性能。
这必须通过大幅减少核心数量和大幅降低时钟速度或其他某种限制性能的方法来实现。
HL-328
和
HL-388
的性能与
英伟达
的
H20
或
相
似,英伟达
获准
在中国
市场
销售的
速度
最快的
GPU
。它
拥有
148 TFLOPS
的
FB16
和
FP16
性能,刚好低于
150-TFLOPS
限制。
由于 H20 和中国特供版 Gaudi 3 的原始核心性能大致相当,主要的区别将归结为内存(英特尔芯片有更大的内存容量,但带宽略低)和软件(这一直是英伟达芯片的卖点)。
继续滑动看下一个
轻触阅读原文
云头条
向上滑动看下一个
您可能也对以下帖子感兴趣
{{{title}}}
文章有问题?点此查看未经处理的缓存