查看原文
其他

64核128线程!AMD发布首款7nm数据中心处理器挑战Intel!

芯智讯 2019-05-16


美国旧金山当地时间11月6日上午9点(北京时间11月7日今夜凌晨1点),AMD举办了主题为“Next Horizon”的新品技术沟通会。AMD正式公布了新一代采用7nm工艺的CPU、GPU核心,同时还发布了两款Radeon Instinct计算卡,展示了全球首款基于7nm工艺Zen 2架构的第二代数据中心处理器EPYC ROME。


台积电7nm工艺加持


AMD目前的处理器、显卡均采用14/12nm工艺,接下来将跨过10nm而直奔7nm,代工伙伴本来是从AMD独立出去的GlobalFoundries,但是后者不久前已经正式宣布放弃7nm及之后的更先进工艺,因此AMD的7nm CPU/GPU都全面转向台积电代工。


虽然这次宣布很突然,但是种种迹象表明,AMD早早就完成了代工伙伴的迁移,对新产品的研发、发布进程并无明显影响,所以才有了这次的发布会。

根据台积电提供的数据,7nm相比于目前的14/12nm可以将晶体管密度提高一倍,同等频率下功耗可以降低一半,而同等功耗下性能提升可以超过25%。


如果说12nm更多地是在“数字”上领先Intel 14nm,这一次7nm则是在技术上完全实现超越,也能稍微领先Intel仍在难产的10nm。


更先进的制造工艺一直是Intel最强有力的武器,但这次竟然被AMD完全超越,实在是令人唏嘘,即便是Intel一再强调自己的10nm相当于其他家的7nm也无济于事,毕竟人家的产品马上就要出来了。


7nm Zen 2架构


AMD的Zen架构自推出以来,取得了空前成功。而现在我们终于迎来了基于最新的7nm工艺加持的第二代Zen 2架构。



Zen 2这是世界上第一个7nm工艺的高性能x86 CPU,除了新工艺主要变化包括:CPU核心执行增强、更深入的安全增强、模块化设计灵活配置并降低制造难度。



Zen 2实现了两倍于第一代的吞吐能力,这主要得益于执行流水下的改进、浮点单元和载入存储单元的翻番、核心密度的翻番、每操作功耗的减半。


在前端设计上,Zen 2重点改进和优化了分支预测、指令预取、指令缓存、操作缓存。



而在浮点方面,Zen 2将浮点宽度翻了一番达到256-bit,载入存储带宽同样翻了一番,并提升了分发/回退带宽,所有模块都保持着很高的吞吐。


安全性方面,AMD重点强调了新架构可以在硬件层面免疫Spectre幽灵安全漏洞。



Zen 2架构支持更多核心,但并不是单纯地增加核心数量,而是采用了特殊的组合结构:EPYC霄龙最多单路64核心128线程,分为八个Die,每个Die内八个物理核心,同时外部还有一个单独的I/O Die,集成内存控制器、Infinity Fabric高速总线、I/O输入输出,专门负责联络各个Die与物理核心。


这种新的模块化设计更加灵活,可以单独针对每个模块进行优化、调配,同时借助I/O Die大大优化了整体延迟与功耗。


不过注意,CPU Die部分用的是7nm工艺, I/O Die部分则还是14nm,因为后者大部分都是模拟电路,对新工艺并不敏感,即便上了7nm也不会带来集成度、性能、功耗的明显改善,成本却会明显增加,所以采用了这种混合工艺模块组合。


事实上,Intel也正在同一颗芯片内尝试不同工艺的组合,都是出于同样的目的。



以上说的都是Zen 2架构的理论部分,最终落实到EPYC霄龙、Ryzen锐龙产品上,还会有不同的表现,但可以预料,新架构新工艺,必然会带来明显更高的频率、更低的功耗,而且无论桌面还是服务器,AMD这几年都会保持前后代兼容。


此前,AMD已经多次公开强调,7nm工艺Zen 2架构的Ryzen锐龙、EPYC霄龙处理器都会在2019年如期发布,后者已经向客户交付样片。



AMD还首次确认,Zen 3预计在2020年走上7纳米 制程,Zen 4开发已接近尾声,相关产品推出时间上估计至少会在2021年。


基于7nm GPU的Radeon Instinct计算卡


除了CPU处理器转向7nm工艺,AMD GPU图形计算也迎来了7nm时代,但首款产品不是Radeon RX游戏卡,而是Radeon Instinct计算卡!



AMD今天正式宣布了全新一代Radeon Instinct MI60、Radeon Instinct MI50,均基于7nm工艺的升级版Vega架构核心,是全球首个7nm GPU。 


AMD表示,7nm Vega核心架构拥有灵活的高性能、世界最快的FP64/FP32 PCI-E浮点性能、机器学习训练和推理、领先的显存和扩展性、唯一的硬件虚拟化、端到端的ECC纠错保护。


7nm Vega核心集成了132亿个晶体管,比目前的14nm Vega 125亿个增加了6.4%,而核心面积为331平方毫米,比现在的484平方毫米缩小了足足31.6%,晶体管密度翻了一番。


同等功耗下,新核心性能提升超过25%,而同等频率下,新核心功耗降低50%。


显存搭配最多32GB HBM2,带宽达1TB/s,內建ECC纠错。


MI60、MI50的具体规格暂未公布,有点类似RX Vega 64/56的区别,不过可以确认MI60的热设计功耗为300W。



7nm Vega还是世界首个支持PCI-E 4.0技术的GPU,双向带宽64GB/s,同时借助带宽高达100GB/s的Infinity Fabric系统总线,支持四路GPU并行,而且扩展性极佳,双路性能提升99%,四路比单路提升298%,八路比单路提升664%,几乎完美。 



性能方面,MI60 FP64双精度浮点最高7.4TFlops,FP32单精度最高14.7TFlops,INT整数最高118Tops,相比于同样10nm Vega核心的MI25专业性能提升最多达8.8倍,同时超越或者基本持平NVIDIA目前最强大的Tesla V100。



AMD同时宣布了开源计算平台ROCm 2.0,并继续承诺完全开源。 



未来,AMD还将继续推出下一代的MI-NEXT,性能更强,连接性更好,软件兼容性更佳——或许是Navi架构?


 

全球首款7nm数据中心处理器


AMD还在会上公布了全球首款7nm基于Zen 2架构的数据中心处理器——Rome的部分参数规格:


  • 包括多个7nm的用于运算的x86 chiplet,比Zen 1“Naples”EPYC性能大幅提升

  • 另外,还有一个14纳米的I/O芯片

  • DDR4,Infinity Fabric,PCIe和其他I/O都在I/O芯片上

  • 支持第四代PCIe

  • 能够连接GPU,并在I/O芯片上通过Infinity Fabric协议进行GPU间通信。因此,对于同一CPU,则不同需要再使用PCIe或NVLink的交换芯片

  • 每个Socket有64核,128线程


▲全球首款7纳米数据中心CPU“Rome”原型


AMD CEO苏姿丰在会上表示:“它是业内最好的数据中心处理器,我们绝对有望在2019年推出Rome。这是我们公司的主要领域,也是我们以后会发展的领域。”


从规格来看,这款7nm的服务器芯片非常强大。而相比之下,英特尔还困在与10nm的苦战里,产品预计推迟到2019年底发布。


如果AMD能够尽早推出7nm数据中心处理器,这将成为该公司在历史上首次超越英特尔,在处理器工艺节点上占据领先地位。AMD的7纳米处理器预计将比英特尔14nm的芯片更快、更密集、能耗也更低。



苏姿丰回顾了AMD EPYC服务器芯片推向市场的历程,上市15个月后,AMD EPYC 的市场表现良好,在高性能计算(HPC)、云、超大规模和虚拟环境中都扮演着重要角色。AMD认为,到2021年他们在数据中心将有290亿美元的机会,随着行业转向人工智能和机器学习,GPU正在发挥越来越大的作用。


至于2017年面市的Radeon Instinct,AMD知道自己在软件方面不行,并表示其发展关键将是力推开源。



不仅如此,亚马逊AWS也宣布采用新的AMD EPYC云服务虚拟机,AWS EC2也将提供从R5、M5a和T3a虚拟机(R5虚拟机是大型内存,M5则是数据库和企业服务的主流应用,T3虚拟机则用于博客和其他低端应用)。据称,这些虚拟机都将比AWS的英特尔虚拟机性价比高出10%。


这下数据中心市场的老大英特尔真的有压力了!


编辑:芯智讯-林子   综合自网络

相关文章

三星可折叠手机本月量产:采用双屏无缝铰链设计,首批仅10万台!

华为任正非:可以授权镜头及电源技术给苹果公司!

华为Mate 20 Pro拆解:主要零组件供应商曝光!

被“禁”的晋华将何去何从?下个目标会是谁?

抢先三星华为,柔宇科技发布全球首款折叠屏手机!定价8999元起!

“独立”后的Arm中国如何“自主”?

10年后流量需求暴增80倍,为何还说5G缺杀手级应用?

重磅!清华控股“让位”,紫光集团将成深圳国资委下属公司!

滑盖全面屏小米MIX3发布!但却意外被华为抢了头条!

前特斯拉猛将加盟,苹果汽车业务集团SPG浮出水面!

存储芯片降价50%!一个570亿美元的大机会“曝光”!

行业交流、合作请加微信:xintiyan001
投稿请发至:yj@padnews.cn
芯智讯官方交流:221807116

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存