64核128线程！AMD发布首款7nm数据中心处理器挑战Intel！

芯智讯 2019-05-16

美国旧金山当地时间11月6日上午9点(北京时间11月7日今夜凌晨1点)，AMD举办了主题为“Next Horizon”的新品技术沟通会。AMD正式公布了新一代采用7nm工艺的CPU、GPU核心，同时还发布了两款Radeon Instinct计算卡，展示了全球首款基于7nm工艺Zen 2架构的第二代数据中心处理器EPYC ROME。

台积电7nm工艺加持

AMD目前的处理器、显卡均采用14/12nm工艺，接下来将跨过10nm而直奔7nm，代工伙伴本来是从AMD独立出去的GlobalFoundries，但是后者不久前已经正式宣布放弃7nm及之后的更先进工艺，因此AMD的7nm CPU/GPU都全面转向台积电代工。

虽然这次宣布很突然，但是种种迹象表明，AMD早早就完成了代工伙伴的迁移，对新产品的研发、发布进程并无明显影响，所以才有了这次的发布会。

根据台积电提供的数据，7nm相比于目前的14/12nm可以将晶体管密度提高一倍，同等频率下功耗可以降低一半，而同等功耗下性能提升可以超过25％。

如果说12nm更多地是在“数字”上领先Intel 14nm，这一次7nm则是在技术上完全实现超越，也能稍微领先Intel仍在难产的10nm。

更先进的制造工艺一直是Intel最强有力的武器，但这次竟然被AMD完全超越，实在是令人唏嘘，即便是Intel一再强调自己的10nm相当于其他家的7nm也无济于事，毕竟人家的产品马上就要出来了。

7nm Zen 2架构

AMD的Zen架构自推出以来，取得了空前成功。而现在我们终于迎来了基于最新的7nm工艺加持的第二代Zen 2架构。

Zen 2这是世界上第一个7nm工艺的高性能x86 CPU，除了新工艺主要变化包括：CPU核心执行增强、更深入的安全增强、模块化设计灵活配置并降低制造难度。

Zen 2实现了两倍于第一代的吞吐能力，这主要得益于执行流水下的改进、浮点单元和载入存储单元的翻番、核心密度的翻番、每操作功耗的减半。

在前端设计上，Zen 2重点改进和优化了分支预测、指令预取、指令缓存、操作缓存。

而在浮点方面，Zen 2将浮点宽度翻了一番达到256-bit，载入存储带宽同样翻了一番，并提升了分发/回退带宽，所有模块都保持着很高的吞吐。

安全性方面，AMD重点强调了新架构可以在硬件层面免疫Spectre幽灵安全漏洞。

Zen 2架构支持更多核心，但并不是单纯地增加核心数量，而是采用了特殊的组合结构：EPYC霄龙最多单路64核心128线程，分为八个Die，每个Die内八个物理核心，同时外部还有一个单独的I/O Die，集成内存控制器、Infinity Fabric高速总线、I/O输入输出，专门负责联络各个Die与物理核心。

这种新的模块化设计更加灵活，可以单独针对每个模块进行优化、调配，同时借助I/O Die大大优化了整体延迟与功耗。

不过注意，CPU Die部分用的是7nm工艺， I/O Die部分则还是14nm，因为后者大部分都是模拟电路，对新工艺并不敏感，即便上了7nm也不会带来集成度、性能、功耗的明显改善，成本却会明显增加，所以采用了这种混合工艺模块组合。

事实上，Intel也正在同一颗芯片内尝试不同工艺的组合，都是出于同样的目的。

以上说的都是Zen 2架构的理论部分，最终落实到EPYC霄龙、Ryzen锐龙产品上，还会有不同的表现，但可以预料，新架构新工艺，必然会带来明显更高的频率、更低的功耗，而且无论桌面还是服务器，AMD这几年都会保持前后代兼容。

此前，AMD已经多次公开强调，7nm工艺Zen 2架构的Ryzen锐龙、EPYC霄龙处理器都会在2019年如期发布，后者已经向客户交付样片。

AMD还首次确认，Zen 3预计在2020年走上7纳米制程，Zen 4开发已接近尾声，相关产品推出时间上估计至少会在2021年。

基于7nm GPU的Radeon Instinct计算卡

除了CPU处理器转向7nm工艺，AMD GPU图形计算也迎来了7nm时代，但首款产品不是Radeon RX游戏卡，而是Radeon Instinct计算卡！

AMD今天正式宣布了全新一代Radeon Instinct MI60、Radeon Instinct MI50，均基于7nm工艺的升级版Vega架构核心，是全球首个7nm GPU。

AMD表示，7nm Vega核心架构拥有灵活的高性能、世界最快的FP64/FP32 PCI-E浮点性能、机器学习训练和推理、领先的显存和扩展性、唯一的硬件虚拟化、端到端的ECC纠错保护。

7nm Vega核心集成了132亿个晶体管，比目前的14nm Vega 125亿个增加了6.4％，而核心面积为331平方毫米，比现在的484平方毫米缩小了足足31.6％，晶体管密度翻了一番。

同等功耗下，新核心性能提升超过25％，而同等频率下，新核心功耗降低50％。

显存搭配最多32GB HBM2，带宽达1TB/s，內建ECC纠错。

MI60、MI50的具体规格暂未公布，有点类似RX Vega 64/56的区别，不过可以确认MI60的热设计功耗为300W。

7nm Vega还是世界首个支持PCI-E 4.0技术的GPU，双向带宽64GB/s，同时借助带宽高达100GB/s的Infinity Fabric系统总线，支持四路GPU并行，而且扩展性极佳，双路性能提升99％，四路比单路提升298％，八路比单路提升664％，几乎完美。

性能方面，MI60 FP64双精度浮点最高7.4TFlops，FP32单精度最高14.7TFlops，INT整数最高118Tops，相比于同样10nm Vega核心的MI25专业性能提升最多达8.8倍，同时超越或者基本持平NVIDIA目前最强大的Tesla V100。

AMD同时宣布了开源计算平台ROCm 2.0，并继续承诺完全开源。

未来，AMD还将继续推出下一代的MI-NEXT，性能更强，连接性更好，软件兼容性更佳——或许是Navi架构？

全球首款7nm数据中心处理器

AMD还在会上公布了全球首款7nm基于Zen 2架构的数据中心处理器——Rome的部分参数规格：

包括多个7nm的用于运算的x86 chiplet，比Zen 1“Naples”EPYC性能大幅提升
另外，还有一个14纳米的I/O芯片
DDR4，Infinity Fabric，PCIe和其他I/O都在I/O芯片上
支持第四代PCIe
能够连接GPU，并在I/O芯片上通过Infinity Fabric协议进行GPU间通信。因此，对于同一CPU，则不同需要再使用PCIe或NVLink的交换芯片
每个Socket有64核，128线程

▲全球首款7纳米数据中心CPU“Rome”原型

AMD CEO苏姿丰在会上表示：“它是业内最好的数据中心处理器，我们绝对有望在2019年推出Rome。这是我们公司的主要领域，也是我们以后会发展的领域。”

从规格来看，这款7nm的服务器芯片非常强大。而相比之下，英特尔还困在与10nm的苦战里，产品预计推迟到2019年底发布。

如果AMD能够尽早推出7nm数据中心处理器，这将成为该公司在历史上首次超越英特尔，在处理器工艺节点上占据领先地位。AMD的7纳米处理器预计将比英特尔14nm的芯片更快、更密集、能耗也更低。

苏姿丰回顾了AMD EPYC服务器芯片推向市场的历程，上市15个月后，AMD EPYC 的市场表现良好，在高性能计算（HPC）、云、超大规模和虚拟环境中都扮演着重要角色。AMD认为，到2021年他们在数据中心将有290亿美元的机会，随着行业转向人工智能和机器学习，GPU正在发挥越来越大的作用。

至于2017年面市的Radeon Instinct，AMD知道自己在软件方面不行，并表示其发展关键将是力推开源。

不仅如此，亚马逊AWS也宣布采用新的AMD EPYC云服务虚拟机，AWS EC2也将提供从R5、M5a和T3a虚拟机（R5虚拟机是大型内存，M5则是数据库和企业服务的主流应用，T3虚拟机则用于博客和其他低端应用）。据称，这些虚拟机都将比AWS的英特尔虚拟机性价比高出10％。

这下数据中心市场的老大英特尔真的有压力了！

编辑：芯智讯-林子综合自网络

三星可折叠手机本月量产：采用双屏无缝铰链设计，首批仅10万台！

华为任正非：可以授权镜头及电源技术给苹果公司！

华为Mate 20 Pro拆解：主要零组件供应商曝光！

被“禁”的晋华将何去何从？下个目标会是谁？

抢先三星华为，柔宇科技发布全球首款折叠屏手机！定价8999元起！

“独立”后的Arm中国如何“自主”？

10年后流量需求暴增80倍，为何还说5G缺杀手级应用？

重磅！清华控股“让位”，紫光集团将成深圳国资委下属公司！

滑盖全面屏小米MIX3发布！但却意外被华为抢了头条！

前特斯拉猛将加盟，苹果汽车业务集团SPG浮出水面！

存储芯片降价50%！一个570亿美元的大机会“曝光”！

行业交流、合作请加微信：xintiyan001
投稿请发至：yj@padnews.cn
芯智讯官方交流：221807116

bxrf的瓜

失信被执行人的孩子上学受影响吗？最高法明确：受限！

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！