农企终于翻身了？AMD全球首发7nm CPU/GPU，股价大涨

From 包永刚&王刚雷锋网

▲点击上方雷锋网关注

文 | 包永刚王刚

来自雷锋网（leiphone-sz）的报道

11月7日，在AMD在美国旧金山举办的“Next Horizon”新品发布会上正式宣布，继全球首款7nm手机处理器之后，同样基于台积电7nm制程的CPU和GPU产品也正式发布。AMD推出了全球第一款7nm 代号“Rome”(罗马)的第二代EPYC霄龙CPU处理器以及Radeon Instinct MI60/MI50的GPU计算卡。

此外，AMD宣布，AWS成为了公司服务器芯片的新合作伙伴，并将会采用霄龙（EPYC）服务器芯片。

受上述消息影响，AMD股价最高上涨8.8％。

7nm Rome(罗马)第二代EPYC霄龙处理器

首发7nm CPU和GPU

AMD代号为Rome的第二代EPYC霄龙处理器基于Zen2架构，Rome EPYC采用特殊设计的架构，每颗处理器有8个CPU 裸片，每个裸片内集成8个物理核心，共64个。同时为了更好地协调如此众多CPU核心的协同工作，还专门设计了一个I/O裸片，放置在中央位置，专门负责输入输出控制，不过I/O裸片用14nm工艺制造。Rome处理器有8通道DDR4内存控制器，每个插槽支持最高4TB DRAM。

Rome EPYC也是第一个支持PCIE 4.0技术的服务器级CPU，支持128个PCIe 4.0，带宽通道数翻番，可提升加速器性能，搭配同样支持PCIE 4.0技术的全新加速卡Radeon Instinct MI60，AMD表示可以带来前所未有的加速性能。当然，Rome EPYC也是全球第一款采用7nm工艺的数据中心处理器。目前Rome EPYC更详细的参数暂未公布，AMD预测Rome EPYC性能将因核心数量的增加而翻倍，浮点性能也将因为IPC架构的改进和核心数量的增加两倍。

兼容性方面，Rome EPYC与现有的Naples，以及下一代的Milan都将保持兼容，这可以简化基于AMD处理器的服务器开发，也能让服务器公司把现有的设计用在未来的服务器当中。进度方面，AMD正在向服务器制造商提供Rome EPYC样品，计划在2019年推出产品，但具体时间尚未公布。亚马逊AWS计算副总裁Matt Garman表示，基于AMD霄龙芯片的R5和M5实例产品今天就可使用，T3实例将在未来几周上线，并重点强调了帮助客户运行最常见应用程序时节省成本的特点。

GPU方面，AMD在今年Computex 2018上公布了7nm Radeon Vega GPU，雷锋网《AMD抢先推全球首款7nm GPU，但能否按时出货？》有详细介绍，不过第一款正式发布的7nm GPU产品并不是Radeon RX游戏显卡，而是Radeon Instinct计算卡。AMD同时发布了Radeon Instinct MI60/MI50，均基于7nm工艺的Vega架构，得益于7nm工艺，Radeon Instinct计算卡集成132亿个晶体管，比目前14nm Vega 的125亿个晶体管增加了6.4％，核心面积为331平方毫米，比现在的484平方毫米缩小了31.6％。据称，在同等功耗下，新核心性能提升超过25％，同等频率下新核心功耗降低50％。

Radeon Instinct显存搭配最多32GB HBM2，带宽达1TB/s，內建ECC纠错。同样，7nm Vega也是世界首个支持PCIE 4.0技术的GPU，双向带宽64GB/s，借助带宽高达100GB/s的Infinity Fabric系统总线，支持4路GPU并行，双路性能提升99％，4路比单路提升298％，8路比单路提升664％。

AMD 7nm Radeon Instinct 计算卡

在加速功能上，7nm Vega计算卡在几个关键领域与Vega10有所不同，7nm Vega支持半速率双精度，同时支持新的低精度数据类型。具体看，MI60 FP64双精度浮点最高为7.4TFlops，FP32单精度最高为14.7TFlops，INT整数最高为118Tops，相比于同样Vega 10核心的MI25专业性能提升8.8倍。

还有值得注意的是，新的GPU还包括一对片外Infinity Fabric链路，允许Radeon Instinct卡通过相干链路直接相互连接。由于每个GPU只有2个链接，因此AMD的拓扑选项仅限于环上的变化，这意味着4路配置的GPU不能全部直接相互通信。另外，AMD仍坚持使用PCIe卡，没有像NVIDIA一样的定制夹层式卡，所以这些卡需要通过顶部的桥接器连接。

为弥补AMD在软件方面的不足，AMD宣布了开源计算平台ROCm 2.0，并继续承诺完全开源。进度上，Radeon Instinct MI50将于今年第四季度上市，MI60将在明年一季度上市。

AMD宣布芯片新买家，AWS的第68次降价顺势到来

此次发布会上，AMD还宣布AWS成为了公司服务器芯片的新合作伙伴。竞争对手英特尔短线跌逾1.1%，收跌0.88%，报47.25美元，接近五日新低。

CNBC分析称，多年来英特尔一直是AWS的数据中心处理器供应商，现在不得不与AMD“二分天下”，自然影响股价表现。

雷锋网也了解到，目前AMD的霄龙处理器已经用来支持全球前两大公共云基建供应商：亚马逊AWS和微软Azure的计算实例。

消息公布后，AWS随即发布公告称，新的EC2虚拟云服务器将为第三方客户提供AMD霄龙处理器芯片，并能为通用实例（M5和T3）和内存优化实例（R5）节约10%的计算成本。

AWS副总裁Matt Garman表示，基于AMD霄龙芯片的R5和M5实例产品今天就可使用，T3实例将在未来几周上线。

雷锋网在AWS官网上查询一圈后发现，一篇由AWS的首席布道师Jeff Barr写的博客《New Lower-Cost, AMD-Powered M5a and R5a EC2 Instances》非常值得关注，暂且将其翻译为《新的低成本，AMD支持的M5a和R5a EC2实例》。

博客里的重点信息是：

目前为止，AWS已经灵活调整了价格多达67次（这个数字此前雷锋网在亚马逊财报中亦有露出）。随着与AMD合作的展开，将提供更加经济的EC2实例选择。

注：EC2实际上是亚马逊提出来的概念，叫“弹性计算云”，Elastic Compute Cloud。它是一个让使用者可以租用云端电脑运行所需应用的系统。简而言之就是EC2缩短了用户获取和启动新的服务器实例时间缩短到几分钟，用户只需为实际使用的计算进行支付。Amazon在2006年8月25日发布EC2受限公众Beta版本。

最新的EC2实例由运行速度为2.5 GHz的定制AMD EPYC处理器提供支持，价格比同类产品低10％。

雷锋网：这或许是AWS的“第68次降价行为”。

专门对M5a实例（通用型）和R5a实例（内存优化）做了负载说明。M5a实例有6种尺寸可供选择；R5a实例有6种尺寸，与R5实例相比，每GiB内存价格较低。

新的EC2实例使用范围。目前在美国弗吉尼亚北部、俄亥俄州、俄勒冈州、欧洲的爱尔兰、亚洲新加坡等地可以使用最新EC2实例。当然，价格会优惠10%。

抢先推出7nm，AMD这次终于翻身了？

当下，7nm无疑是业界关注的焦点，不过AMD总裁兼首席执行官苏姿丰博士（Lisa Su）此前已经多次谈到AMD的7nm进展。在此次Next Horizon会议上，AMD CTO Mark Papermaster表示，AMD在7nm上豪赌了一把，首先是相信能把7nm做出来，其次是认为7nm将成为产业关键节点，并持续很长一段时间。AMD最初的目标是用自己的7nm和英特尔10nm竞争，至少打成平手，但没想到AMD先做出了7nm，并将成为在新节点上最先推出产品的公司。

除了已经公布7nm架构和产品，AMD还表示明年锐龙、霄龙将全线转向7nm工艺的Zen2架构，接下来将是7nm+升级版工艺的新架构Zen3。不止于此，AMD还首次披露Zen4架构正在设计中。Papermaster也强调了AMD路线图的重要性以及实现路线图的能力和决心，他表示Zen2架构芯片正在流片，Zen3预计在2020年使用7nm+制程，Zen4开发已接近尾声。

在Next Horizon会议上发布7nm EPYC的时候，AMD用一颗Rome EPYC（64核心）与两颗Skylake Xeon 8180M（56核心）同时渲染1080p/QuadHD/4K图像对比，结果成绩分别是28.1秒和30.2秒，AMD更胜一筹。GPU方面，AMD拥有GPU最快配置的1TB/S全内存带宽，甚至超过NVIDIA旗舰产品GV100 GPU。这是否意味着AMD凭借着7nm一举超越了英特尔和英伟达？

雷锋网在《AMD的7nm处理器样品出锅了，不过似乎对Intel威胁不大》一文中已经提到，国外论坛HardOCP上的一位坛友mockingbird爆料称RTG（Radeon Technology Group）已经收到首款Zen 2架构7nm处理器的样品，但测试样品的基础/睿频频率是4.0/4.5GHz，要比目前Ryzen 7 2700X（3.7/4.1GHz）高一些，但与英特尔8700K 4.7GHz的睿频频率有差距，更不及未来9800K/9900K的5GHz。虽然AMD未来还有继续打磨提高频率的空间，但从初代Ryzen测试样品与正式发售产品的频率对比来看，提升空间应该不大。

另外，硬件以及7nm并不就意味着处理器的成功，指令集也十分关键。据了解，AMD先有了SSE5指令集，然后英特尔推出了AVX指令集，接着AMD又效仿AVX，但保留SSE5中的FMA4、CVT16和XOP指令；然后英特尔效仿AMD加入CVT16，但改名为F16C，随后又加入FMA4简化后的FMA3和AVX2.0指令；AMD只得跟风，加入FMA3，承认F16C，将来还要加入AVX2.0。可以看到AMD在指令集方面的竞争非常激烈。

至于GPU领域，从AMD首发的7nm计算卡可以看出其非常重视服务器市场，不过在这一市场英伟达GPU拥有绝对的优势，与在CPU领域与英特尔的竞争一样，英伟达的领先使其有能力从架构以及指令集等方面占据优势，一旦使用了7nm工艺，AMD在部分性能方面的优势能保持多久就不得而知。我们也可以从架构上看，英伟达在今年八月放出了号称12年来的最大招图灵（Turing）架构，但图灵架构的RTX2080 GPU也继承了很多Fermi架构的东西，这意味着AMD也不太可能完全放弃GCN架构设计新的架构，并且此前AMD的研发中心都放在Zen架构上，GPU的改进乏力，基于目前的情况看，AMD能够凭借新的工艺就实现对英伟达的反超？

雷锋网认为，AMD作为在高性能计算领域同时具有CPU和GPU产品的公司十分难得，不过可惜的是在CPU领域难以超越英特尔，在GPU领域难以超越英伟达，这其中有技术的因素，也有商业方面的原因。当然对于消费者和云厂商而言，只有竞争才会带来更好的产品，因此对于AMD的7nm CPU和GPU我们依旧保持期待。

- END -

◆ ◆ ◆