查看原文
其他

智能网卡势在必行,可编程、平台化加速行业部署

张慧娟 核芯产业观察 2021-01-17

电子发烧友网报道(文/张慧娟)赛灵思(Xilinx)的数据中心业务,过去一年的年增长率达到24%,季度增长率达到92%。基于UltraScale+架构,赛灵思已经推出了Alveo四大加速卡系列(U50U200U250U280),在计算加速、存储加速、网络加速三方面助力数据中心的发展,同时也构建起庞大的数据中心系统,既有戴尔、HPE、浪潮、安富利等OEM合作伙伴、增值经销商/分销商,也有许多独立软件提供商。


现阶段,不断增长的联网需求与不断上涨的成本正在成为数据中心的新挑战,基于此,赛灵思推出了Alveo家族最新的一体化SmartNIC平台Alveo U25,在单颗器件上实现了一体化的网络、存储、计算加速能力,以提供更高的效率和更低的总拥有成本(TCO)。赛灵思大中华区销售副总裁唐晓蕾(Maria Tang)、数据中心事业部产品及平台营销副总裁Donna Yasay,共同介绍了这一创新平台所传递的价值。


赛灵思大中华区销售副总裁唐晓蕾(Maria Tang)(左)、

赛灵思数据中心事业部产品及平台营销副总裁Donna Yasay(右)


数据中心的联网危机


数据中心正在面临联网危机,云基础设施饱受服务器I/O所造成的数据瓶颈的困扰。首先,进出数据中心联网的流量在迅速增长,内部的横向流量年负荷增长率在25%以上。其次,随着网络数据爆炸式地增长,额外的工作涌入云数据中心服务器,大量地挤占了CPU资源。边缘的一级云服务商(如亚马逊、微软)多年前已经注意到了这个问题,采取将联网功能转移到SmartNIC上的做法来为CPU减负,但是,由于超出80%的云服务器节点目前无法提供 SmartNIC 接入,因此联网卸载一时难以实现。



端口的联网问题为何会如此严峻?这是因为端口基于的是模拟技术和调制技术的创新,速度持续以几何级倍数增长,将远超摩尔定律和Dennard缩放比例定律(Dennard’s scaling)计算周期速率。如果这一问题没有得到足够的重视,未来将越来越严重,甚至导致服务器中所有CPU资源遭到挤占,而无暇顾及应用级处理。



Donna Yasay补充,一些云服务器厂商并非不需要对服务器上的联网功能进行卸载,他们通常仍在采用传统的NIC,特别是二级、三级云服务厂商,没有足够雄厚的研发资源,很难通过一己之力采用SmartNIC并做到大规模部署。因此,他们更加需要现成的、便捷的、开箱即用的解决方案。


SmartNIC究竟“Smart”在哪?


事实上,早有业内人士预测,SmartNIC将成为主流的云计算技术。对裸机云和安全性的需求,将推动软件定义的功能进入可编程SmartNIC中,而非增加昂贵的通用服务器CPU。


市场调研机构Dell’Oro集团研究总监Baron Fung表示:“预计到 2024 年,SmartNIC 市场规模将超过6亿美元,占据全球以太网适配器市场的23%。随着云服务提供商的纵向扩容,他们正在不断增加 SmartNIC 的部署,以便为业务应用释放宝贵的CPU核,优化服务器利用率。而电信服务提供商则是另一大具有强劲增长潜力的市场,他们正考虑将 SmartNIC 从核心网集成到边缘网,为 NFV 和 AI 推断等应用提供服务。”


基于 FPGA 的Alveo U25 SmartNIC迎合了这一不断增长的市场机遇。据介绍,Alveo U25是业界首款“一体化 SmartNIC 平台”,通过将高度优化的 SmartNIC 平台与FPGA引擎相结合,实现了全可编程与一站式加速应用,可用于业界具有一定挑战的需求与工作负载中,如:SDN、虚拟交换、NFV、NVMe-oF、电子交易、AI推断、视频转码和数据分析等。



为什么能够做到一体化的平台加速?Donna Yasay介绍了来自FPGA的核心属性:计算应用方面,FPGA在机器学习、推断数据库、加速视频转码等方面表现突出;联网方面:能够迅速进行信息包的处理和查询;存储方面,能够支持如压缩、加密和重复数据的删除等工作。


此外,还有FPGA灵活应变的特性,云服务商不论是开发新功能还是进行扩展,都比ASIC产品更有优势。


与基于SoC的NIC相比,Alveo U25 SmartNIC 平台可以提供更高的吞吐量和更强大的灵活应变引擎,支持云架构师快速为多种类型的功能与应用提速。Alveo U25支持“bump-in-the-wire (线缆内的块)”式无缝嵌入网络、存储和计算卸载及加速功能,可以避免不必要的数据传输和 CPU 处理,从而最大限度提高效率。而这也显著降低了 CPU的负担并释放更多资源,以运行更多应用。嵌入式 ARM 处理器提供了独特、关键的控制层处理功能,可以支持新兴的裸机服务器用例。基本型NIC可提供超高吞吐量、小数据包性能与低时延。标准型全功能 NIC 解决方案与驱动程序采用获得专利的 Onload应用加速软件,时延降幅高达80%,并且在云应用中为基于传输控制协议( TCP )的服务器应用提高了效率,最高可达 400%。 


Alveo U25 所提供的首个开箱即用型加速应用,是对 Open vSwitch ( OVS )卸载与加速的支持。这个即插即用型解决方案将从服务器卸载90%以上的 OVS 处理,从而将数据包吞吐量提升 5 倍以上。


未来,赛灵思还计划推出针对安全功能的一站式解决方案,这些安全功能诸如 IPSec、SSL/TLS、AES-256/128,同时还有分布式防火墙和 AI 推断。目前,Alveo U25 SmartNIC 平台正为早期试用客户提供样品。预计将于 2020 年第三季度开始批量供货。


针对高性能电子交易环境与企业级数据中心,赛灵思还推出了XtremeScale X2562 10/25Gb 以太网适配器卡,该卡符合 OCP Spec 3.0 外形尺寸规格,可提供亚微秒级时延、高吞吐量,以及可将实时数据包和信息流连接到数千个虚拟 NIC 的超大规模连接能力。X2562 目前已经开始提供样品,将于 2020 年第二季度批量供货。 


同时发布的还有基于 FPGA 的开放计算加速器模块( OAM )的概念验证板。该夹层卡基于赛灵思UltraScale+ VU37P FPGA 并搭载 8GB HBM 存储器,符合开放加速器基础设施( OAI )规格,可支持七条 25Gbps x8 链路,为分布式加速提供了丰富的模块间系统拓扑。


一站式软硬件协同的加速平台


根据Dell'Oro最新报告,整体控制器和适配器市场将以7%的年复合增长率增长,其中25Gbps和100Gbps的销售将是主要增长驱动力。同时,SmartNIC市场的年复合增长率将达到25%,这为适配器供应商提供了以更高价格推出创新产品的机会。反过来,这可以降低数据中心TCO。


唐晓蕾表示,在Alveo系列产品研发和推出策略上,赛灵思从客户TCO角度来分析,希望能真正解决数据中心客户的痛点。数据中心需要加速卡是确定趋势,随着摩尔定律的终结、数据的指数级爆发,数据中心对加速卡的需求会越来越大,现在仅是黎明开始的阶段。未来加速卡的市场格局分布,可以从几个维度看待:一是计算,特别是在云端上要去努力提升;二是网络方面,实现可扩展性、可视化、智能化;三是存储,在带宽的占用、成本方面,加速卡发展潜力很大。


为什么要推出平台型的产品?唐晓蕾表示主要是希望企业在数据加速方面能够更快面向市场。Alveo U25与赛灵思去年推出的Vitis统一软件平台是有机结合。由于之前FPGA开发有一定的门槛,而随着数据中心应用场景的不断扩展,新的客户群体在增加,必须在软硬件协同做更多提升,才能让整个客户群体受益。Alveo U25实现了一站式加速应用,可以助力非一级云数据中心运营商更加方便地部署,同时,还支持赛灵思和独立软件提供商提供的一站式应用。其编程模型既支持 HLS 和 P4 等高级网络编程抽象,也支持 Vitis统一软件平台等计算加速框架,以便实现赛灵思和第三方所提供的加速应用。




声明本文为电子发烧友网原创。如需转载和入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com

更多原创文章阅读

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存