查看原文
其他

撬动数据中心蓝海,加速AI应用——FPGA繁荣启示

张慧娟 电子发烧友网 2021-01-17

就像自然界的适者生存一样,在数字世界灵活应变的系统才是最可持续的。——今天的Xilinx,一定很庆幸几年前的平台化转型策略。

日前,Xilinx开发者大会(XDF)亚洲站在国家会议中心举办,这是XDF全球三站规模最大的一站,也是Xilinx在中国规模空前的一场开发者大会,超过两千名开发者参与。两天时间内,举办了75场报告与Lab培训,近100个方案演示,100+全球专家出席……偌大的国家会议中心,馆外彩旗招展,馆内熙熙攘攘,演讲、讨论气氛热烈,展台交流热火朝天……
如此繁荣的生态景象,对于盛行举办生态大会的科技界,也许不足为奇。但是如果把时间轴再拉回十几年,FPGA的标签总是摆脱不了“门槛高”、“成本高”……,几乎是半导体界阳春白雪一样的存在。
随着全球通信市场的发展壮大,FPGA以“万金油”的优势开始发挥价值,逐渐成为数字系统中的通用组件。今天,FPGA已经在数据中心占据日益重要的地位;而随着5G、AI等发展,FPGA在推动创新方面的优势也越来越显著;再从生态建设来看,Xilinx作为一家体量并非巨大的公司,所构建的生态系统、所联合的产业资源越来越庞大。
这一切,不仅仅是先进技术在开花结果,也是战略成果的丰盈时刻。

Xilinx平台化转型年度标志性事件

Xilinx总裁兼CEO Victor Peng在XDF上分享了公司今年所取得的重大成就,三大标志性事件包括:
第一,Alveo加速器卡面世。去年XDF上Xilinx宣布该产品,一年多的时间,为满足用户对算力、尺寸、内存带宽及成本的不同需求,陆续推出U50、U200、U250和U280四大产品系列,用于提升云端和本地数据中心服务器的性能。借助Alveo加速器卡,客户在运行实时机器学习推断以及视频处理、基因组分析、数据分析等关键的数据中心应用时,能够以更低的时延实现性能的突破性提升。
第二,自适应计算加速平台 Versal ACAP于今年6月份宣布开始出货。用Victor的话来说,“这是Xilinx多年软硬件投资及过去 35 年产品架构全部知识的积累,是一项重大的技术突破,将面向所有应用和各种开发者开启一个异构计算加速的新时代。”Versal作为一个高度集成的多核异构计算平台,可在软硬件两个层面随时进行更改,能够动态地适应数据中心、汽车、5G 无线、有线以及国防市场的广泛应用与工作负载需求。Xilinx超越FPGA成为一家平台供应商,Versal功不可没。
第三,Vitis 统一软件平台的发布,该平台可以根据软件或算法代码自动适配和使用Xilinx硬件架构,将用户从繁杂的硬件专业知识中解放出来。该平台将使得软件工程师、AI科学家等更广泛的开发人员都能够受益于灵活应变硬件加速的优势。而对于硬件开发者来说,Vitis可以通过软硬件工程师在同一工具平台上的协作,显著提升工作效率。这是Xilinx首次推出一个软件和硬件设计“大一统”的开发工具平台,也是Xilinx从器件向平台企业战略转型的里程碑产品之一。
面对即将到来的数据爆发时代,如何依靠强大算力将海量无序的数据加以提取,形成有用信息给客户带来价值——是赛灵思近年来不断思考的问题。“数据中心优先、加速核心市场发展、驱动自适应计算,”Victor用三大战略给出了答案。

数据中心优先战略和融合发展

根据IDC预测,从2018年至2025年,全球每年被创建、采集或复制的数据将增长5倍以上,预计将从2018年的32ZB增至2025年的175ZB,而中国将于2025年以48.6ZB的数据量及27.8%的占比,成为全球最大的数据汇集地。无论是公有云、私有云还是混合云,面对无止境的数据增长,都希望能够大幅提升数据中心的利用率、性能和能效,降低运营成本和总成本。一场现代数据中心的升级转型势在必行。
Xilinx执行副总裁兼DCG事业部总经理 Salil Raje表示,“数据中心优先”战略共包括三个层面:一是计算,二是网络,三是存储。其中计算市场最大,2025年将达到70-80亿美元的总体规模。
Salil认为Xilinx灵活应变的高性能计算、存储和网络加速自适应计算加速平台,正在加速驱动数据中心的升级转型。Xilinx在数据中心的自信主要源于三方面原因:一是产品的自适应能力,由于是硬件可编程,可以根据应用,针对不同的工作负载,对内存、精度等进行定制化;二是FPGA的带宽处理能力,数据流入即可实时处理,而不用等数据转移到SSD或其它存储器件上;三是小巧的硬件外形,灵活且节省空间。
目前在数据中心领域,采用FPGA的加速卡解决方案已经在FaaS云平台、无人驾驶、视频渲染加速、证券分析加速等多个应用场景落地应用。
浪潮服务器在中国市场出货量和销售额排名第一。基于Xilinx的产品,浪潮推出内嵌HBM2高带宽存储的FPGA加速卡F37X,面向智慧城市领域的多通道视频AI加速卡F07V,集成RDMA的高性能网络、低延迟计算卸载的智能网卡N10X等多款高性能FPGA加速设备。
FPGA过去在IT生命周期中只是阶段性需求,但是随着硬件重构加软件定义等特性的演变,已经成为整个IT生命周期中长期、持续的需求。浪潮集团高级副总裁彭震在演讲中提到,融合发展正在引发数据中心新一轮变革,计算、存储和网络的模块融合,软硬件一体化的平台融合,IT、CT和OT的跨技术融合,以及“互联网+”、“物联网+”与“智能+”的跨产业融合,对计算范式的灵活性和计算架构的开放性均带来新的挑战。
在数据中心融合发展的趋势下,通过硬件重构+软件定义的融合架构,实现敏捷、可重构、高性能功耗比的可定制计算将是未来数据中心创新的重要解决之道。浪潮希望能与Xilinx深入合作,在云、AI加速、存储加速方面等引领更多创新。
据了解,Xilinx在数据中心的生态系统仍在不断丰富中,目前主要包括Alveo生态系统和ISV(独立软件提供商)生态系统。Xilinx已经开始与众多知名服务器 OEM 提供商携手Alveo 加速,培训企业及学术界用户达7000 多人,加入赛灵思加速器计划的合作伙伴已经达800 多家,应用发布近100 个。

迎接计算变革,Vitis AI助力推断提速

三大趋势正在驱动计算变革:
首先是异构计算。随着计算向多元化发展,越来越多的场景引入多种不同计算单元来进行加速计算,异构计算应运而生。
其次是从云到边缘。以前大量计算都放云端,随着带宽、安全需求以及边缘侧算力的提升,数据的处理方式在产生变化,需要适配不同场景下的计算需求。
第三是AI激增。一方面是数据量的增加,另一方面是数据形态的巨大变化。未来数据将包括越来越多的音视频、社交等非结构化数据,以及联网汽车数据、神经网络数据等。
Xilinx软件与 AI 产品市场营销副总裁Ramine Roane(罗明)在媒体见面会上表示,“所有的硬件和计算都应该是自适应的需求,这点得到越来越多行业的认可。”
应对上述三大趋势带来的挑战,Xilinx于今年10月推出Vitis统一软件平台,它把AI和传统软件开发统一起来,把终端计算、边缘计算、云计算统一起来,把不同的架构统一起来,并使它们可以使用统一的语言进行加速。开发者无需硬件专业技术,就能根据软件或算法代码自动定制Xilinx硬件架构。
XDF上,Xilinx正式宣布人工智能推断开发软件平台Vitis AI开放免费下载,便于更多开发者体验从边缘到云的AI和深度学习推断加速度。与 Vitis 统一软件平台相结合,利用其异构系统集成和加速能力,Vitis AI可以帮助开发者在Xilinx嵌入式SoC平台和Alveo平台上实现端到端的全应用加速,实现数十倍的性能提升。
为了满足AI应用多样性的趋势和适应AI创新的速度,Vitis AI可提供多种深度学习处理单元 ( DPU ) ,实现基于AI模型和任务的硬件自适应,而无需重新流片;Vitis AI支持Tensorflow和Caffe等业界流行框架的快速部署,从量化、编译到硬件集成,仅需几分钟时间。
罗明表示,使用标准的环境与API、拥抱开源、软硬件协同作战——是未来软硬件关系的三大方向。Xilinx完全将集成的开发环境免费提供给用户,让他们将Vitis AI无缝集成在自己的开发环境中。这与过去用户自己设计开发环境,背后调用Xilinx的编译器和调试工具有很大的不同,更有利于软件开发人员在自适应的开发平台上释放创新力。

后记

数据中心加速市场正在迅速成长。据Research And Markets相关数据显示,从2018年到2023年,数据中心加速器市场将从28.4亿美元增长到211.9亿美元,年复合增长率(CAGR)为49.47%。其中,FPGA预计将会是年复合增长率最高的细分市场,该增长将由企业级工作负载加速应用对FPGA越来越多的采用而驱动。新的架构正在数据中心产生及应用,这是FPGA所面临的蓝海。
不过,数据中心优先,并不意味着Xilinx会缺席其他主流市场。正如三大战略中的“加速核心市场发展”,在汽车、无线基础设施、有线通信、音视频与广播、航空航天、工业、科学与医疗、测试测量与仿真等主流领域,Xilinx拥有深厚的市场根基并致力于成为关键技术的引领者。
把计算加速应用推向更广泛的新领域,打造灵活应变的系统,FPGA及自适应计算平台大有可为,且任重道远。
正如Victor所强调,Xilinx的最终目标是:打造灵活应变,万物智能的世界。


免责声明:本文由作者原创,文章内容系作者个人观点,电子发烧友网转载仅作为传达一种不同的观点,不代表电子发烧友网对该观点的赞同或支持,如有异议,欢迎联系电子发烧友网。


更多精彩文章阅读

兄弟号,深阅读,欢迎长按二维码关注


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存