查看原文
其他

英特尔推出数据中心GPU Flex系列,加速智能视觉云应用

英特尔 知IN 2022-09-29


Flex系列GPU可提供更出色的媒体转码吞吐性能和支持多达68路实时云游戏流,旨在满足智能视觉云的工作负载需求。


全新产品


英特尔®数据中心GPU Flex系列(曾用代号 Arctic Sound-M )能够帮助客户突破孤立且封闭的开发环境的限制,同时降低数据中心对于不得不使用多个分离、独立的解决方案的需求。英特尔为客户提供的单一GPU解决方案,能够在不牺牲性能或质量的情况下,灵活处理多种工作负载。这一优势可让它在支持多种云工作负载如媒体传输、云游戏、人工智能、元宇宙等新兴视觉云使用场景的同时,降低或优化相关的总体拥有成本。




我们正处于一场由更多用户、更多应用和更高分辨率所共同驱动的‘像素爆炸’变革中。当今的数据中心基础设施承担着计算、编码、解码、传输、存储和显示视觉信息的巨大压力。英特尔Flex系列GPU采用突破性的设计,更有针对性地满足了现阶段的相关计算需求,同时也为未来的沉浸式体验提供了灵活性和可扩展性。


——Jeff McVeigh

英特尔副总裁兼超级计算事业部总经理



强大性能


Flex系列GPU可满足图像质量、部署密度和时延方面的要求。在集成了基于硬件的、业界领先的AV1编码器的基础上,Flex系列数据中心GPU可以提供更出色的媒体转码吞吐性能和解码吞吐性能,且能耗低于同类型解决方案。它还实现了30%以上的带宽增幅1,显著降低了总体拥有成本。在软件层面,它可广泛支持主流媒体工具、API、框架和最新的编解码器。



基于英特尔的Xe-HPG微架构,并由生态系统中的广大硬件供应商和软件开发者提供支持,英特尔数据中心GPU Flex系列可以为诸如媒体分析、智慧城市、医疗影像等场景的AI推理工作负载提供在CPU和GPU之间灵活扩展的能力,而不会让开发者受限于封闭的专有软件中。


重要应用


媒体处理、媒体传输、视觉人工智能推理、云游戏和桌面虚拟化等应用场景在数据中心领域呈现快速成长趋势。受此驱动,面向视觉云的数据中心GPU芯片市场规模也有望在2026年增长至150亿美元2。如此快的增长势头,正发生在一个很大程度上受限于封闭的、需要授权许可的代码开发模式的行业中。


Flex系列GPU解决方案堆栈的出现,不仅能突破上述限制,还具备相比于其他解决方案的显著优势,即更高的灵活性和可扩展性,并能降低能耗。它能帮助解决方案提供商们降低总体拥有成本,让他们能够以更少数量的服务器满足更大规模用户的应用需求。


Flex系列GPU解决方案堆栈通过oneAPI(使用加速计算技术的高效手段)实现,能让开发人员摆脱封闭编程模式带来的经济和技术负担。相较于使用专利语言有可能会令后续开发被锁定在该语言上的局限,oneAPI是一种开放式的可选方案,它通过一套完整的、经过验证的工具为现有编程语言和并行化模型提供补充,从而充分释放硬件的性能潜力。它让用户得以开发开放的、易于移植的代码,更大限度地利用多种跨英特尔CPU和GPU的组合。


性能详述


英特尔数据中心GPU Flex系列将首先提供媒体处理和传输以及Android云游戏相关能力。


媒体处理和传输


视频会议、流媒体和社交媒体的视频处理需求已经改变了数据中心内的计算资源需求。Flex系列GPU的媒体架构包含多达四个Xe媒体引擎,专注于满足现代数据中心对于高密度视频流的需求,同时无需妥协质量:
  • 以低于同类型解决方案的能耗,提供更出色的媒体转码吞吐性能和解码吞吐性能。
  • 单卡能够支持多达36路视频流的1080p60转码吞吐量3
  • 单卡能够支持8路视频流的4K60转码吞吐量4
  • 在4U服务器中扩展到10卡配置时,它可以支持多达360路视频流的HEVC-HEVC 1080p60转码吞吐量3


● Flex系列GPU基于硬件的开源AV1编码器可节省30%以上的带宽1。Flex系列GPU的媒体引擎还支持包括HEVC、AVC和VP9在内的业界广泛使用的编解码器并可以提高其性能。 ● 利用英特尔®Deep Link超级编码功能,英特尔®数据中心GPU Flex系列140可在单卡上配备两套编解码设备,可以满足业界的“一秒时延”要求,同时提供8K60实时转码5。此功能适用于AV1和HEVC HDR格式。

Android云游戏


云游戏正呈现快速增长趋势,亟需更灵活的解决方案来为用户提供更多的实时游戏流。Flex系列GPU为提供更优的游戏服务质量而打造,可在各种设备上带来畅爽的游戏体验,这一点已经在近90款时下热门的Google Play* Android游戏中得到验证6


● 单个Flex系列170 GPU可以支持多达68路720p30数据流,而单个Flex系列140 GPU可以支持多达46路720p30数据流(基于特定游戏的测试结果)7

● 当使用6个Flex系列140 GPU进行扩展使用时,它可以支持多达216路720p30数据流。


开放式软件堆栈


开发人员可以访问整合了开源组件和工具的综合软件堆栈,以有效地实现Flex系列GPU面向视觉云工作负载的功能,包括对oneAPI和OpenVINO的支持。英特尔的oneAPI工具套件(包括英特尔®oneAPI视频处理库oneVPL、英特尔®VTune Profiler等)帮助开发人员能够更快地交付应用程序和服务。


面市计划


包括戴尔科技集团、HPE、新华三、浪潮、联想和超微在内的全球系统提供商将推出搭载Flex系列GPU的系统。在未来几个月里,从媒体传输和Android云游戏工作负载开始,搭载Flex系列GPU的解决方案将陆续面市。随后将是面向Windows云游戏、人工智能和虚拟桌面基础架构工作负载的系统和解决方案8


所有产品计划和路线图可能变更,恕不另行通知。


实际性能受使用情况、配置和其它因素影响而异。更多信息参见性能索引网站。结果可能有所不同。


向上滑动阅览

1) 与 AVC 相比,AV1 节约超过 30% 的带宽,测试中使用的是英特尔®数据中心 GPU Flex 系列 140 和 170。

2) 数据来源:结合来自 IDC、ABI Research、Global Market Insights、Strategy Analytics、Hyperion Research 的数据,由英特尔估算得出。

3) 测试中使用的是英特尔 Flex 系列 140 GPU 在性能模式下的 HEVC-HEVC 1080p60 转码吞吐量。

4) 测试中使用的是英特尔 Flex 系列 140 GPU 在性能模式下的 HEVC-HEVC 4Kp60 转码吞吐量。

5) 利用英特尔® Deep Link 超级编码实现 8K60 实时转码,测试中使用的是英特尔 Flex 系列 140。

6) 测试时使用了 2022 年 1 月和 2022 年 5 月 Google Play 中热门的 Android 游戏。

7) 选择的安卓游戏包括:

           Flex 系列 170 GPU:《王者荣耀》 720p30,68 路数据流。

Flex 系列 140 GPU:《荒野行动》 720p30,46 路数据流。

8) 反映英特尔数据中心 GPU Flex 系列在产品全面成熟之后的性能。



©英特尔公司,英特尔、英特尔logo及其它英特尔标识,是英特尔公司或其分支机构的商标。文中涉及的其它名称及品牌属于各自所有者资产。



相关资讯



/转载请注明出处/

点赞还是在看?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存