至强秘笈 | “软饭硬吃”是成功秘诀?看英特尔至强现身说法
加快数字化发展,建设数字中国——这是《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要(草案)》提出的纲领性号召。《纲要》还指出:我们做好准备,迎接数字时代,激活数据要素潜能,加快建设数字经济、数字社会,以数字化转型整体驱动生产方式、生活方式变革。[1]
数字经济、数字社会、数字中国,关键字是“数字”,也就是要实现数字化,推进数字化转型。根据国务院发展研究中心的定义,数字化转型是指,利用新一代信息技术,构建数据的采集、传输、存储、处理和反馈的闭环,打通不同层级与不同行业间的数据壁垒,提高行业整体的运行效率,构建全新的数字经济体系。[2]可以看出,数据是“数字化”的中心。这正与英特尔想要推动的变革——以数据为中心——不谋而合。
在此前的分享中,我们看到英特尔有丰富的软件产品,并基于此形成了全球范围内2000 万开发人员共同参与的开放、开源软件生态,所有这些都属于英特尔的“软件先行”的战略,使得英特尔这个在大家眼中一直“硬”到不行的公司能够巧妙地“软饭硬吃”,即充分利用软件优化、软硬互补和协同的力量,充分调动与激发旗下计算、网络、存储三大基础设施领域硬件产品在性能和功能上的优势,从而以数据为中心,尽可能加速对数据的处理、分析,释放数据的潜在价值,最终助力整个社会的数字化转型。
本文就将从云计算和云服务、数据分析和 AI、互联网媒体及娱乐服务这三个层面,看看英特尔是如何“软饭硬吃“,是如何利用软件来帮助客户实现业务创新,先行一步,抢占数字经济先机的。
软件夯实地基,推动数字经济
要想建设好“数字中国”这栋高楼大厦,必须先打好牢靠的地基,这无疑正是“新基建”的使命之一。信息基础设施建设、融合基础设施建设、创新基础设施建设这三大领域中,云计算的地位显而易见。足够强大、强健的云计算和云服务,当然需要计算、存储和传输三大基础设施有足够好的硬件产品组合,提供均衡的性能表现,同时,还要有配套的软件工具,可以将硬件性能和功能上的潜力发挥到极致。
英特尔除了提供高性能的系列硬件平台之外,同样以多样化的软件开发和优化工具来帮助云服务商满足数字时代的需求。
以青云为例,支持海量数据的高速存取,是其设计开发QingStor® NeonSAN® 系统的目的。作为新一代软件定义存储型分布式超大容量块存储系统,它有两种部署方案,一种使用英特尔® 高速缓存加速软件(Cache Acceleration Software, 简称CAS,提供开源版本Open CAS), 将傲腾™ 固态盘用作机械硬盘的高速缓存,其 IOPS 性能在回写和直写测试中均远超对比组,回写模式的随机写性能甚至达到对比组的 23 倍[3];另一种方案利用英特尔开源的存储性能开发软件套件 (Storage Performance Developer Kit),搭配英特尔® 傲腾™ 固态盘和 NAND 固态盘,显著降低随机写时延,并提升近 20%的读写性能。[4]
图1 英特尔® CAS在青云QingStor® NeonSAN® 系统中发挥加速作用的原理图示
英特尔® CAS 的作用是提供智能缓存管理,将最活跃的数据放入高性能固态盘,从而提高应用程序性能,解决数据中心 I/O 性能瓶颈。而 SPDK 则是一套可用于编写高性能、可扩展、用户模式存储应用程序的工具和库,同样以实现高性能存储为目的。阿里云的 POLARDB 同样用到 SPDK,将查询性能提升 30%,延迟降低 76%。[5]
英特尔还有另一个智能存储加速库英特尔® ISA-L(Intelligent Storage Acceleration Library),可用来加速和优化基于英特尔架构的存储,在存储可恢复性、数据完整性、数据安全性提供优化,并加速数据的压缩。腾讯云使用 英特尔® ISA-L,结合英特尔的性能分析工具英特尔® VTune™ Profiler(现为英特尔® oneAPI Base & HPC Toolkit的组件),将其腾讯文件系统 TFS 冷存储的空间节省了 60%,同时查询性能提升到了原来的 2.8 倍。[6]
有了海量数据,自然需要对其进行分析,甚至用于人工智能的训练和推理,以从中获得更多有价值的洞察。英特尔提供的多种工具,可以帮助企业顺畅实现智能化转型。
标准化工具和框架,让 AI 服务百业千行
麦肯锡去年底发布了《2020 AI 应用状态全球调研》,针对技术和工具这个层面,表现出色的企业与其他组织最大的差别在于:开发 AI 模型时,具备标准化的框架工具和开发流程。[7]
在世界各地的数据中心中,英特尔® 至强® 处理器都拥有广泛的部署,作为集成深度学习加速技术的主流数据中心级 CPU,它已经成为数据中心深度学习推理的事实标准,是大多数客户开启人工智能之旅的起点[8]。在实现软硬件充分优化后,英特尔® 至强® 可扩展平台的 AI 性能、特别是推理性能已能与专有架构平台相媲美。在这方面,英特尔提供了能加速深度神经网络应用性能的数学核心库英特尔®MKL/MKL-DNN(现名为oneAPI Math Kernel Library, 和oneAPI Deep Neural Network Library),以及经过它们 “改造“的、面向英特尔架构优化的Tensorflow、 Caffe、MXNet 等多种主流 AI 框架;能无缝对接现有大数据平台和AI功能,实现端到端数据处理、分析和AI应用能力的Analytics Zoo;还有OpenVINO™工具配套件,它能对AI应用数据和模型进行量化转换(从FP32转为INT8或BF16),让第二代和第三代英特尔® 至强® 可扩展处理器中集成的英特尔® 深度学习加速技术物尽其用,同时,它可集成了能提升常见AI模型开发和部署效率的组件,帮助用户在应用中省时增效。
这些软件工具在实际应用中是如何发挥功效的?让我们端上实战案例:
金山云在拓展AI云服务(AIaaS)时,一方面采用集成有深度学习加速技术的第二代至强® 可扩展处理器,另一方面导入面向英特尔架构优化的TensorFlow等AI框架,形成针对AI应用“软硬打包、协同优化”的镜像。这种组合在多种深度神经网络中的推理性能都获得了不同程度的提升,如在SSDMobilenet网络中的性能揽或就达到了原来的2.89倍。[9]
图2,面向英特尔® 架构优化的TensorFlow在金山云AI云服务中带来的推理性能提升
在制造业领域,为了实现更快、更准确的产品缺陷检测,美的使用了“大数据+AI”端到端解决方案,其中用到 Analytics Zoo 统一分析人工智能平台,在其基础上开发的工业视觉检测系统,将推理用时从2秒缩短到124毫秒,且可以快速部署,项目部署周期缩短 57%,人工成本减少 70%。[10]
图3,美的基于英特尔® Analytics Zoo 的端到端AI产品缺陷检测方案
互联网一向是 AI 应用创新的领头羊。爱奇艺就引入英特尔的 OpenVINO™ 工具套件和 oneAPI Math Kernel Library 以及 oneAPI Deep Neural Network Library,构建了基于云的深度学习平台 Jarvis,让实时弹幕的推理速度提升 5 倍,涉黄内容检测推理效率提升 6 倍,文本检测应用的推理性能更是提升 11 倍。[11]
图4,Open VINO™工具套件提升Jarvis平台推理效率
现在,爱奇艺的视频服务正在逐步实现全流程智能化。英特尔® 至强® 扩展处理器平台、英特尔数据分析和 AI 软件,以及英特尔软件在媒体处理上的强大能力,将持续助力爱奇艺提供强大的媒体服务能力。
从媒体到娱乐,更快、更好、更清晰
2020年,全球 75% 的移动数据流量将来自视频。2022 年,全球消费者实时视频点播流量有望增加近一倍。未来十年内,全世界 AR、VR 和云游戏内容将增长近 24 倍,同期全球媒体和娱乐服 务提供商从无线业务上获取的收入规模可达3万亿美元!
每个人都想以最快的速度、最高的清晰度、最强的互动能力,看到最新的视频和流媒体内容。当然,这对视频平台的编解码能力提出了更高要求。就像上面提到的爱奇艺,通过应用 OpenVINO™ 这个计算机视觉深度学习工具套件,实现了视频的自适应码流播放,不但改善视频收看体验,还节省运营成本。
图5,基于Open VINO™ 工具套件的Jarvis平台推理优化过程
CDN 是决定视频体验好坏的另一个重要服务。作为拥有国内 40% 市场的 CDN 服务商,网宿科技使用英特尔的 QAT 软件技术,结合加速卡,将 HTTPs CDN 加速性能提升超过7 倍,同时显著降低了 CDN 加速系统升级的成本压力。[12]
英特尔还提供专门用于视频处理的oneAPI Video Processing Library,过去称为Media Server Studio 和 Media SDK。除了辅助 AI 落地之外,它们的主要目的是为了实现高效的多媒体处理。二者能够完成从摄像头到云的无缝端到端软件开发,快速交付高质量的视频与计算机视觉处理特性。如云创大数据开发的智慧园区视频监控解决方案,就通过oneAPI Video Processing Library加速了视频的编解码,同时借力 OpenVINO™ 工具套件及英特尔深度学习加速技术提升图像识别 AI 推理的速度,整个方案的实施也从原先预期的六个月减到三个月,更快满足了最终客户在智慧园区 AI 应用方案上的落地需求。[13]
数字化转型,我们一起努力
改革开放几十年来,中国经济一直在不断转型。数字经济、数字中国,是这个历史性转型过程的下一站。随着技术的飞速发展,英特尔也在不断转型,从以PC为中心转向以数据为中心,从CPU公司转型至XPU公司,提供计算、存储、网络三大基础设施的硬件产品组合,同时以强大的软件研发能力发挥硬件的性能,服务各行各业的客户,英特尔希望在数字经济世界里提供一个端到端的解决方案。正如英特尔公司全球副总裁兼中国区总裁杨旭所说:中国在数字经济方案增长迅速,而英特尔中国希望做到的,是与中国合作推进这一进程。[14]
[1] 《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要(草案)》
http://cpc.people.com.cn/n1/2021/0306/c64387-32044137.html
[2] 传统产业数字化转型的模式和路径
https://cdf.cdrf.org.cn/jjh/2018/pdf/mshlj.pdf
[3] 该测试数据援引自青云内部测试报告。
[4] #测给你看#什么样的存储引擎 让Oracle数据库性能100%增长?
https://www.sohu.com/a/249625689_464027
[5] 阿里云POLARAB*:创新的云托管数据库
https://www.intel.cn/content/www/cn/zh/cloud-computing/alibaba-polardb-solution-brief.html
[6] 软件优化极大提高存储性能
https://www.intel.cn/content/dam/www/public/cn/zh/pdfs/xeon-optimize-tengxun-storage-performance-brief.PDF
[7] The state of AI in 2020
https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/global-survey-the-state-of-ai-in-2020
[9] 在金山云通用型N3实例上进行的测试结果
[8] 文件:
Intel_Cooper Lake_Lisa Spelman_Launch video script_Final_0616-CY
LISA SPELMAN 发言脚本
[10] 为智能制造增添“眼”和“脑”的能力
https://www.intel.cn/content/www/cn/zh/customer-spotlight/cases/midea-case-study.html
[11] 优化深度学习推理效率,打造更智能视频服务
https://www.intel.cn/content/www/cn/zh/analytics/artificial-intelligence/optimize-the-efficiency-of-dl-inference-and-create-smarter-video-services.html
[12] 优化深度学习推理效率,打造更智能视频服务
https://www.intel.cn/content/www/cn/zh/analytics/artificial-intelligence/optimize-the-efficiency-of-dl-inference-and-create-smarter-video-services.html
[13] 至强集成AI加速,助云创大数据打造智慧园区视频监控方案
https://www.intel.cn/content/https://www.sohu.com/a/454166203_447115www/cn/zh/artificial-intelligence/video-surveillance-solution-for-intelligent-industrial-park.html
[14] 英特尔杨旭:中国将为数字经济铺筑基石
https://www.sohu.com/a/454166203_447115
* 本文内容及配图均为“英特尔商用频道”的原创内容。该公众号的运营主体拥有上述内容的著作权或相应许可。未经该运营主体书面同意,请勿转载、转帖或以其他任何方式复制、发表或发布上述内容。如需转载上述内容或其中任何部分,请留言联系。
英特尔、英特尔标识、以及其他英特尔商标是英特尔公司或其子公司在美国和/或其他国家的商标。
©英特尔公司版权所有。
* 文中涉及的其它名称及商标属于各自所有者资产。
延伸阅读
★ 至强秘笈 | AVX-512,加速密集型计算任务的“专用车道”
★ 至强秘笈 | DL Boost,以低精度成就高效率的魔术师
★ 至强秘笈 | 英特尔® 傲腾™ 持久内存:重构计算系统的“社区图书馆”
★ 至强秘笈 | 英特尔® 至强® 可扩展平台,由内至外,加速智能时代
★ 至强秘笈 | 2000 万程序猿+媛的选择:见证英特尔至强软实力
★ 至强秘笈 | OpenVINO™ 工具套件,面向AI任务的“神奇改造车间”
长按识别二维码
“芯”有灵犀,你也“在看”!