查看原文
其他

【Network Stack】DARPA重塑计算密集型应用程序的网络堆栈

掰棒子的防务菌 从心推送的防务菌 2022-04-11
相对于摩尔定律设定的轨迹,计算性能一直在稳步提高,并且网络性能也以类似的速度加速增长。尽管在网络和服务器技术上有这些相互联系的发展,但是从网络接口卡(NIC)或桥接网络/服务器边界的硬件开始的网络堆栈却没有跟上发展的步伐。如今,网络接口硬件正在阻碍从网络到处理硬件的数据接收。其他因素,例如服务器内存技术的局限性、内存复制、不良的应用程序设计以及对共享资源的竞争,已导致网络子系统在网络堆栈内造成瓶颈,并限制了应用程序的吞吐量。

“处理器吞吐量的真正瓶颈是用于将机器连接到外部网络(例如以太网)的网络接口,因此严重限制了处理器的数据摄取能力。”对此,美国国防高级研究计划局(DARPA)信息创新办公室(I20)项目经理Jonathan Smith博士表示:“如今,采用最新技术的网络吞吐量约为10的14次方bps,数据以大约10的14次方bps的总速率进行处理。当前的堆栈仅提供大约10的10至11次方bps的应用程序吞吐量。

解决多处理器服务器与连接它们之间的网络链接之间的瓶颈对于分布式计算越来越重要。此类计算需要计算节点之间进行大量通信。它还越来越依赖于高级应用程序,例如深度神经网络训练和图像分类。

为了加速分布式应用程序并消除巨大的性能差距,DARPA启动了“快速网络接口卡”(Fast Network Interface Cards,FastNIC)项目。FastNIC通过创建全新的联网方法,力求将网络堆栈性能提高100倍。要实现这种显著的性能提升,就需要对整个网络堆栈进行重新设计,包括从应用程序层到系统软件层,再到硬件。

图表以垂直对数刻度表示数据速率,左侧是光纤,右侧是服务器。从左向右的移动跟踪路径数据必须经过从光纤到服务器的组件。网络堆栈受网络接口卡和系统软件的限制为每秒10-100吉比特。对于需要在计算节点之间进行大量通信的分布式计算,此瓶颈尤其重要。FastNIC致力于通过开发、实施、集成和验证新颖的纯净网络子系统,将应用程序(例如机器学习分类器的分布式培训)速度提高100倍
Jonathan Smith表示:“构建网络堆栈涉及很多开销和复杂性——从最大限度地增加硬件和软件之间的连接到重新设计应用程序接口。强大的商业激励措施聚焦于在多个独立的市场孤岛上谨慎地提高技术进步,这打消了任何人从整体上解决堆叠问题的想法。”

为了证明对此进行大刀阔斧改革的必要性,FastNIC项目将选择一个具有挑战性的应用程序,并为其提供所需的硬件支持、操作系统软件和应用程序接口,这些应用程序将使拥有更快的网络接口卡的系统全面加速。根据该项目,研究人员将致力于开发、实施、集成和验证新颖的全新网络子系统。

FastNics项目技术领域1和2作为一个堆栈
FastNIC的第一个研究领域将专注于开发硬件系统,以显著提高聚合原始服务器数据路径的速度。在此研究领域内,研究人员将使用现有或映射的硬件接口设计,实现和演示验证10 Tbps网络接口硬件。硬件解决方案必须通过一个或多个行业标准接口点(例如I/O总线、多处理器互连网络和内存插槽)连接到服务器,以支持FastNICs技术的快速过渡。Jonathan Smith对此表示:“它始于硬件;如果你不能正确解决问题,那么你将陷入困境。软件不能使事情更快地超过物理层所允许的速度,因此我们必须首先更改物理层。

第二个研究领域将集中于开发管理FastNICs硬件资源所需的系统软件。为了在应用程序级别上实现100倍的吞吐量增长,系统软件必须能够在网络硬件与系统其他元素之间高效且并行地传输数据。FastNIC的研究人员将致力于生成软件库,所有这些库都是开源的,并且至少与一个开源OS兼容——可被各种应用程序使用。

FastNIC还将探索由程序生成的硬件所提供的多个数量级性能提升可以启用的应用程序。研究人员的目的是设计和实现至少一个在新颖的硬件/软件堆栈上执行时能实现100倍加速的应用程序,从而为程序的主要目标提供验证器。有两个特别令人感兴趣的应用领域:分布式机器学习和传感器。机器学习需要利用集群(或大量机器),以便将所有核心都用于一个目的,例如分析图像以帮助自动驾驶汽车正确识别道路上的障碍。Smith表示:“最近的研究表明,通过加快网络支持,整个分布式机器学习系统可以更快地运行。在机器学习中,通常使用的方法涉及到移动数据,这会产生延迟。但是,如果你能够在FastNics取得成功结果的机器之间更快地移动数据,那么你应该能够缩小性能差距。” 

FastNIC还将探索来自无人机和顶置成像仪等系统的传感器数据。示例应用将是变化检测,其中使用标记的图像来训练深度学习系统,以识别图像捕获的时间序列中的异常,例如存在奇怪的结构,或在不可解释的位置的设施中的突然活动。变更检测需要快速访问当前传感器数据以及快速访问数据档案的能力。FastNIC将提供一种加速从大量数据中获取可行情报的方法。

FastNIC广泛机构公告目前已发布在FedBizOpps.gov上,其中包括项目目标、时间表和指标。

FastNIC项目的计划周期表


来将通名&非诚勿扰


前情回顾

【New EW System】带上这几个“棺材盒”,美国海军第七舰队就可以继续横行台湾海峡?

【Battlefield 2030】关于多域战和未来战争

【New AI Strategy】美国空军2019人工智能战略(全文发布)

【Sky Pie】明月寄相思,E-3送“月饼”

【Spectrum Collaboration Challenge】DARPA宣布参加频谱协同挑战赛冠军赛的最终团队

【Full-Spectrum Cyber】在战场中获得网络优势

【High-tech Future Commandos】日已落帝国畅想其2050年高科技皇家海军陆战队


防务菌


有礼有节&百无禁忌

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存