查看原文
其他

优化数据中心网络

NVIDIA英伟达 NVIDIA英伟达网络 2022-07-10

通过以下两种方式更新关键网络架构,可以优化数据中心,它们分别是:更新网络技术或提升 NetDevOps 中的操作效率。在本文中,我们将确定并评估可应用于网络体系结构以优化网络的技术。


我们将介绍五个新方法,您应该考虑使用这些新方法来改进数据中心:


  • 用 VXLAN 替换第 2 层 VLAN 。

  • 使用地址解析协议(ARP)抑制来减少广播传播。

  • 将多机箱链路聚合组(MLAG)替换为 EVPN 多重连接(Multihoming)。

  • 使用等价多路径(ECMP)路由和 UCMP 处理流量平衡。

  • 通过自适应路由解决流量极化问题。


用 VXLAN 替换 VLAN


VXLAN 是一种覆盖(overlay)网络技术,它使用封装允许 2 层 VLAN 跨第 3 层网络。第 2 层网络有一些固有的缺点:


  • 由于它们依赖生成树协议(STP),冗余和多路径的能力受到生成树功能的限制。

  • 它们只能在一个子网内运行,由于 MLAG ,冗余通常仅限于两个设备。

  • 任何路径级冗余都需要链路聚合控制协议(LACP),这是端口的标准冗余技术。


VXLAN 克服了这些缺陷,允许网络运营者在第 3 层路由结构上进行优化。用户仍然可以实现第 2 层网络的覆盖,但由于使用 EVPN 作为控制平面,因此不再需要生成树来进行控制平面收敛。


EVPN 通过 BGP 地址簇交换 MAC 信息,而不是低效的广播泛洪和学习。此外,VXLAN 使用 24 位 ID ,可定义多达 1600 万个虚拟网络,而 VLAN 只有 12 位 ID ,仅限于 4094 个虚拟网络。


使用 ARP 抑制来减少广播传播


使用 VXLAN 的数据中心中的广播流量可以通过 ARP 抑制进一步优化。ARP 抑制通过使用 EVPN 将 ARP 请求的响应直接从 ToR 虚拟隧道端点(VTEP)代理反馈给客户端,帮助减少通信量。


在没有 ARP 抑制的情况下,所有 ARP 请求将在整个 VXLAN 结构中广播,并发送到每个具有网络 VNI 的 VTEP 。


启用 ARP 抑制后,通过 EVPN 学习到的 MAC 地址将传递到 ARP 控制平面。


充当 VTEP 的叶交换机通过代理 ARP 应答直接响应 ARP 请求者。


由于 IP 到 MAC 映射已经使用 EVPN 类型 2 消息通过 VXLAN 控制平面进行通信,因此部署 ARP 抑制可以优化覆盖网络控制平面的,获得更快的地址解析速度。它还减少了网络中的广播流量,因为 ARP 抑制减少了向 VXLAN 基础设施中的每个 VTEP 发送 ARP 请求的需要。


用 EVPN 多重连接(Multihoming)替换 MLAG


有时,VXLAN 环境中仍然需要 MLAG 来实现冗余主机连接。EVPN 多重连接是一个摆脱专用 MLAG 解决方案的机会,这些解决方案(MLAG)的扩展范围不超过一个设备冗余级别。


如前所述,VXLAN 有助于消除 MLAG 所需的背靠背叶到脊椎交换机连接的需要。EVPN multihoming 更进一步,消除了服务器到叶交换机连接中对 MLAG 的任何需要。


Multihoming 使用 EVPN 消息与主机连接进行通信,并使用主机连接信息动态构建与服务器的 L2 邻接。当 MLAG 需要 LAG ID 时,多宿使用以太网段 ID 。接口映射到用于作为与同一终端主机逻辑连接的以太网段(Ethernet Segment)。


此外,通过在交换机中使用标准协议构造冗余,转向多重连接可以提高网络供应商的互操作性。由于多重连接使用开放标准协议 BGP ,任何通过 RFC 规范实现多重连接的供应商都可以成为以太网段的一部分。


ECMP 和 UCMP 处理流量平衡


ECMP 是大多数第 3 层路由协议中的标准功能,在这些协议中,在所有可用的下一跳上行链路中平衡等价路由。第 2 层控制平面技术(如生成树)仅允许通过依赖外部技术(如 LACP)实现同等价负载分担。


ECMP 是第 3 层路由中的原生功能,它使您能够提高网络设备的效率。


在某些情况下,ECMP 可能会导致转发效率低下,特别是在部署全面的第 3 层解决方案时,在网络中的任何位置都使用点对点 L3 链路,甚至到主机。在这种情况下,您可能希望在使用链路数量以外的指标来平衡流量。UCMP 在这里很有用,因为它使用 BGP 标记创建跨跃点的流量分布,以便更好地与应用程序分布相匹配。


通过自适应路由解决流量极化问题


自适应路由是现有 InfiniBand 技术在以太网交换上的实现。自适应路由监控链路带宽、链路利用率、交换机缓冲区和 ECN/PFC ,以了解特定路径上的流量何时变得拥塞,并从动态重新路由至较不拥塞的路径中受益。


如果达到这些指标的阈值,交换机可以将流量从一个出接口重定向到 ECMP 组中的另一个出接口。这有助于平等地充分利用交换机上的所有链路,而不会造成流量极化的威胁,从而产生低效的流量。


自适应路由的目标是将网络管理员从手动调整干预中解放出来,让基础网络处理聚合流负载均衡的优化工作。


结论


在本文中,我们介绍了数据中心网络中可用的一些概念,这些概念可以通过协议栈和数据平面来帮助您优化网络基础设施。这些优化提供了更好的网络虚拟化能力,有助于减少基础设施上不必要的控制流量,并平衡现有第 1 层链路上的流量,以充分利用所有可用带宽。


NVIDIA 往期精彩内容


算力时代,网络决定性能
HPC 研究人员借助 NVIDIA BlueField DPU 为网络计算的未来打下坚实基础
为什么没有理想的数据中心网络设计

更多精彩仍在继续... 

敬请关注



NVIDIA DOCA 现已开放接受申请,扫描下方海报二维码,立即注册抢先体验!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存