查看原文
其他

干货|基于Anycast技术的DNS系统

系统网络部 爱奇艺技术产品团队 2019-06-14

写在前面

随着云计算的发展,在我们的内部网络中,越来越多的业务承载在虚拟主机上,这意味着内部网络的DNS系统面临的访问量会打破物理主机数量的限制大规模的增长。按照原有的DNS架构,我们需要扩大单个DNS节点的服务能力或者构建越来越多的DNS节点。前者会使单个节点故障时对业务的影响越来越大,后者在占用更多IP地址的同时,也使得DNS系统的运维更加困难。

而基于Anycast的DNS系统,全网DNS节点使用统一的IP地址提供服务,根据路由协议进行自动的负责均衡,并可以在单节点故障时自动进行业务切换,很好的应对云时代对DNS系统的性能要求,并有效降低运维压力。

 Anycast技术简介

Anycast将一个单播地址分配到处于Internet中多个不同物理位置的主机上,发送到这个地址的报文被网络路由到“最近”的目标主机上。

Anycast技术的优势主要有以下几点:

a) 负责均衡特性

在Anycast环境下,由多个地理位置不同的主机同时使用同一个IP地址。不同的地理位置用户会根据就近路由判断,选择最近的节点访问,从而实现了节点间的负载均衡,同时优化了用户访问时延;


Anycast的就近访问特性

b) 抗DDOS特性

DDOS攻击最关键一点,是需要把所有地理位置分散的小流量最终汇集到一个点。因为Anycast的负载均衡特性, DDOS流量在穿越基于动态路由协议的网络时,会被分散到不同的Anycast节点,使得DDOS攻击难以实现。

Anycast抗DDOS特性

c) 节点级冗余

当任意服务节点故障时,客户端请求可以在无人为干预的情况下自动被路由到目前可达的最近目的主机,在一定程度上为目标主机提供了冗余性;


Anycast技术也有其自身的局限性:Anycast中的共享单播地址不能作为客户端发起请求,因为请求的响应不一定能返回到发起Anycast的客户端。因此,目前Anycast仅适合一些特定的上层协议,从目前的实际应用来看, Anycast最广泛的应用是DNS的部署。

爱奇艺的Anycast技术实践

Anycast让我们看到了为系统提供更高冗余性可能,节点级的冗余可以降低夜间故障处理的紧迫性,彻底拯救工程师的睡眠。所以,我们在内网进行了Anycast技术验证工作,希望更好的了解Anycast技术,并将部分业务部署上去:

首先,我们考虑的是Anycast对UDP和TCP协议、特别是TCP会话连续性的影响,这和网络中路由器的负载均衡方式有关。在测试过程中,你会发现大部分路由器或者交换机都采用逐流的负载均衡方式,没有破坏TCP会话的连续性,这就保障了作为服务端(对应客户端),TCP业务和UDP业务均可基于Anycast部署:

a) Anycast对基于UDP的各类业务,具备良好的承载能力;

b) 经测试,网络中基于哈希的ECMP等负载均衡技术,没有破坏TCP会话的连续性,为TCP业务在Anycast场景的部署提供了可能;

另一个重要的问题是,如何确保提供服务的主机或者进程故障时,可以快速的删除相关的动态路由,触发路由协议收敛,实现业务自动疏散到其他节点去。通过部署插件监控DNS进程,和基于Quagga部署在服务器的OSPF协议结合,我们实现了在DNS进程故障\服务器故障\网络故障时,Anycast路由均可以自动收敛,实现业务自动切换。

最后,Anycast的负载均衡效果依赖于路由协议,取决于服务节点位置和用户位置的对应关系。为了了解真实的负载均衡情况,我们通过部署监控插件,统计每5分钟日志访问数量,实时监控全网节点的负载均衡质量,为优化Anycast节点布局优化提供统计数据。

基于Anycast技术的DNS系统部署

通过上述的技术验证工作,目前我们的DNS解析组已经在内网上线,部署在多个核心机房的Anycast节点同时服务公司内网DNS解析需求。

目前上线的DNS系统运行平稳,服务质量正常。通过实战演练,在单节点整体故障的情况下,可以实现业务自动切换<2S,用户基本无感知。

通过和Anycast技术的结合,内网DNS系统具备了节点级故障的自愈能力,极大的减轻了DNS系统运维压力。

基于Anycast的DNS系统:就近访问与故障自动切换


 Anycast技术展望

通过在内部网络部署基于Anycast的DNS系统,验证了Anycast技术对基于UDP协议的各类业务有良好的承载能力。接下来,我们会选择合适的TCP业务进行Anycast承载测试,希望通过Anycast技术更大范围的提升业务系统的健壮性,为更多的运维工程师减轻故障处理负担。



 扫一扫 下方二维码,更多精彩内容陪伴你!

文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存