查看原文
其他

金山云边缘计算助力爱奇艺,冲进30毫秒高速区!

金山云
2024-09-05


1

爱奇艺在金山云部署边缘服务


边缘计算是近期较流行的技术概念,边缘计算其离不开“低延迟”和“海量并发连接”,爱奇艺和金山云本次成功地将概念变为产品实践。降低网络延迟能把用户拉入植物神经都无感的30毫秒舒适区;低延迟快速交互又极易出现瞬时大并发,我们需要将用户访问分散隔离到不同的边缘节点。

 

爱奇艺在金山云边缘(以下简称KENC)https://www.ksyun.com/post/product/KENC.html部署了DOH(DNS over HTTPS)服务,受益于KENC边缘容器云的稳定性能和强大功能,爱奇艺DoH服务的的各项网络指标均有提升,力求为用户提供更加极致的视听体验。未来5G信息源数量会增加十倍以上,延迟会进一步降低,今天的DoH边缘产研实践,也是双方为明天的业务创新练兵。


2

DoH服务的技术价值


我们首先解释这次部署的DoH服务的技术特性和业务价值,再看金山云KENC如何支撑DoH服务。


DNS协议(RFC1035)是互联网上的指明灯,是最广泛的访问指向方式。但它毕竟是1987年制定的老标准了,当时互联网速度慢、规模小,科教网络可信赖,其运行机制和报文格式,限制了它的应用范围。


DoH协议(RFC8484)于2018年正式发布,其使用HTTP GET/POST完成DNS查询过程,解决了安全和信息量的问题,有如下的先天优势:


1.  HTTPS加密防止DNS的嗅探和劫持,互联网圈现在就是这样用httpdns的。

2.  DNS查询只传递域名信息,EDNS也只是加上客户端IP,HTTP查询能携带大量自定义客户端信息,更方便DoH服务器做策略判断。

3.  DNS的响应报文只能回复IP,而DoH响应包除了DNS解析结果之外,可以一并完成其他消息分发。

4.  基于HTTP协议,DoH可以实现长连接、多重查询、缓存和更新缓存,这是DNS无法比拟的性能优势。

5.  DoH是企业自有域名的直接解析,路径极短依赖极少;DNS是社会公用服务系统,依赖多、稳定性差、不可控。



3

爱奇艺的DoH业务实践


当前很多互联网公司都在应用DoH服务防止恶意劫持,但DoH更有潜力成为一个更精细的客户端调度和传参系统。爱奇艺看重了DoH从IT基础架构层面和客户端通讯的能力,为更精细化的网络运营做布局:


1.  当单集视频点播有异常卡顿、当生僻内容只有部分CDN有缓存时,当要混用P2P和CDN网络,DoH服务可以做URI级别的精准调度。

2.  当设备频繁切换Wifi、当某段网络拥塞,DoH服务能算出最佳路由,甚至能按比例疏导分配用户访问。

3.  DoH客户端可以将设备ID、用户行为、网络诊断等信息一并传输给DoH服务,DoH服务还能从其他系统加载策略参数,上述信息计算后随着DNS查询一并反馈给客户端。

4.  DoH根据用户请求的频率,能完成一些监控信息搜集工作,比如某批设备为什么频繁读取同一视频内容,且报告严重卡顿?

 

与服务端DoH发力的同时,爱奇艺技术团队同时配套开发了DoH-SDK,提供爱奇艺产品矩阵的应用集成。DoH-SDK实现上使用嵌入式服务IP、DoH域名解析、AnyCastIP解析等多种方式获取最优的DoH服务器列表,同时通过扩展DoH协议,针对无法解析的域名走local DNS解析,最大限度保证用户体验。通过将DoH边缘化部署后,用户端进行网络请求时域名解析的耗时,全业务流程会有5-30ms的延迟降低,TCP链接成功率也有提升,且通过SDK简单配置即可实现多节点容错和轮询。



4

金山云如何承载DoH


前文介绍的扩展传参都涉及用户行为数据,大型互联网企业必须自建自研DoH服务,不可能使用常规云厂商提供的 DoH on PaaS服务。爱奇艺很早就在核心机房部署了DoH服务,但此次选择在金山云边缘节点上线生产业务,有如下技术考量:


1. DNS over HTTPS肯定比DNS over UDP要慢,就算用到“长连接+单次多查询+缓存”等优化手段依旧还是慢一些。金山云是按照优质CDN标准做网络选点,网络质量好、覆盖足,成功将单次连接的延迟压缩了5-30ms,多次访问的提升会更明显,最终为DoH扳回一局,从DNS污染时的救火服务,变为了在线主打业务。


2. 如果只在全国几个中心机房建设DoH,单点维持上亿个并发长连接是个复杂艰难的工作。DoH是策略查询和分发的服务,它只载入少量配置信息就能做大量自运算查询,非常适合水平复制上百份后部署到边缘节点,将用户访问分散化、本地化。DoH非常适合做边缘化架构改造,再搭配上客户端容错机制,从架构上规避了单点大范围崩溃。


3. 爱奇艺接入过程中验证了KENC容器的管理和计算能力。KENC容器的计算性能按对齐云主机设计,可以在边缘节点撑起密集查询、审核转码等业务。边缘应用需要弹性管理动态扩缩容,KENC提供了兼容K8S的接口让客户无缝对接。


4. 金山云认为边缘容器并不组成大规模复杂群集,而是低延迟大带宽海量并发。DoH服务并未使用七层负载均衡,而是用三四层直接接入服务,其效率更高速度更快,减少了七层负载均衡这个黑盒故障点,而且避免七层负载均衡解析客户业务。


5. 基于爱奇艺资源管理平台,实现容器资源的自动注册,同时结合金山云提供的丰富Open-API完善容器资源信息,最终实现对物理机、虚拟机、容器等资源的统一部署、透明管理。


目前爱奇艺DoH服务针对自有产品设计使用,未来随着边缘云的兴起,爱奇艺完成了DoH 30毫秒服务圈覆盖全球覆盖的能力后,届时会考虑将DoH服务开放。爱奇艺在金山云KENC部署DoH只是起步,爱奇艺奇速播业务也刚刚完成了边缘节点部署测试。随着调度策略放到边缘节点,爱奇艺也在探索将调度策略的各种伴生应用向边缘部署迁移。作为国内领先的娱乐视频平台,爱奇艺拥有业界领先的视频传输、调度、处理的IT技术能力。其持续关注5G和边缘计算技术,不断探索着用新兴IT技术去推动体验改善和业务变革。

5

金山云KENC愿与您携手同行


目前KENC已经建设完成大量节点,容器网络得到了切实优化。此外为应对急速增长的业务需求,我们研发了各种新功能,比如具备全局同步缓存数据库,具备慢速错峰能力的网络存储接口,具备代码托管能力的ServerLess等等,在客户未来的业务发展过程中,它们都将起到强有力的支持作用。


金山云KENC有一只精英团队,我们能和客户做专业性上的平等沟通,什么服务放到边缘上有业务改进价值,边缘化改造给甲方带来的成本和风险。我们希望能和各位工程师,共同探索更多有典型意义的边缘计算技术模式。


 -  FIN  -


“新基建”爆发前夜,金山云做好了哪些准备?

自主研发!金山云分布式数据库DragonBase提供可靠服务


答应我,千万要留意“春季放心购”,不然......




点击“阅读原文”立即了解金山云边缘计算服务

继续滑动看下一个
金山云
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存