查看原文
其他

面试题22解析-CDN分析

2017-06-08 javatiku Java面试那些事儿

题目:描述一下CDN的工作机制?


本文阅读大概需要15分钟。


这个题目主要考查你对CDN工作原理的理解。

CDN是什么?

CDN(Content Delivery Network),翻译过来就是内容分发网络,是构建在现有网络之上的一种内容分发网络;它将网站的内容通过中心平台分发到部署在各地的边缘服务器进行缓存,再通过负载均衡技术将用户的请求转发到就近的服务器上去获取所需内容,降低网络堵塞,提供访问网站的响应速度和命中率。它不同于简单的镜像,体现在它的内容的存储和分发、负载均衡上面。

CDN的服务类型?

目前,CDN服务的类型根据其服务的内容主要分为网页加速、流媒体服务、文件传输加速和应用协议加速4类。

  • 网页加速:主要用于缓存网站的静态数据,比如JS、CSS、图片和静态页面等。用户一般从主站获取动态内容后,再从cdn下载相应的静态数据,从而加快网页的下载速度。

  • 流媒体服务:主要服务于视频网站,通过将流媒体内容推送到离用户最近的节点,使用户可以从网络边缘获取内容,从而缩短响应时间,提高视频传输质量,减小中心服务器的压力。

  • 文件传输加速:通过使用CDN节点提供下载服务,来缓解文件下载带来的性能压力和带宽压力,提供用户下载速度。

  • 应用协议加速:通过对TCP等传输协议的优化,改善和加速和改善用户在广域网上的内容传输速度。或者对一些特定协议,如SSL协议进行加速,解决安全传输时的性能和响应速度问题。

CDN的工作原理?

CDN是主要是通过接管DNS的方式来把请求引流到离用户最近的缓存服务器上面,如图所示:

详细过程:

  1. 用户向浏览器提供要访问的域名。

  2. 首先向Local DNS服务器发送请求,经过迭代解析后回到这个域名的注册服务器去解析,DNS域名解析服务器通常会把它重新解析到另一个域名,这个域名最终会指向CDN全局中的负载均衡服务器,再由GTM分配那个地方的用户访问那个地方的CDN服务器。

  3. 用户直接去这个DNS节点获得相应的静态资源,如果这个节点的文件不存在,就会再去源站获取这个文件,然后再返回给用户。

负载均衡是什么?

由于CDN同一节点内往往包括多台服务器,为取得服务器性能的最优,需要应用负载均衡技术。我们常说的负载均衡,是指处理节点的负载信息通过某代理软件传递给均衡器,由均衡器做出决策并对负载进行动态分配,从而使集群中各处理节点的负载相对趋于平衡。

负载均衡主要解决以下几个方面的问题:

  • 为用户提供更好的访问质量。

  • 提高服务器响应速度。

  • 提高服务器及其他资源的利用效率。

  • 避免了网络关键部位出现单点失效。

  • 解决网络拥塞问题,服务就近提供,实现地理位置无关性。

负载均衡的常用算法:

  • 轮转调度

  • 加权轮转调度

  • 随机均衡调度

  • 加权随机均衡调度

  • 最小连接调度

  • 加权最小连接调度

  • 目标地址散列调度

  • 源地址散列调度

  • 基于局部性的最少链接调度

  • 带复制的基于局部性最少链接调度

  • 响应速度均衡调度

  • 处理能力均衡调度

  • DNS均衡调度

作者在此只是列举这些常见的负载均衡算法,如果感兴趣的读者,可以去查阅相关的资料了解一下。这些负载均衡算法,我们也会在分布式集群中用到,比如nginx、dubbo、spring cloud微服务等。

CDN怎么动态加速?

CDN的动态加速是在CDN的DNS解析过程中,通过动态的链路探寻出一条最优的路径,然后通过DNS的调度将所有请求调度到选定的这条路径上回源,从而加速用户访问速率。如图:

怎么来选择这么一条最优的路径呢?

每个cdn节点从源站上下载一个特定大小的文件,看看那个链路总耗时最短或者网络成本最小等,形成一个最优的链路列表,将其绑定到DNS解析上,更新到CDN的Local DNS。

CDN的衡量指标

可扩展:主要体现在性能可扩展和成本可扩展。

安全性:所提供的设备、网络、软件、数据和服务过程的安全性,能抵御DDOS等其它恶意攻击。

高可用:面对用户性能下降和故障问题时,能提供及时的容错机制。

如果读者希望了解更多关于CDN相关的知识,建议去读一下《内容分发网络(CDN)关键技术、架构与应用》。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存