侵入式服务治理方案,读这一篇就够
尽管在程序执行效率上,Java不如C、C++,在开发效率、易用性以及学习难度上,Java又不如Ruby、Python、Go,但Java无疑是当今后端系统开发中使用最为广泛的语言。
Java所累积的大量生态体系是其他任何开发语言都不具备的。基于Java开发的“杀手级”应用数不胜数,互联网后端的很多复杂系统也都是用Java开发的。因此,如何治理基于Java开发的分布式应用系统,是互联网公司面对的首要问题。
侵入式服务治理方案指的是,在应用端使用框架提供的API开发程序并提供服务治理方案。Java提供了很多一站式服务化框架,可以有效地与应用系统深度配合,形成完善的服务治理体系。由阿里巴巴公司开源的Dubbo,以及由Pivotal公司开源的SpringCloud是业界采用最多的侵入式服务治理方案。
Dubbo是阿里巴巴公司于2012年前后开源的分布式服务框架。从开源至今,它由于设计理念超前、性能出色、稳定性较强而累积了大量国内忠实用户。虽然中间有几年停止了更新,但现在Dubbo又重新开启被维护,这使得它又焕发了新的活力。
在远程通信一章中,我们已经介绍过Dubbo的RPC部分。严格地说,Dubbo目前并非一款完善的服务治理框架,它更偏重RPC部分。
Dubbo 概述
提起Dubbo,就不得不再次给出Dubbo刚刚开源时发布的架构演进图,如图6-1所示。
图6-1架构演进图
在图6-1中,互联网架构的演进过程分为四个阶段,每个阶段对应一种架构模式,具体如下。
单体应用架构
在系统访问流量不大时,应用所需的所有功能都在开发和部署时被集中在一起。单体应用架构获取数据的主要途径是与数据库进行交互。由于关系型数据库与面向对象的阻抗不匹配,因此,开发出能够简化增删改查工作的数据库访问(ORM)框架是重中之重。
垂直应用架构
在系统访问流量逐渐增大时,像单体式应用架构一样通过服务器硬件加速带来的承载量提升的方式已经无法满足业务需要。因此,需要将应用按照业务线进行垂直拆分,将系统部署为多个相对独立的应用。垂直应用架构获取数据的途径除了系统内部与数据库的交互外,也包括系统间的交互。通过灵活的Web MVC框架提供数据,供前端系统及其他外围系统展示和使用,这是垂直应用架构关注的重点。
分布式服务架构
随着系统访问流量进一步增大,越来越多的垂直应用被拆分出来,独立应用间的共同特征越来越多。因此,我们要将核心业务抽取出来形成独立的后端服务,再对前端进行进一步抽离,使其能够更加快速地响应市场需求。此时,前端与后端的交互以及后端服务之间的交互,若采用基于RESTful API的WebMVC显然并不适合,因此RPC成了获取数据的重要方式。
弹性计算架构
后端服务的增多,使得服务的治理成本越来越高,手动进行服务发现、负载均衡、连接管理、限流保护等工作已经变得不现实,因此提供一个服务治理中心是弹性计算架构的关键所在。另外,越来越多的细小服务的资源评估工作也变得非常烦琐,服务的资源浪费问题也需要重点关注,因此,提供一个调度中心来管理和分配集群容量进而提高集群利用率,是另一个关键所在。
Dubbo所关注的重点在于第三点和第四点的前半部分。对于分布式应用间的RPC交互而言,Dubbo采用透明化的方式,让使用者无须关心方法的调用是本地的还是远程的。Dubbo采用以ZooKeeper为主的注册中心和治理中心来提供服务治理,并未提供调度中心的实现方案。图6-1成型于2012年,当时并没有Docker和Kubernetes这样的产品出现,Dubbo所提出的调度中心管控资源的概念,与Docker和Kubernetes的理念不谋而合,展现出了极具前瞻性的眼光。
图6-2是官方提供的采用Dubbo作为服务化框架的应用架构图,除了调度中心,其他都已开源。
图6-2 采用Dubbo作为服务化框架的应用架构图
Dubbo将服务划分为提供者和消费者,根据需求不同,每个应用都可以既是服务的提供者,又是服务的消费者。应用开发方可以将服务进行合理分层。在图6-2中,服务被划分为前端服务、集成服务以及核心服务三层。其中前端服务是服务的消费者,核心服务是服务的提供者,集成服务对于前端服务而言是提供者,对于核心服务而言则是消费者。
核心流程
简单来说,Dubbo中必有的核心概念只有服务提供者、服务消费者和注册中心这三个,治理中心以及监控中心并非必需品。
服务提供者和服务消费者启动时,都会初始化一个Dubbo的运行时容器,多为Spring容器。服务提供者完成初始化后,将向注册中心注册服务;服务消费者完成初始化后,将向注册中心订阅服务。
注册中心在服务提供者列表发生变化时会将变化的内容主动通知给服务消费者。服务提供者和服务消费者在初次连通后,即持有长连接,它们之间将通过透明化的远程调用进行通信。每次调用的信息将传递至监控中心用于统计。Dubbo启动的核心流程如图6-3所示。
图6-3 Dubbo启动的核心流程
注册中心
Dubbo通过注册中心来实现服务发现,它支持Multicast、ZooKeeper、Redis和Simple这四种类型的注册中心。虽然看似选择不少,但Multicast注册中心受网络结构限制,只适合小规模使用,而Simple注册中心不支持集群,因此,实际上生产级别可用的只有ZooKeeper注册中心和Redis注册中心。
无论是使用ZooKeeper还是使用Redis作为注册中心,都不是阿里巴巴内部的实现方案,而是开源的桥接实现方案,因此没有经历阿里巴巴内部的长时间考验。通过服务发现一章中的介绍可知,虽然ZooKeeper并不是首选的用于服务发现的注册中心,但相较于Redis,它的可靠性更强。除了Dubbo,其他很多第三方组件也采用ZooKeeper作为注册中心或元数据管理系统,如Kafka、Hadoop、Mesos,而Redis更加适合于存储应用数据的缓存体系。因此,大部分情况下,Dubbo都是配合ZooKeeper注册中心来使用的。
无论使用ZooKeeper还是Redis作为注册中心,服务注册和服务发现的流程都是相同的,只是存储数据结构以及监听等功能的具体实现不同而已,因此,下文仅选用ZooKeeper作为注册中心来举例说明。图6-4展示了Dubbo注册服务后在ZooKeeper注册中心的Znode中的存储结构。
图6-4 Dubbo的存储结构
Dubbo所有的运行时状态信息都会集中存入一个统一的根节点,根节点的名称就是dubbo。每个服务会以类全称独立创建一个节点,服务节点下会分别创建名为providers和consumers的子节点,用于存储服务提供者和服务消费者信息,每个服务提供者和服务消费者的副本都会在相应的节点位置创建一个临时节点,该临时节点以URL的形式存储当前服务提供者或服务消费者的信息,包括IP地址、端口、调用方法等元数据,以及传输协议、最大连接承载数、路由策略等配置信息。另外还有configurators和routers节点用于存储全局配置和全局路由信息。
服务提供者启动时会在相应服务节点的providers节点下写入包含自身信息的URL作为临时节点;服务消费者启动时会在相应服务节点的consumers节点下写入包含自身信息的URL作为临时节点,并且监听providers节点的变化。当新的服务提供者加入,或当前服务提供者下线时,所有的服务消费者将通过ZooKeeper的监听机制自动感知变化。声明一个最简化的注册中心很容易,以Dubbo最常用的Spring命名空间的配置方式为例,代码如下。
<dubbo:registryaddress="zookeeper://zk_host:2181" />
Dubbo支持多注册中心同时提供服务,以分组的方式隔离不同的注册中心。只有设置为同一组别的服务才会注册到同一个注册中心下。提供多注册中心需要以ID进行区分,声明多注册中心的示例代码如下。
<dubbo:registryid="global" address="zookeeper://zk_host:2181"group="global" />
<dubbo:registry id="custom"address="zookeeper://zk_host:3181" group="custom" />
前面介绍ZooKeeper时提到过,除了原生客户端,还有两个较为常用的第三方客户端,它们是ZkClient和Curator。Dubbo支持这两种客户端对ZooKeeper进行操作,只需在配置注册中心时指明ZooKeeper的实现客户端即可,代码如下。
<dubbo:registryaddress="zookeeper://zk_host:2181" client="curator" />
负载均衡
Dubbo采用客户端负载均衡方式,即由服务消费者一方决定将当前通信发送至哪个服务提供者的副本。服务消费者实例启动时会从注册中心同步一份当前有效的服务提供者实例列表,并在服务提供者列表发生变化时更新本地数据副本。每次远程调用发生时,服务消费者都会读取内存中的服务提供者实例列表,并根据合适的负载均衡策略选择一个最合适的服务提供者实例进行访问。
Dubbo的服务发现和负载均衡机制,使得基于它开发的分布式系统具有弹性好、高可用、性能优的特征。
弹性好:
基于的服务发现机制可以快速发现服务的扩容与缩容,与相对静态的服务列表配置机制比,它是更加动态、灵活和实时的,这使得基于Dubbo开发的服务可以随时被关闭、启动和迁移,也使得应用能够以原生方式利用云环境中资源的弹性伸缩。
高可用:
Dubbo是完全去中心化的服务治理方案,在分布式系统运行时,任何节点宕机都不会对服务产生实质性的影响。服务提供者宕机是较为常见的问题,可以与缩容一并处理,不会影响集群的整体服务。注册中心容易被误认为Dubbo系统的中心,其实不然,即使注册中心集群整体宕机,也不会影响Dubbo应用的运行。因为服务提供者列表是缓存在每一个服务消费者本地的,因此即使不经过注册中心,服务间的远程调用仍然不会中断。不过在注册中心失效期间,服务消费者无法感知新上线的服务提供者,因此无法对系统进行扩容。
性能优:
采用Dubbo协议的服务消费者和服务提供者之间是点对点直连的,连接建立后无须断开,每次远程调用无须重新经过三次握手,也无须经过负载均衡服务器的二次转发,非常适用于互联网后端之间频次高、性能敏感度高的服务交互。
Dubbo支持随机、轮询、最少活跃调用数和一致性哈希这四种负载均衡策略,也提供扩展点用于定制策略。
随机策略是Dubbo默认采用的负载均衡策略。调用量越大分布越均匀,在无状态应用场景下较为适用。
轮询策略能够让流量以绝对均匀的方式分配。但是,如果服务节点处理能力不均衡的话,便会导致大量请求最终阻塞在最短板的服务节点上,从而影响集群的整体运行效果。
最少活跃数调用策略可以使请求响应迅速的服务节点获得更多的请求,使请求响应缓慢的服务节点获得较少的请求。
一致性哈希策略使用一致性哈希算法,使相同的参数总是可以被发送给同样的服务提供者,在服务节点变化时平摊请求,避免请求路由结果发生剧烈变动。一致性哈希算法在分布式缓存等方案中较为常见,无状态服务没有必要使用,但如果服务是有状态的,便可以考虑使用该策略,以降低数据在服务节点间的复制频率。
Dubbo还为负载均衡策略提供了权重,可以通过配置或Dubbo的控制台动态调节权重,控制各个服务节点分配到的请求的数量。
配置负载均衡策略很简单,以下是将接口的负载均衡策略调整为轮询策略的配置代码。
<dubbo:referenceinterface="..." loadbalance="roundrobin" />
以下是将某一种方法的负载均衡策略调整为轮询策略的配置代码。
<dubbo:referenceinterface="...">
<dubbo:method name="..." loadbalance="roundrobin"/>
</dubbo:reference>
在服务调用失败时,Dubbo还提供了失效转移等容错的能力。
远程通信
使用Dubbo进行远程调用非常简单,它将多种通信方式及不同的序列化协议进行了统一封装。服务提供者和服务消费者只需在配置中指定使用的协议,便无须关心其他的实现细节了。
在正式介绍通信协议之前,我们需要先明确一下“Dubbo”这个词在不同语境中所表示的不同概念。首先,Dubbo是这个框架的名字;其次,在Dubbo框架中,服务提供者与服务消费者之间可以采用多种协议通信,Dubbo通信协议便是其中的一种;最后,远程通信时需要对在网络间传输的消息进行序列化和反序列化,Dubbo序列化协议是Dubbo框架所支持的众多序列化协议之一,是其自研的序列化算法。
Dubbo框架内置了多种通信协议,默认使用Dubbo通信协议,其他的协议还有RMI、Hessian、HTTP、WebService、Thrift、Memcached、Redis等。每个协议的连接方式、支持的序列化协议、线程模型、消息派发方式等都有很大区别。
Dubbo通信协议是Dubbo框架中最常用的通信协议。它采用Java NIO实现多路复用。对于每一个服务消费者来说,Dubbo协议的服务提供者都会创建固定数量的长连接传输消息,用于有效减少建立连接的握手次数,Dubbo通信协议使用线程池并发处理请求来增强并发效率。由于连接复用,传输大文件时的带宽占用率高可能会成为系统瓶颈,因此Dubbo通信协议适合处理高并发的小数据量互联网请求,不适合处理视频、高清照片这样的大文件或超长字符串。
Dubbo通信协议并未直接使用Java原生的NIO包进行开发,它默认采用Netty框架进行远程通信,并且可以仅通过配置的变更将远程调用的具体实现方式切换为使用Mina或Grizzly等其他通信框架,远程调用的实现对使用方完全透明。
Dubbo通信协议可以支持多种序列化协议,与变更通信框架一样,它也能够仅通过修改配置实现序列化协议的切换。Dubbo通信协议使用Hessian作为默认的序列化协议,除此之外,还支持Dubbo、JSON以及Java原生的序列化协议。
限流
在实际使用场景中,服务提供者一般远少于服务消费者。如果为每个服务消费者创建单一的连接,在服务消费者数量可控的情况下,服务提供者不太容易被轻易压垮。但如果为每个服务消费者创建独立连接,或者当服务消费者的数量爆发性增长时,就需要在服务提供者端限制最大可接收连接数了,防止自身被压垮。
在Dubbo的服务提供者端配置限流参数的代码如下。
<dubbo:providerprotocol="dubbo" accepts="10" threads="10"connections="10" />
其中的accepts、threads和connections分别表示该服务提供者应用实例的最大可接受连接数、最大线程数,以及每个服务提供者可建立的长连接数。
也可以在通信协议部分进行全局配置,配置代码如下。
<dubbo:protocolname="dubbo" port="20880" accepts="1024" />
治理中心
运行时环境的Dubbo只需具有服务提供者、服务消费者和注册中心就可以正常运转,所有的运行时信息都存储在基于ZooKeeper或Redis的注册中心中。可以直接通过命令行对注册中心进行查询以获取系统当前的运行状态,也可以通过直接对注册中心的数据进行修改(例如修改权重、禁用某一服务提供者实例、修改负载均衡策略等)以达到控制服务提供者和服务消费者行为的目的。
但是直接通过ZooKeeper或Redis的原生命令来查询和修改数据并不方便,也容易由于手动失误造成线上事故,因此Dubbo提供了治理中心,可以帮助运维工程师查询和调整系统的运行时状态。
Dubbo治理中心的名字叫作dubbo-admin,它可以被打包为一个独立的war文件,部署至Tomcat这类支持Servlet标准的Web容器中使用。无论是否使用dubbo-admin,都不会对运行时的Dubbo应用产生任何影响,它的作用只是提供一个可视化工具,辅助工程师进行运维相关工作。基于Dubbo开发的应用与Dubbo治理中心并无直接关联,它们之间无须感知对方的存在,它们仅与注册中心建立关联。
Dubbo治理中心为服务提供者和服务消费者提供了分组查询、配置更改、加权/降权、禁用/启用、权限控制、负责人管理等运维功能。
监控中心
在复杂的分布式系统中,Dubbo的服务消费者与服务提供者之间的调用关系相当错综复杂,仅凭治理中心是无法掌握当前系统运行所需的全部数据的。Dubbo提供了监控中心的接口以及一个名为dubbo-monitor的简单实现,dubbo-monitor可以用于统计和分析调用信息。
Dubbo的监控中心采用了与治理中心类似的设计思路,dubbo-monitor宕机不会对线上正在运行的应用产生不良影响。只要监控中心正常运行,就能够以增量的方式统计和分析调用数据。Dubbo应用间的远程调用信息将被发送至监控中心进行统计,采集的调用信息包括调用的发生时间、耗时、成功与否、来源方、目的地等。监控中心将采集到的数据定时汇总,并将统计结果落盘至其所在的服务器。通过监控中心可以清晰地看到服务的访问总数、成功失败次数,以及每个服务调用耗时的最大值、最小值和平均值的聚合图。
监控中心虽然是Dubbo官方提供的一个基于内存计算和本地存储的建议实现版本,但客观来讲,它只适用于演示程序,并不能完全满足线上环境监控和分析的需要。它缺乏完善的调用链路统计功能,因而无法绘制系统的整体调用关系图。对于单次调用而言,它也无法深入钻取Dubbo之外的调用信息,例如服务提供者调用数据库的耗时。仅使用dubbo-monitor难于完成对系统的综合监控以及对事故的复盘解读。
DubboX的扩展
DubboX由当当网开源,X源于extensions一词,是对Dubbo的扩展和有益补充。
REST协议
虽然Dubbo框架支持多种通信协议,但缺乏对当今较为流行的RESTful风格远程调用的支持,基于Dubbo进行二次开发的DubboX弥补了这一方面的缺憾。
DubboX基于标准的Java REST API——JAX-RS2.0(Java API for RESTful Web Services),为Dubbo提供了透明化的RESTful风格支持。在DubboX中,仅对通过Dubbo开发的应用稍作修改即可支持REST协议。
首先对服务提供者实现类添加JAX-RS的API,核心代码如下。
@Path("foo")
public class FooServiceImpl implements FooService {
@GET
@Path("bar")
@Consumes({MediaType.APPLICATION_JSON})
@Override
public Date bar() {
return new Date();
}
}
再将provider.xml的服务暴露配置修改为REST协议,核心代码如下。
<dubbo:protocolname="rest" port="8080" />
启动程序后,即可通过访问浏览器或执行curl命令获取调用结果。通过REST协议能够实现异构语言间的调用。
高性能序列化
序列化会对远程调用的响应速度、吞吐量、网络带宽消耗产生较大影响,是提升分布式系统性能最关键的因素之一。
在Dubbo通信协议中,常见的序列化方式主要有以下几种。
Dubbo序列化:阿里巴巴公司尚未开发成熟的高效Java序列化实现,不建议在生产环境中使用。
Hessian2序列化:一种跨语言的高效二进制序列化方式。使用Dubbo框架修改过的hessianlite是Dubbo通信协议默认启用的序列化方式。
JSON序列化:采用FastJson解析JSON,文本序列化性能不如上面两种二进制序列化性能。
Java原生序列化:采用JDK自带的Java序列化实现,性能不是很理想。
通常情况下,以上四种主要序列化方式的性能从上到下依次递减。对于Dubbo通信协议这种追求高性能的远程调用方式来说,只有前两种高效序列化方式与之比较“般配”,而Dubbo序列化方式还不成熟,因此实际只剩下Hessian2方式可用。Dubbo通信协议默认采用它作为序列化选型。
但Hessian2是一个比较老的跨语言序列化实现方式,并不单独针对Java进行优化。而Dubbo通信协议是一种Java同构语言之间的远程调用,没有必要采用跨语言的序列化方式。
前面介绍的高性能序列化框架,如Kryo 、Protobuf 等,Dubbo都没有采用。除了这些,还有专门针对Java语言的FST、跨语言的Thrift、Avro、MsgPack等,这些序列化方式的性能都显著优于Hessian2。
鉴于此,DubboX引入Kryo和FST这两种高效Java序列化方式来取代Hessian2,它们与Dubbo这样的高性能通信协议更加“般配”。
使用方法非常简单,仅需在Dubbo 通信协议的配置中声明序列化协议名称即可,核心代码如下。
<dubbo:protocolname="dubbo" serialization="kryo"/>
或者也可以采用如下方式。
<dubbo:protocolname="dubbo" serialization="fst"/>
DubboX是当当网基于Dubbo进行增量开发而实现的项目。出于对Dubbo的敬意,保留了代码中阿里巴巴的包名,因此无法将代码发布到阿里巴巴的Maven中央仓库中。使用者需要自行下载源码编译打包。
Dubbo凭借远程调用和服务治理功能成为分布式系统的关键组件,并且借助自身优异的性能、较高的质量以及便捷的使用方式在服务化领域占据了一席之地。但服务治理领域所涵盖的内容非常广泛,即使像Dubbo这样优秀的项目,也并未完全实现服务治理领域的全部功能。目前,Dubbo缺乏有效的熔断机制,在调用链路跟踪方面也还有提升的空间。
Dubbo近年来疏于维护,因此后来居上的Spring Cloud渐渐占据了更大的市场份额。不过Dubbo团队已经在2017年宣布重新开始维护Dubbo,希望能带来更好的服务化解决方案。
(编者注:阿里巴巴开源了Sentinel,Dubbo重启之后也取得了长足的发展,附录如下)
2014年,当当网 fork 了 Dubbo 版本,命名为dubbox-2.8.0,并支持 HTTP REST 协议;
2014年10月,发布2.3.11版本;
2017年9月,阿里巴巴重启维护,重点升级所依赖的 JDK 及组件版本,发布2.5.4/5版本;(直接基于spring boot 去做的 上层 rpc 框架)
2018年2月,阿里巴巴宣布将 Dubbo 捐献给 Apache,进入 Apache 孵化器;
2018年6月,Apache Dubbo 发布首个加入 Apache 孵化器的版本2.6.2,发展首位committer,来自有赞的@yiji同学;
2018年7月,Dubbo 官方域名更新到 dubbo.apache.org,页面焕然一新,并启用新 logo,品牌全面升级;
2018年11月,加入孵化器以来,发展来自有赞的 @yiji同学成为首位 PPMC member;
2018年12月,第八届云计算标准和应用大会 ,Dubbo 获得中国优秀开源项目一等奖,同时获得开源中国举办的2018中国优秀开源项目奖,位列排行榜第3;
2019年1月,发布了2.7.0,支持 Java 1.8,包名更改为org.apache,支持 Restful 服务;
2019年1月,Dubbo 社区正式发布 Dubbo Ecosystem, 升级为完成的微服务解决方案;
2019年5月21日,Dubbo 从 Apache 正式毕业。
本文节选自《未来架构:从服务化到云原生》一书,张亮、吴晟、敖小剑、宋净超著,电子工业出版社出版。
点击阅读原文,可直接购买此书。
-完-
往期推荐:
技术琐话
以分布式设计、架构、体系思想为基础,兼论研发相关的点点滴滴,不限于代码、质量体系和研发管理。