如何帮助业务丝滑配置?阿里巴巴用了 11 年的“功能开关” 是什么?
作者|苏宇(流士)
程序员进修班
我们业务常见的配置问题
通常业务代码中包含许多的配置项,这些配置项用于控制各种各样的业务逻辑,例如一个 bool 类型的变量控制某个功能是否开启,一个 list 控制访问白名单或黑名单,一个 String 控制提示信息。但是在常规的微服务架构应用的配置过程中,会碰到以下的配置问题与挑战。
针对上述问题,开发者通常希望可以动态、实时地去查看和修改配置项,并且期望不需要编写额外的代码来管理,此时就可以利用 AHAS 功能开关来实时修改和查看对应的配置项。与传统的配置中心不同,开发者使用 AHAS 功能开关时,无需关注配置项的解析逻辑,只需声明对应的变量,加上 AHAS 功能开关的注解即可在功能开关控制台对配置进行动态管理。
什么是 AHAS 功能开关?
AHAS 功能开关是一个轻量级的动态配置框架,通过功能开关可以动态管理代码中的配置项,根据需求为某个应用开启或关闭部分功能,或设置某个性能指标的阈值。功能开关通常用于设置黑白名单、运行时动态调整日志级别、降级业务功能等场景。
利用 AHAS 功能开关,可以帮助企业构建完善的线上运维手段,作为流量防护等常规运维手段的有力补充,功能开关可针对特定业务场景实现定向止损,及时保障应用系统稳定性;对不同业务场景下的配置项具体内容可灵活变更,随时调整;AHAS 功能开关可将原生 Spring 配置项自动转化为功能开关项,真正做到零改造。
AHAS 功能开关实现逻辑
通过 AHAS 控制台管理和推送配置项,应用重启或扩容阶段可读取持久化配置。
市场中现有的配置管理服务在某些配置管理核心环节存在严重不足,具体现象可简述如下:
灵活性差
现有配置管理服务多基于文件方式或需手动设置配置项方能生效,过程较为复杂,且容易出错;AHAS 功能开关可自动支持原生 Spring 配置项,极大解放业务人员生产力。
配置类型缺少校验
现有配置管理服务在推送阶段大多未实现类型校验,可能导致严重线上故障,引发资损;AHAS 功能开关对配置类型进行强校验,把问题暴露在控制台层面,避免由于人员操作失误引发的问题。
持久化数据丢失
现有配置管理服务多基于本地文件或数据库进行持久化,SLO 难以保障;AHAS 功能开关依托于集团持久化产品保障开关持久化的可靠性。
侵入性强
现有配置管理服务对代码侵入性较强,引入使用需做大量改造,耗费较多精力;AHAS 功能开关提供 Agent 接入方式,对应用完全无侵入,对某些需自定义开关场景可按需引入 SDK。
和业界常见产品的差别是什么?
对 switch 社区版及国内外使用较为广泛的开关配置产品,从配置在微服务运维的各个阶段及维度展开进行比较。AHAS 在应用接入的成本、配置推送的可操作性以及配置持久化方面都有较大的优势:
应用接入
应用通过 Agent 方式接入 AHAS,连接功能开关服务,无需对应用做任何改造,真正做到无侵入。
配置推送
通过 AHAS 控制台即可对应用的配置项进行管理,按需推送配置项,支持按节点推送与全局推送方式。
配置持久化
通过 ACM 组件持久化配置项,保障配置项高可靠性。应用在重启或扩容阶段可读取持久化配置。
详细内容见下表:
除此之外,AHAS 功能开关相较于其他竞品还具备如下差异化优势:
强类型校验
用户无需在业务层面对接收到的配置进行类型及格式的校验,校验工作由平台承担,应用仅需关注业务。
无侵入式接入
对 SpringCloud 应用支持一键接入,自动识别应用中配置项,可通过控制台实时修改并进行持久化等操作。
复杂配置项支持
在复杂数据类型支持方面较为完善,无需遵守较为繁琐的配置项规则。
开箱即用功能
支持日志级别动态调整,获取不同级别日志,方便问题分析、故障定位。
业务中开关配置常见的应用场景有哪些?
动态调整日志级别
在开发 Java 程序时,我们经常会用到各种各样的日志框架。为了避免在程序正常运行时输出不必要的信息,可以针对性地动态调整日志级别,以便输出更多的日志信息排查线上问题,或是减少日志打印带来的性能消耗。功能开关提供了在应用运行时动态修改日志级别的功能,在不同的应用场景下,您可以随时调整日志的级别,得到更有效的日志信息。(注:支持的日志框架:Log4j、Log4j2、Logback。)
配置项组合更新
在实际的业务运行场景下,可按不同场景批量更新组合配置项。所谓组合配置项指具有一组相互关联业务语义的配置项,如页面公告中时间、标题、内容等,商品特殊优惠配置中价格、优惠折扣等。
下图以'商品优惠配置'为例进行说明。'商品优惠配置'在不同场景下优惠对象、优惠折扣及价格等各不相同,将'商品优惠配置'涉及的配置项组合,在不同场景下设置不同内容,可在不同场景下快速切换,同时省去繁琐校验过程,避免出错。
开关驱动开发
以开关方式控制代码执行逻辑,用于新功能快速验证,在出现问题时可及时回退。相比复杂的系统发布,投入成本较低,可结合 DevOps 机制进行实践。
如下图所示,当执行逻辑触发时访问对应的开关配置查看配置是否打开,从而决定是否执行新功能。可用于 A/B 测试、环境隔离等场景。
金丝雀(灰度)发布
确保应用发布的可观测,可灰度,可回滚,使用金丝雀发布进行小流量验证,验证通过后再全量升级,实时查看流量的分配情况。
怎么配置 AHAS 开关?
步骤一 :环境准备
功能开关 Agent 方式接入,与流量防护共用 Agent,
配置-Dahas.switch.agent.plugin.group.enabled=true
应用配置 SDK 方式接入,参考使用 SDK 接入[1]
应用配置 Spring Boot Starter 方式接入,参考使用 Spring Boot Starter 接入[2]
步骤二:配置操作以开箱即用功能日志动态修改为例。进入目标应用的开关列表页面。在开关列表页面搜索到 SYSTEM_LOG_CONFIG 开关,即日志级别开关。
推送值格式:Key 为 LoggerName,Value 为日志级别。如需修改全局日志级别,LoggerName 为 root,如下所示。
{
"root": "ERROR"
}
步骤三:配置效果修改后即可生效,具体效果如下。
相关链接
[1] 使用 SDK 接入
https://help.aliyun.com/document_detail/156225.html
[2] 使用 Spring Boot Starter 接入
https://help.aliyun.com/document_detail/155940.html