阿里面试官:聊一下分布式任务调度有那些解决方案?
作者:黄兆平
来源:http://blog.freshfood.cn/article/39
# 简介
随着系统规模的发展,定时任务数量日益增多,任务也变得越来越复杂,尤其是在分布式环境下,存在多个业务系统,每个业务系统都有定时任务的需求,如果都在自身系统中调度,一方面增加业务系统的复杂度,另一方面也不方便管理,因此需要有一个任务平台对分散的任务进行统一管理调度,基于目前的情况,任务平台需要支持以下几个方面:
任务统一管理,提供图形化界面对任务进行配置和调度。
任务并发控制,同一个任务在同一时间只能允许一个执行。
任务弹性扩容,可根据繁忙情况动态增减服务器分摊压力,对大任务进行分片处理。
任务依赖问题,能够处理任务包含子任务的情况,前一个完成后触发子任务执行。
支持多类型的任务,支持Spring Bean、Shell等。
任务节点高可用,任务节点异常或者繁忙时能够转移到其他节点执行。
调度中心高可用,支持集群部署,避免出现单点故障。
执行状态监控,方便查看任务执行状态,异常情况告警,支持多渠道通知。
# 发展史
定时任务随着技术发展,从单线程调度到多线程调度,从单机部署到集群部署,从独立执行到多任务协同执行。
第一阶段
单线程调度,在Java1.5之前,基于线程的等待(sleep或wait)机制定时执行,需要开发者实现调度逻辑,单个线程(Thread)处理单个任务有些浪费,但是一个线程(Timer)处理多个任务容易因为某个任务繁忙导致其他任务阻塞。
第二阶段
线程池调度,在Java1.5开始提供ScheduledExecutorService调度线程池,调度线程池支持固定的延时和固定间隔模式,对于需要在某天或者某月的时间点执行就不大方便,需要计算时间间隔,转换成启动延时和固定间隔,处理起来比较麻烦。
第三阶段
Spring任务调度,Spring简化了任务调度,通过@Scheduled注解支持将某个Bean的方法定时执行,除了支持固定延时和固定间隔模式外,还支持cron表达式,使得定时任务的开发变得极其简单。
第四阶段
Quartz任务调度,在任务服务集群部署下,Quartz通过数据库锁,实现任务的调度并发控制,避免同一个任务同时执行的情况。Quartz通过Scheduler提供了任务调度API,开发可以基于此开发自己的任务调度管理平台。
第五阶段
分布式任务平台,提供一个统一的平台,无需再去做和调度相关的开发,业务系统只需要实现具体的任务逻辑,自动注册到任务调度平台,在上面进行相关的配置就完成了定时任务的开发。
# 解决方案
现在分布式下任务调度有很多解决方案,可以基于Quartz开发任务管理平台,也可以使用开源的任务调度平台,比如xxl-job,elastic-job。
XXL-JOB
大众点评员工徐雪里于2015年发布的分布式任务调度平台,是一个轻量级分布式任务调度框架,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。官方地址:https://www.xuxueli.com/xxl-job/
ELASTIC-JOB
当当开发的弹性分布式任务调度系统,功能丰富强大,采用zookeeper实现分布式协调,实现任务高可用以及分片,并且可以支持云开发,由两个相互独立的子项目Elastic-Job-Lite和Elastic-Job-Cloud组成。
官方地址:http://elasticjob.io/docs/elastic-job-lite/00-overview/
方案对比
# 集成示例
下面以集成xxl-job为例,xxl-job将定时任务分为两个部分:1、调度中心;2、执行器。因此集成xxl-job需要分成两个步骤,1、部署调度中心,2、业务系统对接(执行器)。
架构图如下:
部署调度中心
部署前先确定部署方案,测试环境可以使用1个调度中心 + 1个mysql服务,生产环境建议使用2个调度中心 + mysql主从服务,保证高可用。部署前需确保已经准备:Jdk1.8,Maven、mysql,部署步骤如下:
下载xxl-job源码:http://gitee.com/xuxueli0323/xxl-job/,使用maven编译打包,生成部署的xxl-job-admin.jar。
创建数据库,并初始化相关的表,脚本参考源码目录doc/db/tables_xxl_job.sql
创建部署目录,并配置数据库等配置,可在打包之前,在源码里面application.properties进行配置,也可以在部署目录里面单独创建application.properties文件里面进行配置(推荐,spring boot优先加载启动目录下的配置,可以避免以后更改数据库等配置时还需要重新打包源码)
运行管理平台(请先确保已经配置好Java执行环境,Jdk1.8或者以上)
具体步骤参考许雪里博客:https://www.cnblogs.com/xuxueli/p/5021979.html,部署可参考以下脚本:
#下载源码
cd /root/
wget https://github.com/xuxueli/xxl-job/archive/v2.0.1.zip
unzip v2.0.1.zip
mv xxl-job-2.0.1 xxl-job
#修改配置文件
vim /root/xxl-job/xxl-job-admin/src/main/resources/application.properties
## 修改mysql、邮件等配置
#编译
cd /root/xxl-job
mvn clean package
# 创建部署目录
mkdir -p /xxl-job
cd /root/xxl-job/xxl-job-admin/target/
cp /root/xxl-job/xxl-job-admin/target/xxl-job-admin-2.0.1.jar /xxl-job/xxl-job-admin-2.0.1.jar
#mysql 数据初始化(用户名和密码为root,数据库编码推荐使用utf8mb4)
mysql -u root -proot -e "source /root/xxl-job/doc/db/tables_xxl_job.sql;"
#启动
nohup java -jar /xxl-job/xxl-job-admin-2.0.1.jar > /dev/null >& 1 &
#检查 admin 123456
curl http://localhost:8080/xxl-job-admin
调度中心启动成功登录后如下,默认用户名admin,默认密码123456,密码可在配置文件中更改。
业务系统对接
业务系统对接调度中心,需要根据当前项目的框架进行配置,可以参考源码xxl-job-executor-samples下例子,下面以业务系统基于spring boot框架进行集成。
1.配置执行器
@Configuration
public class XxlJobConfig {
@Value("${spring.application.name:}")
private String springAppName;
@Value("${xxl.job.admin.addresses}")
private String adminAddresses;
@Value("${xxl.job.executor.appname:}")
private String appName;
@Value("${xxl.job.executor.ip:}")
private String ip;
@Value("${xxl.job.executor.port:9999}")
private int port;
@Value("${xxl.job.accessToken:}")
private String accessToken;
@Value("${xxl.job.executor.logpath:job-logs}")
private String logPath;
@Value("${xxl.job.executor.logretentiondays:7}")
private int logRetentionDays;
@Bean
public XxlJobSpringExecutor xxlJobExecutor() {
XxlJobSpringExecutor xxlJobSpringExecutor = new XxlJobSpringExecutor();
xxlJobSpringExecutor.setAdminAddresses(adminAddresses);
if (StringUtils.isEmpty(appName)) {
if (StringUtils.isEmpty(springAppName)) {
throw new IllegalStateException("missing xxl-job appname config");
}
appName = springAppName;
}
xxlJobSpringExecutor.setAppName(appName);
xxlJobSpringExecutor.setIp(ip);
xxlJobSpringExecutor.setPort(port);
xxlJobSpringExecutor.setAccessToken(accessToken);
xxlJobSpringExecutor.setLogPath(logPath);
xxlJobSpringExecutor.setLogRetentionDays(logRetentionDays);
return xxlJobSpringExecutor;
}
}
简化配置说明:
1、spring boot应用基本都有appname,默认使用spring app name配置。
2、ip地址在多网卡、容器的时候需要指定,否则的话,使用默认就可以,spring-cloud-commons中提供了InetUtils工具类,可以帮助获取IP
3、port可以默认指定一个,如果多个服务部署在同一台服务器上,可以通过检测获取或者规划分配。
4、logpath最好指定在应用目录下,最好不要使用绝对路径,避免和其应用冲突。
5、logretentiondays日志保留天数不用太大,根据需要设置,默认给一个较短的时间即可。
2.开发定时任务
定义定时任务有两种方式:1、2.1.2或者之后版本可以直接在方法上加@XxlJob来声明任务;2、2.1.2之前版本每个任务需要单独开发一个Bean,实现IJobHandler接口,并且在类上加@JobHandler注解。第二种方式较麻烦,推荐使用第一种方式(目前还没稳定版)。
基于@XxlJob注解代码方式(建议制定名称,和调度中心配置保持一致)
@Component
public class SampleXxlJob {
private static Logger logger = LoggerFactory.getLogger(SampleXxlJob.class);
/**
* 1、简单任务示例(Bean模式)
*/
@XxlJob("demoJobHandler")
public ReturnT<String> demoJobHandler(String param) throws Exception {
XxlJobLogger.log("XXL-JOB, Hello World.");
for (int i = 0; i < 5; i++) {
XxlJobLogger.log("beat at:" + i);
TimeUnit.SECONDS.sleep(2);
}
return ReturnT.SUCCESS;
}
/**
* 2、分片广播任务
*/
@XxlJob("shardingJobHandler")
public ReturnT<String> shardingJobHandler(String param) throws Exception {
// 分片参数
ShardingUtil.ShardingVO shardingVO = ShardingUtil.getShardingVo();
XxlJobLogger.log("分片参数:当前分片序号 = {}, 总分片数 = {}", shardingVO.getIndex(), shardingVO.getTotal());
// 业务逻辑
for (int i = 0; i < shardingVO.getTotal(); i++) {
if (i == shardingVO.getIndex()) {
XxlJobLogger.log("第 {} 片, 命中分片开始处理", i);
} else {
XxlJobLogger.log("第 {} 片, 忽略", i);
}
}
return ReturnT.SUCCESS;
}
}
基于@JobHandler代码方式
@JobHandler(value="demoJobHandler")
@Component
public class DemoJobHandler extends IJobHandler {
@Override
public ReturnT<String> execute(String param) throws Exception {
XxlJobLogger.log("XXL-JOB, Hello World.");
for (int i = 0; i < 5; i++) {
XxlJobLogger.log("beat at:" + i);
TimeUnit.SECONDS.sleep(2);
}
return SUCCESS;
}
}
配置定时任务
1、配置定时任务,需要先配置执行器,推荐使用自动注册方式,避免集群部署时还需要调整机器地址,添加界面如下(注意appname要和业务系统中配置一致):
2、添加完执行器后,添加任务,JobHandler要和代码中配置的名称一致,执行器集群部署可以通过配置路由方式来控制执行,xxl-job调度只支持cron表达式。
3、启动或者执行任务,查询执行日志、注册节点等
集成踩坑记录
任务服务器必须做时钟同步,执行器时钟不能调度中心180秒,否则将会导致调度失败(RPC框架限制)
调度任务的时间间隔低于实际执行耗时,导致产生较大的调度日志;
尽量避免短任务,比如秒级的任务会导致大量数据库锁影响性能;
调度日志量偏大导致查询慢,由于日志都记录在数据库,需要定时清理;
自动注册时服务器多网卡导致调度失败,注册时需指定网卡IP;
字节跳动面试官:请你实现一个大文件上传和断点续传,说说思路即可。
觉得不错,请给个「在看」
分享给你的朋友!