陈晨辰 · 2020年01月21日

分布式任务调度的解决方案

简介

 随着系统规模的发展,定时任务数量日益增多,任务也变得越来越复杂,尤其是在分布式环境下,存在多个业务系统,每个业务系统都有定时任务的需求,如果都在自身系统中调度,一方面增加业务系统的复杂度,另一方面也不方便管理,因此需要有一个任务平台对分散的任务进行统一管理调度,基于目前的情况,任务平台需要支持以下几个方面:

1、任务统一管理,提供图形化界面对任务进行配置和调度。
2、任务并发控制,同一个任务在同一时间只能允许一个执行。
3、任务弹性扩容,可根据繁忙情况动态增减服务器分摊压力,对大任务进行分片处理。
4、任务依赖问题,能够处理任务包含子任务的情况,前一个完成后触发子任务执行。
5、支持多类型的任务,支持Spring Bean、Shell等。
6、任务节点高可用,任务节点异常或者繁忙时能够转移到其他节点执行。
7、调度中心高可用,支持集群部署,避免出现单点故障。
8、执行状态监控,方便查看任务执行状态,异常情况告警,支持多渠道通知。

发展史

定时任务随着技术发展,从单线程调度到多线程调度,从单机部署到集群部署,从独立执行到多任务协同执行。

file

第一阶段

单线程调度,在Java1.5之前,基于线程的等待(sleep或wait)机制定时执行,需要开发者实现调度逻辑,单个线程(Thread)处理单个任务有些浪费,但是一个线程(Timer)处理多个任务容易因为某个任务繁忙导致其他任务阻塞。

第二阶段

线程池调度,在Java1.5开始提供ScheduledExecutorService调度线程池,调度线程池支持固定的延时和固定间隔模式,对于需要在某天或者某月的时间点执行就不大方便,需要计算时间间隔,转换成启动延时和固定间隔,处理起来比较麻烦。

第三阶段

Spring任务调度,Spring简化了任务调度,通过@Scheduled注解支持将某个Bean的方法定时执行,除了支持固定延时和固定间隔模式外,还支持cron表达式,使得定时任务的开发变得极其简单。

第四阶段

Quartz任务调度,在任务服务集群部署下,Quartz通过数据库锁,实现任务的调度并发控制,避免同一个任务同时执行的情况。Quartz通过Scheduler提供了任务调度API,开发可以基于此开发自己的任务调度管理平台。

第五阶段

分布式任务平台,提供一个统一的平台,无需再去做和调度相关的开发,业务系统只需要实现具体的任务逻辑,自动注册到任务调度平台,在上面进行相关的配置就完成了定时任务的开发。

解决方案

现在分布式下任务调度有很多解决方案,可以基于Quartz开发任务管理平台,也可以使用开源的任务调度平台,比如xxl-job,elastic-job。

XXL-JOB

大众点评员工徐雪里于2015年发布的分布式任务调度平台,是一个轻量级分布式任务调度框架,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。官方地址:https://www.xuxueli.com/xxl-job/

file

ELASTIC-JOB

当当开发的弹性分布式任务调度系统,功能丰富强大,采用zookeeper实现分布式协调,实现任务高可用以及分片,并且可以支持云开发,由两个相互独立的子项目Elastic-Job-Lite和Elastic-Job-Cloud组成。官方地址:http://elasticjob.io/docs/elastic-job-lite/00-overview/

file

方案对比
file

集成示例

下面以集成xxl-job为例,xxl-job将定时任务分为两个部分:1、调度中心;2、执行器。因此集成xxl-job需要分成两个步骤,1、部署调度中心,2、业务系统对接(执行器)。架构图如下:

file

部署调度中心

部署前先确定部署方案,测试环境可以使用1个调度中心 + 1个mysql服务,生产环境建议使用2个调度中心 + mysql主从服务,保证高可用。部署前需确保已经准备:Jdk1.8,Maven、mysql,部署步骤如下:

下载xxl-job源码:http://gitee.com/xuxueli0323/...,使用maven编译打包,生成部署的xxl-job-admin.jar。

创建数据库,并初始化相关的表,脚本参考源码目录doc/db/tables_xxl_job.sql

创建部署目录,并配置数据库等配置,可在打包之前,在源码里面application.properties进行配置,也可以在部署目录里面单独创建application.properties文件里面进行配置(推荐,spring boot优先加载启动目录下的配置,可以避免以后更改数据库等配置时还需要重新打包源码)。

运行管理平台(请先确保已经配置好Java执行环境,Jdk1.8或者以上)

具体步骤参考许雪里博客:https://www.cnblogs.com/xuxue...,部署可参考以下脚本:

#下载源码
cd /root/
wget https://github.com/xuxueli/xxl-job/archive/v2.0.1.zip
unzip v2.0.1.zip
mv xxl-job-2.0.1 xxl-job

#修改配置文件
vim /root/xxl-job/xxl-job-admin/src/main/resources/application.properties
## 修改mysql、邮件等配置

#编译
cd /root/xxl-job
mvn clean package

# 创建部署目录
mkdir -p /xxl-job
cd /root/xxl-job/xxl-job-admin/target/
cp /root/xxl-job/xxl-job-admin/target/xxl-job-admin-2.0.1.jar /xxl-job/xxl-job-admin-2.0.1.jar


#mysql 数据初始化(用户名和密码为root,数据库编码推荐使用utf8mb4)
mysql -u root -proot -e "source /root/xxl-job/doc/db/tables_xxl_job.sql;"

#启动
nohup java -jar /xxl-job/xxl-job-admin-2.0.1.jar > /dev/null >& 1 &

#检查 admin 123456
curl http://localhost:8080/xxl-job-admin

调度中心启动成功登录后如下,默认用户名admin,默认密码123456,密码可在配置文件中更改。

业务系统对接

业务系统对接调度中心,需要根据当前项目的框架进行配置,可以参考源码xxl-job-executor-samples下例子,下面以业务系统基于spring boot框架进行集成。

配置执行器

@Configuration
public class XxlJobConfig {
    @Value("${spring.application.name:}")
    private String springAppName;

    @Value("${xxl.job.admin.addresses}")
    private String adminAddresses;

    @Value("${xxl.job.executor.appname:}")
    private String appName;

    @Value("${xxl.job.executor.ip:}")
    private String ip;

    @Value("${xxl.job.executor.port:9999}")
    private int port;

    @Value("${xxl.job.accessToken:}")
    private String accessToken;

    @Value("${xxl.job.executor.logpath:job-logs}")
    private String logPath;

    @Value("${xxl.job.executor.logretentiondays:7}")
    private int logRetentionDays;

    @Bean
    public XxlJobSpringExecutor xxlJobExecutor() {
        XxlJobSpringExecutor xxlJobSpringExecutor = new XxlJobSpringExecutor();
        xxlJobSpringExecutor.setAdminAddresses(adminAddresses);
        if (StringUtils.isEmpty(appName)) {
            if (StringUtils.isEmpty(springAppName)) {
                throw new IllegalStateException("missing xxl-job appname config");
            }
            appName = springAppName;
        }
        xxlJobSpringExecutor.setAppName(appName);
        xxlJobSpringExecutor.setIp(ip);
        xxlJobSpringExecutor.setPort(port);
        xxlJobSpringExecutor.setAccessToken(accessToken);
        xxlJobSpringExecutor.setLogPath(logPath);
        xxlJobSpringExecutor.setLogRetentionDays(logRetentionDays);

        return xxlJobSpringExecutor;
    }
}

简化配置说明:
1、spring boot应用基本都有appname,默认使用spring app name配置。
2、ip地址在多网卡、容器的时候需要指定,否则的话,使用默认就可以,spring-cloud-commons中提供了InetUtils工具类,可以帮助获取IP
3、port可以默认指定一个,如果多个服务部署在同一台服务器上,可以通过检测获取或者规划分配。
4、logpath最好指定在应用目录下,最好不要使用绝对路径,避免和其应用冲突。
5、logretentiondays日志保留天数不用太大,根据需要设置,默认给一个较短的时间即可。

开发定时任务

定义定时任务有两种方式:1、2.1.2或者之后版本可以直接在方法上加@XxlJob来声明任务;2、2.1.2之前版本每个任务需要单独开发一个Bean,实现IJobHandler接口,并且在类上加@JobHandler注解。第二种方式较麻烦,推荐使用第一种方式(目前还没稳定版)。

基于@XxlJob注解代码方式(建议制定名称,和调度中心配置保持一致)

@Component
public class SampleXxlJob {
    private static Logger logger = LoggerFactory.getLogger(SampleXxlJob.class);

    /**
     * 1、简单任务示例(Bean模式)
     */
    @XxlJob("demoJobHandler")
    public ReturnT<String> demoJobHandler(String param) throws Exception {
        XxlJobLogger.log("XXL-JOB, Hello World.");
        for (int i = 0; i < 5; i++) {
            XxlJobLogger.log("beat at:" + i);
            TimeUnit.SECONDS.sleep(2);
        }
        return ReturnT.SUCCESS;
    }

    /**
     * 2、分片广播任务
     */
    @XxlJob("shardingJobHandler")
    public ReturnT<String> shardingJobHandler(String param) throws Exception {
        // 分片参数
        ShardingUtil.ShardingVO shardingVO = ShardingUtil.getShardingVo();
        XxlJobLogger.log("分片参数:当前分片序号 = {}, 总分片数 = {}", shardingVO.getIndex(), shardingVO.getTotal());
        // 业务逻辑
        for (int i = 0; i < shardingVO.getTotal(); i++) {
            if (i == shardingVO.getIndex()) {
                XxlJobLogger.log("第 {} 片, 命中分片开始处理", i);
            } else {
                XxlJobLogger.log("第 {} 片, 忽略", i);
            }
        }
        return ReturnT.SUCCESS;
    }
}
基于@JobHandler代码方式

@JobHandler(value="demoJobHandler")
@Component
public class DemoJobHandler extends IJobHandler {
    @Override
    public ReturnT<String> execute(String param) throws Exception {
        XxlJobLogger.log("XXL-JOB, Hello World.");
        for (int i = 0; i < 5; i++) {
            XxlJobLogger.log("beat at:" + i);
            TimeUnit.SECONDS.sleep(2);
        }
        return SUCCESS;
    }
}

配置定时任务

1、配置定时任务,需要先配置执行器,推荐使用自动注册方式,避免集群部署时还需要调整机器地址,添加界面如下(注意appname要和业务系统中配置一致):
file

2、添加完执行器后,添加任务,JobHandler要和代码中配置的名称一致,执行器集群部署可以通过配置路由方式来控制执行,xxl-job调度只支持cron表达式。
file

3、启动或者执行任务,查询执行日志、注册节点等
file

集成踩坑记录

1、任务服务器必须做时钟同步,执行器时钟不能调度中心180秒,否则将会导致调度失败(RPC框架限制)
2、调度任务的时间间隔低于实际执行耗时,导致产生较大的调度日志;
3、尽量避免短任务,比如秒级的任务会导致大量数据库锁影响性能;
4、调度日志量偏大导致查询慢,由于日志都记录在数据库,需要定时清理;
5、自动注册时服务器多网卡导致调度失败,注册时需指定网卡IP;

参考:
http://blog.freshfood.cn/arti...
https://www.cnblogs.com/xuxue...
https://www.xuxueli.com/page/...

推荐阅读
关注数
2
文章数
95
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息