当前位置：首页 > news >正文

深圳定制建站网站建设提高网站排名软件

news 2025/12/27 15:23:51

深圳定制建站网站建设,提高网站排名软件,seo营销的策略有哪些,广州效果图制作公司今天来扒一扒轻量级的分布式任务调度平台Xxl-Job背后的架构原理核心概念这里还是老样子#xff0c;为了保证文章的完整性和连贯性#xff0c;方便那些没有使用过的小伙伴更加容易接受文章的内容#xff0c;快速讲一讲Xxl-Job中的概念和使用如果你已经使用过了#xf…今天来扒一扒轻量级的分布式任务调度平台Xxl-Job背后的架构原理核心概念这里还是老样子为了保证文章的完整性和连贯性方便那些没有使用过的小伙伴更加容易接受文章的内容快速讲一讲Xxl-Job中的概念和使用如果你已经使用过了可直接跳过本节和下一节快进到后面原理部分讲解 1、调度中心调度中心是一个单独的Web服务主要是用来触发定时任务的执行它提供了一些页面操作我们可以很方便地去管理这些定时任务的触发逻辑调度中心依赖数据库所以数据都是存在数据库中的调度中心也支持集群模式但是它们所依赖的数据库必须是同一个所以同一个集群中的调度中心实例之间是没有任何通信的数据都是通过数据库共享的 2、执行器执行器是用来执行具体的任务逻辑的执行器你可以理解为就是平时开发的服务一个服务实例对应一个执行器实例每个执行器有自己的名字为了方便你可以将执行器的名字设置成服务名 3、任务任务什么意思就不用多说了一个执行器中也是可以有多个任务的总的来说调用中心是用来控制定时任务的触发逻辑而执行器是具体执行任务的这是一种任务和触发逻辑分离的设计思想这种方式的好处就是使任务更加灵活可以随时被调用还可以被不同的调度规则触发。来个Demo 1、搭建调度中心调度中心搭建很简单先下载源码 https://github.com/xuxueli/xxl-job.git 然后改一下数据库连接信息执行一下在项目源码中的/doc/db下的sql文件启动可以打成一个jar包或者本地启动就是可以的启动完成之后访问下面这个地址就可以访问到控制台页面了 http://localhost:8080/xxl-job-admin/toLogin 用户名密码默认是 admin/123456 2、执行器和任务添加添加一个名为sanyou-xxljob-demo执行器任务添加执行器选择我们刚刚添加的指定任务名称为TestJobcorn表达式的意思是每秒执行一次创建完之后需要启动一下任务默认是关闭状态也就不会执行创建执行器和任务其实就是CRUD并没有复杂的业务逻辑按照如上配置的整个Demo的意思就是每隔1s执行一次sanyou-xxljob-demo这个执行器中的TestJob任务 3、创建执行器和任务引入依赖 dependenciesdependencygroupIdorg.springframework.boot/groupIdartifactIdspring-boot-starter-web/artifactIdversion2.2.5.RELEASE/version/dependencydependencygroupIdcom.xuxueli/groupIdartifactIdxxl-job-core/artifactIdversion2.4.0/version/dependency /dependencies配置XxlJobSpringExecutor这个Bean Configuration public class XxlJobConfiguration {Beanpublic XxlJobSpringExecutor xxlJobExecutor() {XxlJobSpringExecutor xxlJobSpringExecutor new XxlJobSpringExecutor();//设置调用中心的连接地址xxlJobSpringExecutor.setAdminAddresses(http://localhost:8080/xxl-job-admin);//设置执行器的名称xxlJobSpringExecutor.setAppname(sanyou-xxljob-demo);//设置一个端口后面会讲作用xxlJobSpringExecutor.setPort(9999);//这个token是保证访问安全的默认是这个当然可以自定义// 但需要保证调度中心配置的xxl.job.accessToken属性跟这个token是一样的xxlJobSpringExecutor.setAccessToken(default_token);//任务执行日志存放的目录xxlJobSpringExecutor.setLogPath(./);return xxlJobSpringExecutor;}}XxlJobSpringExecutor这个类的作用后面会着重讲通过XxlJob指定一个名为TestJob的任务这个任务名需要跟前面页面配置的对应上 Component public class TestJob {private static final Logger logger LoggerFactory.getLogger(TestJob.class);XxlJob(TestJob)public void testJob() {logger.info(TestJob任务执行了。。。);}}所以如果顺利的话每隔1s钟就会打印一句TestJob任务执行了。。。启动项目注意修改一下端口因为调用中心默认也是8080本地起会端口冲突最终执行结果如下符合预期讲完概念和使用部分接下来就来好好讲一讲Xxl-Job核心的实现原理从执行器启动说起前面Demo中使用到了一个很重要的一个类 XxlJobSpringExecutor 这个类就是整个执行器启动的入口这个类实现了SmartInitializingSingleton接口所以经过Bean的生命周期一定会调用afterSingletonsInstantiated这个方法的实现这个方法干了很多初始化的事这里我挑三个重要的讲其余的等到具体的功能的时候再提 1、初始化JobHandler JobHandler是个什么所谓的JobHandler其实就是一个定时任务的封装一个定时任务会对应一个JobHandler对象当执行器执行任务的时候就会调用JobHandler的execute方法 JobHandler有三种实现 MethodJobHandler GlueJobHandler ScriptJobHandler MethodJobHandler是通过反射来调用方法执行任务所以MethodJobHandler的任务的实现就是一个方法刚好我们demo中的例子任务其实就是一个方法所以Demo中的任务最终被封装成一个MethodJobHandler GlueJobHandler比较有意思它支持动态修改任务执行的代码当你在创建任务的时候需要指定运行模式为GLUE(Java) 之后需要在操作按钮点击GLUE IDE编写Java代码代码必须得实现IJobHandler接口之后任务执行的时候就会执行execute方法的实现如果你需要修改任务的逻辑只需要重新编辑即可不需要重启服务 ScriptJobHandler通过名字也可以看出是专门处理一些脚本的运行模式除了BEAN和GLUE(Java)之外其余都是脚本模式而本节的主旨所谓的初始化JobHandler就是指执行器启动的时候会去Spring容器中找到加了XxlJob注解的Bean 解析注解然后封装成一个MethodJobHandler对象最终存到XxlJobSpringExecutor成员变量的一个本地的Map缓存中缓存key就是任务的名字至于GlueJobHandler和ScriptJobHandler都是任务触发时才会创建除了上面这几种你也自己实现JobHandler手动注册到JobHandler的缓存中也是可以通过调度中心触发的 2、创建一个Http服务器除了初始化JobHandler之外执行器还会创建一个Http服务器这个服务器端口号就是通过XxlJobSpringExecutor配置的端口demo中就是设置的是9999底层是基于Netty实现的这个Http服务端会接收来自调度中心的请求当执行器接收到调度中心的请求时会把请求交给ExecutorBizImpl来处理这个类非常重要所有调度中心的请求都是这里处理的 ExecutorBizImpl实现了ExecutorBiz接口当你翻源码的时候会发现ExecutorBiz还有一个ExecutorBizClient实现 ExecutorBizClient的实现就是发送http请求所以这个实现类是在调度中心使用的用来访问执行器提供的http接口 3、注册到调度中心当执行器启动的时候会启动一个注册线程这个线程会往调度中心注册当前执行器的信息包括两部分数据执行器的名字也就是设置的appname 执行器所在机器的ip和端口这样调度中心就可以访问到这个执行器提供的Http接口前面提到每个服务实例都会对应一个执行器实例所以调用中心会保存每个执行器实例的地址这里你可以把调度中心的功能类比成注册中心任务触发原理弄明白执行器启动时干了哪些事接下来讲一讲Xxl-Job最最核心的功能那就是任务触发的原理任务触发原理我会分下面5个小点来讲解任务如何触发快慢线程池的异步触发任务优化如何选择执行器实例执行器如何去执行任务任务执行结果的回调 1、任务如何触发调度中心在启动的时候会开启一个线程这个线程的作用就是来计算任务触发时机这里我把这个线程称为调度线程这个调度线程会去查询xxl_job_info这张表这张表存了任务的一些基本信息和任务下一次执行的时间调度线程会去查询下一次执行的时间当前时间 5s的任务这个5s是XxlJob写死的被称为预读时间提前读出来保证任务能准时触发举个例子假设当前时间是2023-11-29 08:00:10这里的查询就会查出下一次任务执行时间在2023-11-29 08:00:15之前执行的任务查询到任务之后调度线程会去将这些任务根据执行时间划分为三个部分当前时间已经超过任务下一次执行时间5s以上也就是需要在2023-11-29 08:00:05不包括05s之前的执行的任务当前时间已经超过任务下一次执行时间但是但不足5s也就是在2023-11-29 08:00:05和2023-11-29 08:00:10不包括10s之间执行的任务还未到触发时间但是一定是5s内就会触发执行的对于第一部分的已经超过5s以上时间的任务会根据任务配置的调度过期策略来选择要不要执行调度过期策略就两种就是字面意思直接忽略这个已经过期的任务立马执行一次这个过期的任务对于第二部分的超时时间在5s以内的任务就直接立马执行一次之后如果判断任务下一次执行时间就在5s内会直接放到一个时间轮里面等待下一次触发执行对于第三部分任务由于还没到执行时间所以不会立马执行也是直接放到时间轮里面等待触发执行当这批任务处理完成之后不论是前面是什么情况调度线程都会去重新计算每个任务的下一次触发时间然后更新xxl_job_info这张表的下一次执行时间到此一次调度的计算就算完成了之后调度线程还会继续重复上面的步骤查任务调度任务更新任务下次执行时间一直死循环下去这就实现了任务到了执行时间就会触发的功能这里在任务触发的时候还有一个很有意思的细节由于调度中心可以是集群的形式每个调度中心实例都有调度线程那么如何保证任务在同一时间只会被其中的一个调度中心触发一次我猜你第一时间肯定想到分布式锁但是怎么加呢 XxlJob实现就比较有意思了它是基于八股文中常说的通过数据库来实现的分布式锁的在调度之前调度线程会尝试执行下面这句sql 就是这个sql select * from xxl_job_lock where lock_name schedule_lock for update 一旦执行成功说明当前调度中心成功抢到了锁接下来就可以执行调度任务了当调度任务执行完之后再去关闭连接从而释放锁由于每次执行之前都需要去获取锁这样就保证在调度中心集群中同时只有一个调度中心执行调度任务最后画一张图来总结一下这一小节 2、快慢线程池的异步触发任务优化当任务达到了触发条件并不是由调度线程直接去触发执行器的任务执行调度线程会将这个触发的任务交给线程池去执行所以上图中的最后一部分触发任务执行其实是线程池异步去执行的那么为什么要使用线程池异步呢主要是因为触发任务需要通过Http接口调用具体的执行器实例去触发任务这一过程必然会耗费时间如果调度线程去做就会耽误调度的效率所以就通过异步线程去做调度线程只负责判断任务是否需要执行并且Xxl-Job为了进一步优化任务的触发将这个触发任务执行的线程池划分成快线程池和慢线程池两个线程池在调用执行器的Http接口触发任务执行的时候Xxl-Job会去记录每个任务的触发所耗费的时间注意并不是任务执行时间只是整个Http请求耗时时间这是因为执行器执行任务是异步执行的所以整个时间不包括任务执行时间这个后面会详细说当任务一次触发的时间超过500ms那么这个任务的慢次数就会加1 如果这个任务一分钟内触发的慢次数超过10次接下来就会将触发任务交给慢线程池去执行所以快慢线程池就是避免那种频繁触发并且每次触发时间还很长的任务阻塞其它任务的触发的情况发生 3、如何选择执行器实例上一节说到当任务需要触发的时候调度中心会向执行器发送Http请求执行器去执行具体的任务那么问题来了由于一个执行器会有很多实例那么应该向哪个实例请求这其实就跟任务配置时设置的路由策略有关了从图上可以看出xxljob支持多种路由策略除了分片广播其余的具体的算法实现都是通过ExecutorRouter的实现类来实现的这里简单讲一讲各种算法的原理有兴趣的小伙伴可以去看看内部的实现细节第一个、最后一个、轮询、随机都很简单没什么好说的一致性Hash讲起来比较复杂你可以先看看这篇文章再去查看Xxl-Job的代码实现 https://zhuanlan.zhihu.com/p/470368641 最不经常使用LFULeast Frequently UsedXxl-Job内部会有一个缓存统计每个任务每个地址的使用次数每次都选择使用次数最少的地址这个缓存每隔24小时重置一次最近最久未使用LRULeast Recently Used将地址存到LinkedHashMap中它利用LinkedHashMap可以根据元素访问get/put顺序来给元素排序的特性快速找到最近最久未使用未访问的节点故障转移调度中心都会去请求每个执行器只要能接收到响应说明执行器正常那么任务就会交给这个执行器去执行忙碌转移调度中心也会去请求每个执行器判断执行器是不是正在执行当前需要执行的任务任务执行时间过长导致上一次任务还没执行完下一次又触发了如果在执行说明忙碌不能用否则就可以用分片广播XxlJob给每个执行器分配一个编号从0开始递增然后向所有执行器触发任务告诉每个执行器自己的编号和总共执行器的数据我们可以通过XxlJobHelper#getShardIndex获取到编号XxlJobHelper#getShardTotal获取到执行器的总数据量分片广播就是将任务量分散到各个执行器每个执行器只执行一部分任务加快任务的处理举个例子比如你现在需要处理30w条数据有3个执行器此时使用分片广播那么此时可将任务分成3分每份10w条数据执行器根据自己的编号选择对应的那份10w数据处理当选择好了具体的执行器实例之后调用中心就会携带一些触发的参数发送Http请求触发任务 4、执行器如何去执行任务相信你一定记得我前面在说执行器启动是会创建一个Http服务器的时候提到这么一句当执行器接收到调度中心的请求时会把请求交给ExecutorBizImpl来处理所以前面提到的故障转移和忙碌转移请求执行器进行判断最终执行器也是交给ExecutorBizImpl处理的执行器处理触发请求是这个ExecutorBizImpl的run方法实现的当执行器接收到请求在正常情况下执行器会去为这个任务创建一个单独的线程这个线程被称为JobThread 每个任务在触发的时候都有单独的线程去执行保证不同的任务执行互不影响之后任务并不是直接交给线程处理的而是直接放到一个内存队列中线程直接从队列中获取任务这里我相信你一定有个疑惑为什么不直接处理而是交给队列从队列中获取任务呢那就得讲讲不正常的情况了如果调度中心选择的执行器实例正在处理定时任务那么此时该怎么处理呢** 这时就跟阻塞处理策略有关了阻塞处理策略总共有三种单机串行丢弃后续调度覆盖之前调度单机串行的实现就是将任务放到队列中由于队列是先进先出的所以就实现串行这也是为什么放在队列的原因丢弃调度的实现就是执行器什么事都不用干就可以了自然而然任务就丢了覆盖之前调度的实现就很暴力了他是直接重新创建一个JobThread来执行任务并且尝试打断之前的正在处理任务的JobThread丢弃之前队列中的任务打断是通过Thread#interrupt方法实现的所以正在处理的任务还是有可能继续运行并不是说一打断正在运行的任务就终止了这里需要注意的一点就是阻塞处理策略是对于单个执行器上的任务来生效的不同执行器实例上的同一个任务是互不影响的比如说有一个任务有两个执行器A和B路由策略是轮询任务第一次触发的时候选择了执行器实例A由于任务执行时间长任务第二次触发的时候执行器的路由到了B此时A的任务还在执行但是B感知不到A的任务在执行所以此时B就直接执行了任务所以此时你配置的什么阻塞处理策略就没什么用了如果业务中需要保证定时任务同一时间只有一个能运行需要把任务路由到同一个执行器上比如路由策略就选择第一个 5、任务执行结果的回调当任务处理完成之后执行器会将任务执行的结果发送给调度中心如上图所示这整个过程也是异步化的 JobThread会将任务执行的结果发送到一个内存队列中执行器启动的时候会开启一个处发送任务执行结果的线程TriggerCallbackThread 这个线程会不停地从队列中获取所有的执行结果将执行结果批量发送给调度中心调用中心接收到请求时会根据执行的结果修改这次任务的执行状态和进行一些后续的事比如失败了是否需要重试是否有子任务需要触发等等到此一次任务的就算真正处理完成了最后最后我从官网捞了一张Xxl-Job架构图奈何作者不更新呐导致这个图稍微有点老了有点跟现有的架构对不上比如说图中的自研RPCxxl-rpc部分已经替换成了Http协议这主要是拥抱生态方便跨语言接入但是不要紧大体还是符合现在的整个的架构从架构图中也可以看出来本文除了日志部分的内容没有提到其它的整个核心逻辑基本上都讲到了而日志部分其实是个辅助的作用让你更方便查看任务的运行情况对任务的触发逻辑是没有影响的所以就没讲了所以从本文的讲解再到官方架构图你会发现整个Xxl-Job不论是使用还是实现都是比较简单的非常的轻量级

查看全文

http://wiki.neutronadmin.com/news/75174/