查看原文
其他

你的代码凌晨两点在干什么

脚本之家 2023-12-27

The following article is from 古时的风筝 Author 风筝

 脚本之家 设为“星标
第一时间收到文章更新

文 | 风筝

来源 | 古时的风筝(ID:gushidefengzheng)
如若转载请联系原公众号

前两天跟朋友讨论技术,他说他们的服务器从凌晨零点开始,就开始跑各种各样的定时任务,基本上能跑到早晨5、6点钟。因为他们的业务属于访问量不大,但是数据量非常大,而且每天的数据要根据一些规则重新计算,所以就每天这么跑着。一到夜里,服务器负载比白天还高。

如果服务器上有灯光根据负载高低进行闪烁,那到了夜里,一定会看到他们的服务器唰唰的闪着金光。

说到这儿,我想到了之前的一件事儿。

有一天上午到公司不久,运维的同事悠悠的走过来,苦笑着说:“你们的代码凌晨两点在干什么,服务器都差点搞挂了”。

原来是因为一个定时任务(也是计算型的任务)开的线程太多了,之前由于计算量比较少,很快就结束了。那天由于业务调整,数据量一下子大了很多,线程又开的过多了,导致长时间负载过高,直接就给运维发了预警通知了。应用服务器还好,数据库服务器差点没顶住。

由于这些数据计算的时间长一点、短一点都没关系,所以后来把线程数减少了一些。

代码在凌晨到底在干什么

有一些场景是可以把定时任务放到凌晨来执行的。

夜里有一个特点,大多数的应用在夜里的流量都会比较低,也就是服务器的资源比较空闲,这个时候,正好可以将资源利用起来,执行一些逻辑。

而执行的这些逻辑有一个核心特点,那就是可以放到晚上执行,实时性要求不是很高的业务可以。

报表类统计

这个功能很常见了,不管是电商应用、社交应用等等,凡事有用户用的系统,将来一定会涉及到报表的场景。报表一般都包括对数据的总览,要出一张报表,可能会涉及到多张表,甚至多个数据库,关联的数据更是百万、千万,甚至上亿条。

那这样一来呢,如果是放在后台,用户到界面上进行实时生成的话,不仅老板不满意,测试同事还会给你提bug,说你的接口太慢了。

对于报表来说,看前一天的数据就足够了,没必要看到今天的数据, 所以放在夜里跑任务完全没问题,这时候你一条 SQL 执行1分钟、2分钟也没关系,只要不是太离谱就可以了。

数据清洗和计算

就像我那个朋友公司一样,他们的业务会涉及到大量的数据处理的工作,包括前期的数据处理,以及每天的重新计算,而且数据量很大。

这些清洗和计算也没有那么高的实时性,只要在当天跑完就可以了。但是如果你放到白天运行,就会影响到线上业务。要不然就得多弄几台单独的服务器跑,这样成本就上来了。

所以这样的场景,也可以放到夜里跑。

数据备份和同步

数据库备份、文件备份以及数据同步等任务可以在凌晨执行,这就很常识了。

补偿任务

有些业务,可能在正常运行的时候发生了异常,当然不能是主业务。一些旁路任务发生了异常,这时候,系统一般会写一条日志,记录异常发生的上下文,越详细越好,用于事后分析以及补偿操作。

等到夜里的时候,检查这种异常业务,根据异常发生时记录的上下文信息,进行二次处理。当然不能是发短信、发通知这种功能了,如果夜里给用户发短信,免不了要被投诉。

总结

几乎每一个系统都会有夜里执行的任务,这些任务的特点:

  1. 可以异步处理,不要求高的实时性,比如报表业务;
  2. 比较耗资源,比如大量计算、大容量的文件处理等;
  3. 要执行任务的服务器在夜里不能有太多正常线上业务,保证正常业务不被影响;

你们的代码在凌晨两点在干什么呢?

  推荐阅读:
  1. 全球 43 亿 IPv4 地址耗尽的四年后,亚马逊:明年收费,我提前说一下!
  2. 计算机的编年史,史上最全!
  3. 苹果华为发布会定同一天,科技春晚 5G vs Type-C
  4. Python之父加入3年,微软终于对Python下手:直接放进Excel!
  5. 为什么很多程序员讨厌低代码?

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存