开源SPL提速银行资金头寸报表20+倍

乾学院 2022-07-30

收录于合集 #SPL案例 25个

看看问题

C银行有个资金**报表很慢，业务人员要等待1分30秒才能看到结果。资金**报表非常重要，访问人员众多，访问频次很高，目前的响应速度严重影响业务。报表表样如下：

解决步骤

首先，要理解业务和计算特征。资金**报表连接数据库取数，定义了6个数据集，分别对应6个SQL。报表设计如下图：

其中：ds1是营业网点，ds2到ds4是资金数据，ds5是当前币种数据。ds2、ds3、ds4的SQL比较类似，是报表的主要数据。ds2做了脱敏之后如下：

SELECT a.I_NO, a.D_DATE, a.ORG_NO, a.CURR , a.I_VAL / ? AS I_VALFROM i_result aWHERE a.d_date = ? AND CASE WHEN ? = 'C' THEN a.CURRENCY = '01' OR a.CURR = 'F' ELSE a.CURR = ? ENDUNIONSELECT a.I_NO, a.D_DATE, '01', a.CURR , SUM(a.I_VAL) / ? AS I_VALFROM i_result aWHERE a.d_date = ? AND CASE WHEN ? = 'C' THEN a.CURR = '01' OR a.CURR = 'F' ELSE a.CURR = ? END AND a.org_no IN ( SELECT org_no FROM org_info WHERE U_NO = '000' AND ORG_NO NOT IN ('001', '002', '003') )GROUP BY a.I_NO, a.D_DATE, a.CURR

报表工具对于多个数据集是顺序计算的，即先后执行ds1到ds5，总时间是5个SQL的执行时间之和。然后再将前4个结果集在报表单元格中进行格间计算，完成关联、分组和汇总。ds5只返回一条记录，相对独立。最后呈现出结果报表。

第二，找到性能瓶颈，确定优化思路。数据集ds1到ds4结果条数都不是很多，但是需要关联多次。报表工具只能用单元格运算来描述多个数据集的关联关系，也只能用遍历的方式实现计算，复杂度高、性能差。要想办法降低复杂度才能提高性能。可以将数据集ds1到ds4的关联计算从报表中移出，放在数据准备阶段进行。这样做，就可以针对整体数据集执行HASH关联算法，效率要高得多。提前计算的时候，还可以采用内存指针引用的方式做HASH关联，进一步提高计算性能。

ds1和ds5执行时间较短。ds2、ds3、ds4执行时间较长，顺序执行时3个SQL加起来时间就更长了。我们发现，后台数据库其实比较空闲，如果能采用并行提交SQL执行的方式，总的执行时间会减少很多，后台数据库负载压力增加也在可接受范围内。

第三，确定技术选型和实施方案。报表单元格中的关联计算要在数据准备阶段提前完成，最常见的做法是合并SQL，由数据库完成关联计算。但是，由于数据库采用自动化机制，我们无法用SQL写出4个主要结果集全内存指针引用关联的脚本，也没办法实现其中三个子查询并行执行。实际测试结果也证明，合并起来的SQL执行时间还会超过4个SQL依次执行的时间之和。而且，报表数据集对应的3个主要SQL都有二十多行，如果将4个SQL合并成一个，会有80多行，很难阅读和维护。所以，将4个SQL合并，由数据库完成关联计算的办法无法有效提高性能，也不利于后期维护。

使用Java为报表开发自定义数据集接口，当然可以实现上述算法，但这些运算在Java中非常难写，仅一个HASH关联就要数百行代码，而且还不通用。过大的编码量会导致实现周期过长，还容易出现代码错误隐患，也很难调试和维护。

开源集算器SPL提供封装好的函数，支持上述所有的算法，包括并行提交SQL和全内存指针引用方式关联，能够让我们用较少的代码快速实现个性化的计算。

第四，实现优化方案。编写SPL脚本，先用3个线程并行连接数据库，执行3个主要的SQL。并行执行的总时间，是最慢那个SQL的执行时间，基本上是原来3个SQL依次执行总时间的三分之一。再顺序执行另外两个SQL，和3个SQL的结果集在内存中用指针引用方式关联好。最后返回结果。

在报表工具中，连接数据库的5个数据集全部删掉，而使用 SPL 作为自定义数据集，调用编写好的SPL脚本，返回两个结果集ds1和ds2，前者相当于原来的ds1到ds4，后者相当于原来的ds5。SPL 提供有标准JDBC接口，报表工具可以象调用存储过程一样调用 SPL 的SPL脚本，向报表工具返回关联好的结果集。

之后，报表工具就只需要对关联好的结果集进行分组、汇总即可，避免了单元格中的关联计算。修改后报表设计界面如下图：

效果如何

经过一天时间的修改、测试，报表计算呈现的时间由原来的1分30秒缩短为4秒，速度提高了22.5倍，效果非常明显。

从开发难度来看，SPL做了大量封装，提供了丰富的函数，内置了上述优化方案需要的基本算法。上述算法对应的SPL代码也只有十几行：

相比80多行的复杂SQL来说，SPL代码短很多，结构清楚、容易阅读，也更容易编写和修改。

后记

解决性能优化难题，最重要的是设计出高性能的计算方案，有效降低计算复杂度，最终把速度提上去。因此，一方面要充分理解计算和数据的特征，另一方面也要熟知常见的高性能算法，才能因地制宜地设计出合理的优化方案。本次工作中用到的基本高性能算法，都可以从下面这门课程中找到：识别下面二维码学习性能优化课程，有兴趣的同学可以参考。

性能优化课程

有了优化方案后，还要用好的程序语言来高效地实现这个算法。虽然常见的高级语言能够实现大多数优化算法，但代码过于冗长，开发效率过低，会严重影响程序的可维护性。SPL是个很好的选择，它有足够的算法底层支持，代码能做到很简洁，还提供了友好的可视化调试机制，能有效提高开发效率，以及降低维护成本。

重磅！开源SPL交流群成立了

简单好用的SPL开源啦！

为了给感兴趣的小伙伴们提供一个相互交流的平台，

特地开通了交流群（群完全免费，不广告不卖课）

需要进群的朋友，可长按扫描下方二维码

本文感兴趣的朋友，请转到阅读原文去收藏 ^_^

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

开源SPL提速银行资金头寸报表20+倍

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

生成图片，分享到微信朋友圈

开源SPL提速银行资金头寸报表20+倍

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡