本篇更新策略篇的规则集A类调优Python实操篇,内容选自《100天风控专家》第64期。本篇开始介绍策略调优方面的内容,从A类调优开始,规则阈值的放松具体如何来做。1. 什么是规则阈值放松?
我们举一个简单的例子,先解释一下什么是单变量规则阈值的放松。比如,线上决策引擎中有“RULE0”的征信审批规则,含义是“最近一个月贷款审批查询次数”,它的判断标准是:RULE0>=5 时则命中,否则未命中。
假如,现在我们想对 RULE0 规则进行阈值的放松,比如将 cutoff 阈值调整为>=6 时拒绝。这样就可以将原来>=5 被拒绝的客户通过,进而提高通过率,达到 A 类调优的效果。2. 规则阈值放松的难点
做A类调优的一个难点就是:被拒绝的客户没有贷后表现。
3. 拒绝样本贷后表现的量化方法
有常见的3个方法可以参考:
1)回归预测:如果规则的通过样本分箱badrate有一定的单调性,可尝试基于通过样本的badrate拟合回归模型来预测拒绝样本分箱下的badrate。该方法的使用条件是规则本身具备一定的区分能力,特点就是badrate有单调趋势。2)其它强变量:不依赖于规则通过样本badrate的单调排序性,而是借助其它的强变量来预测拒绝样本贷后表现,即规则通过样本的badrate单调性可强可弱,但都不影响其它强变量的区分效果。在实际业务中,一般这种强变量大多数是模型分,或者融合模型分。3)实际测试:如历史做过“灰度测试”或“AB测试”,可参考历史数据预估;如没有历史测试,可通过“随机测试” 放行想要放松的客户,通过实际贷后表现来准确获取信息。注意:对拒绝样本贷后表现进行预测本身就是一个非常难的问题。如果有多种量化分析方法,最好是可以结合起来使用,综合多个维度分析得到的结果,说服力就更强,预测值就更加准确。
这种方法的前置条件是变量分箱后区间坏账(badrate)需要有明显的单调性,如下图所示。按照badrate的增长趋势或者增速可预估出拒绝段分箱内的badrate水平。实现方式和做模型类似,用通过样本训练拟合出模型,然后对拒绝样本进行预测即可。比如下面拒绝段的第5/6分箱的badrate经过拟合模型预测后分别为0.1642和0.1914。回归模型在Python中可以通过以下方式实现,主要是借助Numpy的polyfit()
函数拟合出线性方程的系数和截距项。如下图所示,通过RULE0的变量分箱及对应的badrate数值训练得到一个一元线性方程:y = 0.0271x + 0.0286
。然后使用该方程预测出拒绝样本的badrate。
步骤1:模型分0对以上通过样本打分的分数分布,根据lift制定cutoff
分流比例:比例不宜过高,以避免损失严重,同时样本量需满足最小统计要求,否则没有统计意义豁免:随机测试样本,只打分不生效,“豁免”直接通过审批,不会被决策流后面策略拒绝,否则获取的贷后表现可能失真优缺点:优点是获取信息最为准确,无需预测,缺点是需要一定的观察周期,并且会产生一定的坏账损失。2)如果历史有做过“AB测试”或“灰度测试”,可以使用测试期间样本的贷后表现预估AB测试:如果规则策略上线时进行AB测试,可以从对照组中低于cutoff的放贷客群的badrate作为实验组的近似估计。灰度测试:如果规则策略上线前存在灰度测试,灰度期间只打分不生效,可以用来预估规则拒绝样本的badrate。--end--