查看原文
其他

你的模型做了拒绝演绎了吗?

屁屁&铭仔 66号学苑 2022-09-08

在平时的建模中,申请评分卡模型是用来评估申请客户是否会出现短期或者长期的资金紧缺造成的逾期的情况,评分卡面向的客户是所有的申请客户,然后在我们的建模过程中使用的是放款的客户,那些被拒绝规则拒绝的申请客户是被排除的,那么这时候我们拿到的建模数据中的坏客户的比例实际上是比实际申请中的坏客户的比例是低很多的,那么这时候那些拒绝的客户表现出来的数据特征往往就被我们忽略了。


所以今天想跟大家分享的是,不是全部人在建模中都会做的事情——拒绝演绎,我不知道这个词谁取的,字面意思都不知道在干嘛的,拒绝演绎的意思是,你做了一个模型之后要检查对于被规则拒绝的客户的评分是不是受用,因为在建模的数据中,用的是公司放款后的有了表现的客户,对于拒绝的客户不在建模样本中,但是假设被规则拒绝的客户通过你的评分卡的时候,都是出于高分的区间,那么你这个模型就尴尬了,所以有时候为了模型的可用性,还需要做拒绝演绎这一过程。


在《信用风险评分卡研究》这本书对于拒绝演绎有专门的一章是特地来接介绍拒绝演绎的执行方法的。那么我也是参考这本书,以及我平时的工作经验总结了以下几种做拒绝演绎的方法。


1.不做拒绝演绎


假设你的模型根本就不用考虑拒绝客户在你模型中的评分表现的话,那么你是可以不做拒绝演绎的。拒绝演绎不是一定要做的,就像你现在不就没做嘛。


2.以批核率代替


假设你的模型已经生成评分卡,每个客户都有分数,且按照比例分好了区间,这时候假设A B层为优质客户,和次优质客户,那么这两层的客户理论上的逾期率是较平均逾期率要低而且批核率是要比平均的批核率是要高的,才能证明你这层的客户是真的是好客户,假设你的逾期率低,但是批核率也低的话,那么可以理解为是因为这两层的批核率被控制了,所以你的逾期率才低的,并不是因为这两层的客户优质。同样的道理,你的模型中的D、E两层也应该也是符合逾期率高,批核率低的原则,这样子你的模型的效果才是合理的。


3. 加入拒绝客户拟合


这里建议有三种方法加入拒绝客户拟合:


(1)不劳烦别人方法。因为每家公司的拒绝规则不一样,当然数量也不一样,可以取出拒绝客户名单,根据拒绝客户的命中的拒绝规则条数,做出几个客户坏的程度的level,那么这时候你选择你觉得可以完全就是坏客户的标准的拒绝客户的加入建模数据中,看下模型的效果会不会有偏差,有一点点偏差都是可以接受的。


(2)要劳烦别人的方法。假设你觉得上面的这些方法比较片面,因为你觉得不能单靠拒绝规则判断一个客户的好坏,你想更有把握的确定一个客户的很大的可能的好坏,那么这时候你可以拿一定数量的客户给你们公司的审批审核帮你分下客户的好坏,对于审批审核确定真的坏的客户放入建模数据中拟合,但是这你要知道哈,你要放入建模数据中重新拟合的数量不是10、20个哈,那是几百甚至几千个,那么这时候你拿给你们审批审核帮你看,还帮你看的话,可能这个审批官对你有意思了。哈哈哈哈哈。


(3)利用你的模型。假设你对你的模型的准确比较有信心的话,那么你可以用你的模型对拒绝的客户进行评分之后,将A层的客户设为好客户,将E层的客户定义为坏客户,再一起放进去你的建模数据中看下模型效果。


那么关于拒绝演绎我建议的就是以上三种方法啦,那么关于拒绝演绎还有其他的一些的一些方法,以上只是我根据我平时工作中的一个经验建议的方法,那我特别建议你拿给异性的审批官给你判断拒绝客户的好坏,因为要是真的愿意帮你看的审批官,他可能真的喜欢你。


来源|屁屁的sas数据分析

作者|屁屁&铭仔


更多精彩,戳这里:


|这是一份可以让你很牛很牛的风控技能包|

|你是不是觉得你的变量太少|

|R语言实现变量分箱及应用|

|揭秘“微信群控”:黑产竟如此猖獗|



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存