查看原文
其他

评分卡的开发

66号学苑 2022-11-25

The following article is from 风控建模 Author 小溪1005

为了让更多童鞋了解申请评分卡建模过程,小编做了一个简略版的评分卡。该评分卡制作比较粗略,有部分步骤并不是严格按照严格流程来制作,仅仅为大家做一个评分卡流程梳理。


一、明确业务目标及业务定义  

                             

业务目标是确定要预测的目标,例如是预测是否欺诈还是是否逾期亦或是是否营销响应等,而每种业务目标所定义的Y也是不一样的。


一般来说定义Y是需要根据业务要求来定义好坏及表现期,像A卡可能根据巴塞尔协议来确定表现期和好坏定义,或者根据vintage与滚动率来定义。


定义完好坏及表现期后,就要进行样本选择,排除不可建模的样本。一般来说,不可建模样本包括无表现的样本,没有达到表现期的样本,强规则拒掉的黑名单客群以及定义为灰的样本等。


二、特征筛选


这里小编为了方便起见,暂时不展示如何进行特征衍生的部分了,这里直接将数据清洗为宽表,如下所示:


1.进行缺失率和单值率检查,删除缺失率在80%、单值率在90%以上的样本、以及忽略缺失值只有一个取值、分类特征水平超过50个 的特征。

2.进行EDA,计算特征每个月的缺失率、坏账率分布,以及分位数分布,删除分布不稳定的特征。

3.进行分箱,并计算每个特征的psi

4.进行细分箱,利用iv、ks等进行特征选择,这里小编用的是单调分箱

5.调用get_iv_ks_auc方法,得到特征的iv、ks、auc、missrate的值

6.调用get_all_bin_stats(),得到分箱统计表

7.计算每个特征的psi


8.进行特征筛选

三、逐步选择


1.将train_df、test_df、all_df进行woe转换,创建stepwise数据集

2.进行stepwise


3.

 

4.手工调整分箱


可视化分箱

计算vif及相关系数矩阵


四、模型开发

LR模型开发

五、模型验证

1.roc:

2.ks

3.lift&洛伦兹


4.模型psi

5.分数分布及密度图



6.分离度

六、转换标准评分卡


来源|风控建模

作者|小溪1005



更多精彩,戳这里:


|这是一份可以让你很牛很牛的风控技能包|

|40页PPT详解金融业智能反欺诈的应用|

|Vintage、滚动率、迁移率的应用|

|一份最全风控产品质量监控(PQR)总结|

|电商及社交数据在金融反欺诈领域的应用|




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存