查看原文
其他

ROP图

66号学苑 2022-09-08

The following article is from 风控建模 Author Monica&徐小东

ROP团其主要目的是用来做 数值型 变量分析,一方面是看变量的分布情况,另一方面可以看同一个变量在不同时间段或不同的样本上,变化趋势是否稳定。


这个ROP方法原先是用SAS编好的。由于大部分新人都不太懂SAS,用起来会有障碍,即使用了也不明就里,因此我特意把这些代码翻译成了Python代码,方便新人使用。


下面我就给大家分享一下ROP代码。

下面用一个数据集介绍使用方法:


输出的结果类似:


由于ROP在分组时,会把横跨多个分组的样本都划分到同一组,因此最终划分的组数可能要小于指定的组数,同时每组的大小也可能不均匀。


我们可以从统计结果看出分组之后每组的坏样本率,组内变量的均值、最小值、最大值,以及组内的样本总数。


从ROP图可以看出组变量均值和组内坏样本的对数几率的变化图。横坐标表示每组变量的均值。


对于变量X1,如果还有一个跨时间的新样本,我们可以在新样本上绘制X1的ROP图,看看效果:

从X1 和 X1_new的对比来看,X1这个变量在不同的样本上,趋势是不一致的,不够稳定,这样的变量在模型中是需要避免使用的。


来源|风控建模

作者|Monica&徐小东


更多精彩,戳这里

|这是一份可以让你很牛很牛的风控技能包|

|银行智能反欺诈风险预测模型研究|

|树模型的共线性问题|

|在线支付之风控系统架构选型|

|我来拯救正在为变量降维而烦恼的你|


阅读原文,即可报名



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存