其他
ROP图
The following article is from 风控建模 Author Monica&徐小东
ROP团其主要目的是用来做 数值型 变量分析,一方面是看变量的分布情况,另一方面可以看同一个变量在不同时间段或不同的样本上,变化趋势是否稳定。
这个ROP方法原先是用SAS编好的。由于大部分新人都不太懂SAS,用起来会有障碍,即使用了也不明就里,因此我特意把这些代码翻译成了Python代码,方便新人使用。
下面我就给大家分享一下ROP代码。
下面用一个数据集介绍使用方法:
输出的结果类似:
由于ROP在分组时,会把横跨多个分组的样本都划分到同一组,因此最终划分的组数可能要小于指定的组数,同时每组的大小也可能不均匀。
我们可以从统计结果看出分组之后每组的坏样本率,组内变量的均值、最小值、最大值,以及组内的样本总数。
从ROP图可以看出组变量均值和组内坏样本的对数几率的变化图。横坐标表示每组变量的均值。
对于变量X1,如果还有一个跨时间的新样本,我们可以在新样本上绘制X1的ROP图,看看效果:
从X1 和 X1_new的对比来看,X1这个变量在不同的样本上,趋势是不一致的,不够稳定,这样的变量在模型中是需要避免使用的。
来源|风控建模
作者|Monica&徐小东
更多精彩,戳这里
阅读原文,即可报名