评分卡建模—拒绝推断
The following article is from 风控建模 Author Monica
首先,大家都知道我们的A卡模型时建立在历史数据之上的,而很多被婉拒的用户没有被纳入到评分卡建模的数据集中,这就造成了建模数据的偏差,因此有必要利用拒绝推断来预测这些被婉拒的客户的0-1标签,并纳入到建模数据集中,这样就是根据100%的通过率数据进行建模了。
前面小编说道拒绝推断的主要目的是防止建模样本有偏,还有如下几个原因:
1.公司内部策略的变动,导致当前的申请者已不能代表建模时点的申请者,同样,过去的被拒者也不能够代表当前的被拒者。因此,此时使用审批通过的数据进行建模可能会造成误判;
2.增加样本数量,类似于防止样本有偏。
3.利用拒绝推断可以找出被拒绝的好客户,挖掘这些客户,进而改善风控流程,增加公司效益。
拒绝推断可适用的范围:
1.高通过率时推断假设不适用,因为无论是高坏账率或者低坏账率,高通过率说明坏账率已经接近原申请样本了;
2.中低通过率适用,配合适当的风控策略,可以找到更多的好人。
拒绝推断方法:
1.接受所有的申请者:
此方法是找出被拒绝客户真正表现的方法,不会有太过保守或高估的坏账率。
2.分配法:
此方法是依据每一个分数区间的好坏重新分配好坏客户,并将拒绝件分配到每一个分数区间中,以下是具体步骤:
(1)已知好坏样本,建立初步模型;
(2)使用初步模型对所有被拒绝件进行评分,并预测他们的预期违约率;
(3)将已知的好坏样本依评分分数高低进行分组,计算各分组内实际违约率;
(4)将被拒件依照(3)步的分数进行分组,以各分组的实际违约率做为抽样比例,随机抽取该分组下的被拒件,并指定其为坏,其余为好;
(5)将这些推论的有标签的数据新增加到原有的数据集中,重新建模。
3. 硬性截断法:
将所有婉拒件依次打分,并分配到好坏件中,步骤如下:
(1)已知好坏样本,建立初始模型;
(2)使用初始模型对所有被拒件进行打分,并建立预期坏账率P;
(3)设定一个坏账水准区分好坏件,在此坏账率水准之上视为坏件,以下视为好;
(4)将这些推论的有标签的数据新增加到原有的数据集中,重新建模。
来源|风控建模
作者|Monica
更多精彩,戳这里:
点击阅读原文,即可报名信用评分卡模型课程