查看原文
其他

信用模型评分卡入门介绍

66号学苑 2022-09-08

The following article is from 消费金融风控联盟 Author 刘鹏程

如今在各种消费金融、贷款业务机构,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。评分卡也分A,B,C卡三大类!


A卡(Application score card)申请评分卡

B卡(Behavior score card)行为评分卡

C卡(Collection score card)催收评分卡

 

这三种打分机制的区别在于:


Ⅰ.使用的阶段不同。


分别侧重贷前、贷中、贷后;


Ⅱ.准备数据及变量侧重点不同。


A卡一般选取进件类信息为主,结合自身及外部数据进行建模评分,可做贷款中短期的信用分析;


B卡则是在申请人有贷款记录之后,在贷款过程中有了一定行为后,可以进行较大数据进行的分析,侧重点以监控、跟踪、预警或者分析等为主。


C卡则对数据要求比较多,特别是自身平台的数据、外部数据、经济环境、产业环境、国家政策等对借款人有还款影响的或对还款能力有影响的因素都会酌情考虑进去。特备是需加入催收后客户反应等相关属性的分析或汇总数据。


Ⅲ.每种评分卡的模型会不一样。


在A卡中常用的有逻辑回归或者不需要太复杂的数学建模方法也可以做到。等,而在后面两种卡中,常使用多因素逻辑回归,对空间分类及精度等方面有更改的要求,我个人推荐考虑选择svm算法。注释:SVM 支持 向量机,可以简单的理解为升维后降维打击,哈哈。



svm示意图


建立模型后需要检测评分卡中客户群的特征变化情况,在特定的时间内需要对这些变化对评分卡分值的冲击进行评估,如果冲击较大甚至需要重新建立评分卡模型。另外,当计算某些特定参数,用以触发某些行动,比如重建评分卡、重设临界值或调整评分卡刻度;需要判断评分卡的实际表现,并与开发阶段的预期,进行对比后方可考虑使用。


对于拒绝演绎情况,此时评分卡开发使用的是审批通过且运行一段时间的账户数据,用以测试表现出正常或违约的账户状态。而拒绝演绎是尝试去分析可能会违约并在评分卡开发前已经被拒绝的账户。我个人观点:需要根据需求和侧重点不同,着重考虑已经违约的用户在历史回测会出现的情况而评估后续工作。


在评分卡建设的实施过程中,需要各个部门在使用评分卡前,将评分卡转换为可统一的实施的标准化内容,以确定最终得分的临界值,和所需的业务行动。从风控角度来说,业务部门只有提供权和使用权,绝不能有内容知晓权甚至影响权。


关于评分卡创建后Logis回归模型建立并通过检验后,再转换为标准评分卡的形式, 评分建立起必须有意义,而且简单方便第二代以及维护。另外,对于模型选取变量,A卡通常在10-16个左右,也可以根据实际情况增减。若变了过多则应考虑A卡细分,而不是几百个大数据想堆积在一张卡之内。B卡C卡因笔者个人能力有限,暂无合适意见。


评分卡开发方法,包括逻辑回归、神经网络、决策树、马尔科夫链、生存分析等等,用的最多的,还是传统的逻辑回归,采用逻辑回归的打分卡开发基本流程大致为选取样本、定义好坏标准、寻找可用变量、选择变量、评分模型开发、设置取舍点(cutoff)六个过程,其主要工作量在前面几部。打分卡模型一般包含15个左右变量,这是由于变量之间一般都会有耦合,比如职务和职称,职务高的人一般职称也高,但不应该重复计算。如果变量太多,去掉变量间耦合会比较困难,也会使模型不稳定,某个变量的小小变化可能导致分值变化很大。


建立评分卡之前还需要准备数据集市系统,对业务数据进行清理并加工落到数据集市系统中,具体数据集市系统建设这里不赘述。在数据集市中重点需要:数据的清洗、数据准备,准备是对于关联表不同因素之间的关系以及各个因素在预测变量下的范围及分布,另外外部数据的使用与内外数据的关联关系。等等因素,总之吧,需要写的太多内容,笔者累啦。生生敲了这么多字哈。真心累不打算敲了。最后再聊几点:


关于正常和违约的标准取决于逾期,一般设置30、60、90天数,现金贷可以考虑5、14、24、30天。       


评分卡也可以在很多场合使用,比如营销评分、申请评分、行为评分、回款催收评分等等,按照具体的产品还可以分为信用卡、车贷、房贷、经营性贷款评分等等,还有按照不同地域的评分等等。根据不同的业务战略,卡的各项参数要做设定,卡的使用比卡开发更重要。


运用信用评分卡需要注意的问题:


1、评分卡的发展必须以历史数据为依据,如果机构刚开始,还没有历史数据,或虽然已经有模型,但历史太短,数据不充分,则不具备开发评分卡的条件。


2、发展信用评分卡需要大量的数据,而且数据的质量要好。(数量+质量,完全取决于机构在前期的IT化建设,某信在财报中对于IT系统建设多达数亿元投入) 如果数据很少,不具有代表性或数据质量很差,有很多错误,那么基于该数据的评分卡就不会准确,那么申请评分卡的发展就会受到制约。


3、数据的保存要完整,条件允许情况下必须把历史上各个时期申请的客户申请表信息、当时的报告记录、开户的账户表现好坏等数据保存起来,不仅所有被批准的客户的数据要保存,被拒绝的申请者数据也应该保存,以进行模型的表现推测。而且,保存的数据不仅要足以提炼出各种预测变量,还要能够辨别其表现(好、坏等)。


4、申信用评分卡只是提供了决策依据,不是决策本身。评分卡并不能告诉审批人员某个客户一定是好的或坏的,它只是告诉我们一定的概率,因此,对于有些客户的申请审批决定就必须综合信用报告等其它信息作出判断。


5、一张申请评分卡很难满足整个人群,需要针对不同人群建立单独的评分卡。特别是互联网金融的兴起,客户群遍布全国各地,存在着较大的地域差别,各地区经济发展也存在着较大差别,客户消费习惯有较大差异,如果使用一张申请评分卡就会造成信用评分的不真实。


6、时间越久,信用评分卡的有效性会降低,因为经济环境、市场状况和申请者、持卡者的构成在不断变化,使得样本人群的特质和属性发生改变,特别是在经济高速发展的阶段,人群的生活方式、消费习惯、经济状况等变化很快,申请评分模型在应用一段时间后通常会与初期模型产生偏移,所以需要适当重新调整,必要时还要重新开发,以保证信用评分卡的有效性。


来源:消费金融风控联盟


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存