九大步骤轻松搞定评分卡开发

66号学苑 2022-09-08

The following article is from 消费金融风控联盟 Author 刘鹏程

66号学苑小书童：学习评分卡对于非科班出身来说，是一件比较困难的事情。那么是否有一套可以遵循的方法论来学习如何开发评分卡呢？以下就是本次干货的分享内容-评分卡开发方法论SCORECARD。

SCORECARD这九个字母分别是九个英文单词的首写字母，代表评分卡开发工作顺序，它们的含义分别是：

S = Sampling 数据选取与抽样

C = Cleansing 数据检测、数据清洗、数据链接与合并

O = Optimization 数据优化处理，包括客户分群(Segmentation）、变量分析与加工、粗分组等

R = Regression 利用统计学回归技术构建模型

E = Equalization 将模型转化为评分卡形式

C = Confirmation 评分卡评估与确认

A = Administration 评分卡实施上线与管理，包括指定管理人，记录评分卡使用情况等

R = Review 评分卡跟踪验证

D = Documentation 整理记录，完成项目技术文档

下面按照字母顺序，详细描述SCORECARD方法论的关键内容：

一.S = Sampling，

数据选取与抽样（建议双盲随机抽取）

开发评分卡，我们希望能够使用所有可以获得的数据，对数据的存在性、获得的难易程度、未来使用的可能性、时效性、以及数据质量进行评估，去除不能用来开发评分卡的数据，通过取舍过程确定开发数据集，这个过程就是数据选取。

首先、我们需要确定评分卡的开发目标，也就是评分卡要解决的问题，即要衡量和预测什么；

其次、是选择数据的观察区间和表现区间，观察区间是获得评分卡自变量的数据采集时间段，表现区间则是评分卡因变量的数据采集时间段，表现区间采集的客户表现数据，用来确定“好”、“坏”客户。

绝大多数情况下，在开发评分卡的业务中，可以把账户按照日常运营操作的实际情况分为“好”账户、“坏”账户。所谓的“好”账户，就是日常愿意保留的账户，而“坏”账户是产生日常不希望看到的情况的那些账户。这里的定义往往在每次开发评分卡的时候都需要仔细讨论。相对于“坏”账户的数量来说，往往存在有大量的“好”账户，而且数目可能很大。开发统计学评分卡，通常不需要将所有的“好”账户都纳入开发数据集，而是从“好”账户中选取有代表性的样本数据，这个过程称为数据抽样。常用的抽样方法有：简单随机抽样、系统抽样、整群抽样和分层抽样，将根据实际情况确定抽样方法。

二.C = Cleansing,

数据检测、数据清洗、数据链接与合并（数据集市的那套建设方法）

选定样本数据后，可能会提供多个来源、甚至多种类型的数据集。我们需要首先将这些数据集进行整理，成为同一类数据，例如SAS数据，或者TXT形式的数据。数据整理的复杂程度取决于日常的数据存储方式、评分卡建立需要使用的数据源数量、及数据维护方式。数据整理过程包括下面三个步骤：

1.数据检测:原始数据通常会存在各种各样的问题，如：不同时期的数据格式不一致，存在错误值、缺失值、异常值等。数据检测是通过对变量进行分步检测工作，发现数据中存在的问题。

2.数据清洗:根据数据检测的结果，对数据中存在的错误和问题进行针对性处理，剔除不合理记录、去掉重复记录、及对缺失数据项进行处理，将“不干净数据”清洗成“干净数据”。比较常见的缺失数据处理方法有：直接删除法、特殊值填充法、平均数填充法、众数填充法等。考虑到在未来将评分卡应用到零售日常业务过程中会遇到的复杂情况，通常会根据实际数据情况采用某一种简单但是有效的处理方法。

3.数据链接与合并:这些数据集之间应当有必要的匹配键，例如：申请编号、账号等等。按照相应的匹配键将整理好的数据集进行链接与合并，形成一个扁平文件。

三.O = Optimization，

数据优化处理，包括客户分群(Segmentation）、变量分析与加工、粗分组等

数据的详细分析与加工，在开发评分卡的流程中，占有绝对重要的地位，也是花费时间最多的一项工作。在数据质量相同的前提下，只有这一步工作进行得细致周到，才有可能开发出高质量的评分卡。历史经验表明，如果对数据进行同样深度的加工，无论将来采用哪种评分卡开发方法，结果的差异性不会很大，反之，如果数据分析加工工作做得不够深入，无论用什么方法，都不可能得到高质量的评分卡。

按顺序对工作步骤介绍如下：

1.客户分群（Segmentation）:客户分群是对这些开发数据进行详细分析，将风险成因特征相似的客户聚在一起，将风险成因特征差异较大的人分为不同的群体，使得分别开发的评分卡都更具有针对性。分群首先要基于业务用途，其次是结合数据进行调整。

2.中间变量（Attributes）:根据评分卡开发经验对建模数据进行加工，产生中间变量，也就是衍生变量。中间变量的产生是评分卡开发的一个重要环节，没有合理的中间变量集，就不可能建立高质量的评分卡。产生中间变量时，要考虑变量的预测能力、变量的类别、变量的稳定性等因素，尽量覆盖到影响评分卡预测目标的所有角度。在这个环节中，需要对连续型数值变量进行离散化处理。

3.粗分组（Coarse Classing）:在将连续型数值变量进行离散化处理之后，所有有可能进入模型的变量都需要逐一进行粗分组运算。对变量进行粗分组处理，既可以避免模型出现过渡拟合，影响将来评分卡的稳定性，也可以解决模型对变量的单调性和线性要求。粗分组的一般原则是在预测未来表现时，将模式相近的相邻变量属性进行组合，同时确保分组中有足够的样本以彰显统计意义。粗分组工作的结果，是将所有可能进入评分卡的变量都划分成有限个属性区间或组别的形式，从而可以以哑变量或者证据权重的形式进入建模型阶段。

最后，将开发数据全部整理到一个数据集内，我们将得到一个数据表，采用以每条记录为一行的数据罗列方式。

四.R = Regression，

利用统计学回归技术建模型

世界上流行的评分模型开发方法主要分三类：非线性规划算法、统计学回归算法、神经网络算法（目前还流行随机森林、机器学习等算法应有尽有，我自己比较喜欢用L+SVM的方式）。

在对数据进行了充分的分析与加工之后，三者之间的差异性通常不是很大（根据工作中某博士自己做的不同类型的方法出来的评分卡差异性在13%左右，也说明任何一种方法都不会完美解决一个问题）。主要采取的是统计学回归算法（FICO评分只用L模型，迭代了超过七各版本）。

对于预测的二元（或多元）因变量情况，广义线性模型中的Logistic回归可以满足要求。从单个变量来看，可能很多变量都有预测能力，但是由于变量之间有一定的相关性，因此高度相关的变量可能不需要同时进入模型，增加系统运算压力。有些变量的预测能力远远不足以帮助模型提高预测能力，尽管自身具有一定的预测意义，也不一定会被选中。最后被选择进入模型的，是那些综合在一起可以带来最高预测能力的变量组合。

在模型构建时要将数据集划分成开发集和测试集，基于开发集进行模型建立，通过考察测试集的模型效果来校验模型。

五.E = Equalization，

将模型转化为评分卡形式

模型建立以后，需要将模型的系数转化为评分。通常我们希望看到的评分卡分数，均为正整数，这是为了保证在使用上的方便性。会建议日常对评分卡选定一个恰当的分数区间。另外，对于一套多张评分卡的情形，经过这样的转化，可以使得无论出自哪一张评分卡，同样的分数都对应同样的“好”“坏”比例，便于制定和执行信贷决策。

六.C = Confirmation，

评分卡评估与确认

开发完成的评分卡要满足一定的质量标准。首先，评分卡要具备合理性。对评分卡中变量的分值及趋势，需要与业务经验吻合，不存在矛盾或者不合理的情况。其次，评分卡要具备一定的稳定性。评分卡在开发集和测试集、及跨时区校验集上的预测能力指标要稳定，评分卡的预测能力不应该随个别变量的变动而发生显著改变；最后，评分卡必须对目标变量有比较好的预测能力。采用的评分卡预测能力评估指标有：分离度（Divergence）、洛伦兹曲线（Lorenzo Curve）、K-S检验（Kolmogorov-Smirnov）等。

此外，由于评分卡的开发周期往往历时数周，甚至数月，在开发过程中，业务经营上不可避免的会发生一些变化，因此在完成开发以后，需要再次与评分卡使用人员沟通，了解是否有数据定义变动、数据流程变动等，这样可以对评分卡进行相应的调整，得到最终确认。

七.A = Administration，

评分卡实施上线与管理，包括指定管理人，记录评分卡使用情况等

评分卡确认后，在上线使用的时候，需要三个方面的配合：IT系统、风控政策、业务流程。可以在这三个方面提供相应的辅导，比如在系统中实现评分卡计算的时候，提供评分卡安装指引，确保评分卡被正确的安装到决策引擎软件当中；在政策方面，可以辅导日常的评分卡管理人员制定人工修正评分卡的规定和管理办法，比如允许在何种情况下，根据哪些原因批准一个未达到界限分数的申请人，以及如何对这样的案例进行评估；在流程方面，客户使用了评分卡进行信贷审批和账户管理之后，可以提供参考意见，建议优化调整某些工作步骤。

评分卡投入使用后，评分卡管理人员需要记录与评分卡有关的业务变化，例如大型营销活动、政策调整、信用卡资产并购等等，这些记录往往可以解释评分卡跟踪中发现的异常现象。

八.R = Review，

评分卡跟踪验证

每一张评分卡都会有有效期，以往的经验显示这个有效期通常只有一两年，极端情况下几个月甚至更少，如果经济环境变化比较大，日常信贷政策有重大调整，或者日常的客户管理模式发生变化，都会直接导致评分卡有效期的缩短。相反，如果信贷环境没有明显变化，日常的风险管理原则变化不大，则评分卡的有效期会比较长。一个评分卡随时间而失效，不说明评分卡质量差，而是说明需要重新开发评分卡的时候到了。

日常需要持续性的对评分卡进行跟踪验证，首先需要检查评分卡的适用性，即确保应用评分卡的人群和评分卡开发样本之间没有重大差异；其次，日常需要确保评分卡的有效性，即评分卡依然可以有排序功能。

评分卡开发完成以后，即使是在评分卡上线之前，也可以马上进行评分卡的跟踪工作，了解评分卡应用人群的整体偏移情况，考察其适用性；评分卡开发完成一段时间后，可以验证评分卡的有效性。前者称为前端跟踪，后者称为后端跟踪。

在完成评分卡开发工作后，会提供评分卡的前端和后端跟踪报表模板，供评分卡管理人员使用。如果日常需要，也会提供解读报表的咨询服务。

九.D = Documentation，

整理记录，完成项目技术文档

作为风险管理的公司，清晰完整的项目文档是必不可少的，它记录完整的项开发过程，使开发过程可以经受住无论来自于监管当局，还是内部审计部门的挑战，同时也方便评分卡管理人员了解项目情况，便于对评分卡进行跟踪验证。

另外，用敏捷项目管理来对评分卡的落地实现是非常好的一种方式，推荐大家使用。

来源|消费金融风控联盟

更多精彩，戳这里：

|这是一份可以让你很牛很牛的风控技能包|

|关于模型的100个问答—part1|

|信用评分卡模型开发及评估指标|