查看原文
其他

漫谈风控指标(全文)

2017-11-08 刘鹏程 消费金融风控联盟


预计阅读文本需要30分钟左右,请合理安排时间。


漫谈风控指标

序言:

现在消费金融、现金贷发展的非常迅猛,几乎渗透于任何场景。最近一两年以来,国家对P2P的政策管制和对校园贷款、现金贷的政策越来越严格,笔者作为消费类金融从业者,需要学习的知识更多。

目前市面上系统讲解风控的不多,笔者写本文主要目的希望以以运营和风控人员的视角来看待各项风控指标,从各个数据现象中分析、发现、挖掘隐藏在数据背后的内容。

当下国外的数据类风控非常的完善,但是中国还是有自己的特色的,毕竟这是一个有着五千年历史文明的、现代化的、中国特色的、社会主义国家。以某数据驱动为理念的国外先进思想作为方法论是非常值得我们学习,但落地实施方面还需要完成本土化方可执行。

 

本文阅读对象

风控从业人员、CROCEO或相关高级管理人员、风控管理兴趣爱好者

 

声明:

因时间仓促以及笔者工作、知识与能力有限,本文难免会出现瑕疵和纰漏欢迎朋友们批评并提出宝贵的意见和建议。笔者邮箱:liupengcheng@xiaojinfengkong.com也可以通过微信公众号消费金融风控联盟”ID:xiaojinfengkong 联系笔者,再次感谢!

感谢:

       非常感谢宋聪杰、杨晓燕和团队朋友们的大力帮助,也非常感谢消金风控联盟的各位群友的帮助。还有其他的的关系和支持我们消金风控联盟的朋友。我表示由衷的谢意!


目录

1     风险产生的原因 3

2     风险管理的模块 3

3     量化风险 4

3.1 指标介绍 4

3.1.1  逾期率指标 7

3.1.2  迁徙率指标 8

3.1.3  账龄分析指标Vintage图 9

3.1.4  不良率指标 11

3.1.5  净损失率NCL指标 13

3.1.6  递延率指标 13

3.1.7  疑似欺诈率与欺诈、首逾指类标 13

3.1.8  进件类相关指标 14

3.1.9  风险系数指标 14

3.2   指标的选择 15

3.3   维度介绍 16

3.3.1  产品维度 16

3.3.2  客户维度 16

3.3.3  信用维度 17

3.3.4  行为维度 17

3.3.5  其他的数据维度 17

3.3.6  设备信息维度 17

3.3.7  用户画像实例 18

4     风险数据应用 18

4.1   信审类 19

4.2   决策类 19

4.3   疑似欺诈类 20

5     风险数据预测 20


 

1   风险产生的原因

无论是银行业、P2P或者消费金融场景下的任何一种有直接与间接的借贷关系都会产生风险,广义风险不仅包含贷款人违约、也包含借贷机构或参与者的自身运营风险、以及政策、环境等各个不可控因素。在排除了政策、环境、机构等因素后,侠义的风险仅为贷款人不还钱导致的。借款不还钱的因素多种多样,或许是无能为力,或许是就不想还。为确保借款人可以还款,应采用必要的风控手段,例如在贷前进行筛查,以确保贷款人的还款能力,对于还款能力的甄别这里不再赘述。读者可以通过网络或者任何形式的课程加以学习。

2   风险管理的模块

                           


风险管理主要分为四大部分:风险识别、风险分析、风险监控、风险应对。

举个栗子:通过2345贷款王的各种年报季报来看,现金贷的盈利性已经不仅仅是用暴利来形容,现金贷半年的时间走完了P2P三年的时间,成立一条现金贷需要做大致如下5步骤:

1、规划一个预计客户人群;2、建立一套属于自己的系统;3、做好风控筛选(粗粒度即可。有人说现金贷可以没有风控,如果只想赚一把就跑,风控就不重要。);4、保证有资金可以稳定供给;5、做好运营管理和模式转型;

以风险四个部分来说,首先要需要预先风险识别。20岁在富士康工作的和20岁在校园学习的风险完全不一样(高利贷禁止进入校园)。其次,在上线前要提前根据客群进行粗粒度筛选,比如黑名单、反欺诈、设备反欺诈等,再次上线后要实时进行监控、分析相关进件、拒绝、逾期等数据以防止策略被黑产、羊毛和别有用心的人所利用而产生坏账。最后重要一点就是需要对自己的模式和风险进行预判与监控,事实做到心中有数。推荐采用PDCA质量管理方法论来指导风控操作。

其他的场景,例如消费类金融大体思路也是如此,这里就不再赘述。

3   量化风险

3.1 指标介绍

以银行为例,目前银行对风险进行量化已经有比较成熟的体系,作为消费金融风控类模式也大致相似,对于实操细节需要根据不同的场景和形式而进行区别对待。

下面会根据不同阶段讲解一下笔者认为较为重要的和常见的指标项目,对于其他指标线就不多一一列举,有机会再与大家分享。

常见贷款通用流程:

申请à审批à签订合同à放款à贷后管理à催收à资产处置。

以主要的前五项流程为例,每一项都会落地相关的指标和数据。大致分类如下图所示。

 


 

根据笔者的经验和相关知识案例,整理了一张列表提供给大家参考。

 

·指标大类

指标细类

指标名称

备注

数量类

金额

剩余本金

逾期本金+未还本金

剩余本息

逾期本金+逾期利息+未还本金+未还利息

贷款余额

逾期总金额+未还总金额

逾期总金额

逾期本金+逾期利息+逾期服务费+逾期违约金+逾期罚息+滞纳金

逾期罚息

由于客户逾期还款产生的额外利息

逾期违约金

客户没有按合同履约而支付的违约费用

逾期服务费

由于客户逾期还款产生的额外服务费用

逾期利息

客户逾期款项的还款利息

逾期本金

客户逾期款项的还款本金

……


笔数

放款笔数

已放款的总笔数

逾期笔数

已逾期的总笔数

结清笔数

已结清的总笔数

首逾笔数

首个还款月就逾期的笔数

……


账户数

放款户数

已放款的账户数

申请户数

申请贷款的账户数

逾期户数

产生逾期的账户数

结清户数

已结清的账户数

……


比率类

逾期类

逾期率

有各种不同口径的定义方法

不良率


迁徙率


延滞率


……


欺诈类

疑似欺诈率

分子:账期处于MOB1-MOB9之间,T月末还款期数未超过3期账户剩余本金。

分母:账期处于MOB1-MOB9之间,T月末账户的总剩余本金。

疑似欺诈率=分子/分母

……


 

       一些指标有明确的定义,如放款笔数、放款账户数等。有一些指标的定义并不明确,广为人知的就是逾期率的定义,由于不同的公司对逾期率的口径不一致,会导致其反应的真实意义也不一致。还有一些指标本身就有多种定义,如延滞率,其本身就有即期和递延两种口径,所反映的意义也不一样。

备注:指标统一口径仅作为参考,需要根据实际而确定,举例的口径仅通过部分企业的实际应用而得,不一定具有全局实用性和统一性。,请读者悉知。

在重点讲解几个重要的指标之前,我们先给出几个业内常用的定义:

逾期天数:自约定还款日起的未还款天数。  一般表示逾期D D1 表示逾期天1D1+,表示逾期天数大于等于1;默认+表示大于等于。

逾期期数:以分期类为例,M1 表示逾期1 M1+表示逾期大于等于1期;

逾期阶段:一般以逾期的程度进行划分或者以逾期的严重度划分。一般M1 1-20认为比较前期或者轻,每家情况不同划分等级也不同。通常我建议采用P等级对逾期等级划分,例如P1-P10等级,方便采用策略进行逾期催收。

期初、期末均指按照账单日的起始日或结束日或者自然周、月、季、年份等的起始进行划分。

件数、金额均值进件数理和进件金额;日均进件量表示按照某特定周期进行的日进件量的平均算法。件均金额表示某特定范围内平均每进件金额数。一般统计都会按照进件量和金额两个维度统计。例如,逾期中提到的M1 表示逾期1期,那么可以细分为,逾期件数和逾期金额,月均逾期件数,月均逾期金额等指标。

等等其他指标不一一讲述。

3.1.1.      逾期率指标

逾期指标是最常见的指标,任何的放款模式或场景都会用到该指标。所以用比较多的内容来描述一下。

定义一:逾期贷款剩余本金(逾期贷款剩余本息)/总剩余本金(总剩余本息)

定义二M3+剩余本金/(同账龄的所有贷款的合同金额)

定义三M3+剩余本息/(同账龄的所有贷款的合同金额)

部分公司的逾期率会选用定义一或二,因为这样随着新贷款的发放,总的剩余本金或剩余本息在增加,分母变大会让逾期率显的比较小。而一般公认的逾期率为定义二或定义三。这样能较为公正的反映当前的资产情况。某上市P2P公司的财报用的就是定义三。

另外,常用的逾期率中含有两类,即期延滞

定义:各逾期段的应收金额(逾期金额)/应收金额

分子很好理解,分母则有如下两种定义

l  即期(coincidental),分母为当期金额,如当期应收账款。其概念为分析当期应收账款的质量结构

l  递延(lagged),分母为之前的金额,如之前月份的应收账款。其概念为可以较为合理的反映数据状态

通过下图可以说明两种口径下的指标所能反应的问题。


3-1

由图3-1数据我们发现,在平台平稳发展期两个指标差距不大;在平台进入扩充期,随着业务量的增加即期相对稳定,延滞明显的回落,在业务顶峰期间延滞指标是非常低的;当平台进入了饱和期后随着进件量的下降,即期指标依然相对平稳,但是延滞指标缺产生巨大的波动,。因此即期和延滞指标应在不同的阶段分别对待。不同的阶段也应采取不同的催收手段来降低相关逾期率及后续的应对策略。例如重点增加业务量较多月份产生的逾期。具体相关内容不在赘述,请读者根据自己实际情况而定。

 

3.1.2.      迁徙率指标

通俗的迁徙率定义为:某一贷款的状态变为另一种状态的一种变化过程(笔者个人的理解定义,非官方定义)。举例如下:

账单月

0-M1

m1-m2

m2-m3

m3-m4

m4-m5

m5-m6

3

2.53%

47.61%

76.25%

83.82%

88.15%

87.89%

4

2.42%

54.09%

75.25%

84.05%

91.15%

93.61%

5

2.39%

56.24%

73.68%

86.65%

91.66%

94.51%

6

2.52%

55.12%

73.06%

84.10%

91.63%

93.99%

7

2.47%

54.47%

72.03%

86.14%

93.00%

95.64%

 


3-2

其中0-M1 表示当期内有非逾期变成逾期1期的占比数M1-M2 以此类推。一般来说,考核逾期催收采用迁徙率也是一种方式。

 

 

3.1.3.      账龄分析指标Vintage图

账龄分析指标从字面意思容易理解,但是用的最多的还是Vintage(温忒直)图,其主要目的就是展现各个账龄在某个时间节点的数据分布的关系,


Q1

Q2

Q3

Q4

M1

5.77%

4.78%

6.88%

4.97%

M2

1.50%

2.22%

3.47%

4.78%

M3

3.60%

4.30%

5.70%

6.40%

M4

5.50%

6.70%

7.10%

7.96%

M5

6.70%

6.90%

8.30%

8.47%

M6

7.60%

7.70%

8.90%

9.76%

 

如下图所示。

 


3-3

    该图展示的就是以M1-M6的一季度到四季度的逾期数据展示,采用V图。也可以使用堆积图直方图进行展示


3-4

每一个图形显示的内容不同,以图3-3为例,显示的是四个季度的逾期变化走势,方便制订逾期催收策略、为逾期原因提供数据支持等,图3-4是方便发现逾期总占比,接近阶段性逾期问题等。

一般来说V图多采用周和月,对于较短数据,推荐使用周为单位。普通的建议以月为单位。

 

3.1.4.      不良率指标

不良率最主要是先定义什么时坏账,不同的公司定义不良有很大差距的,例如现金贷大多将M3+或者M1+就算账为不良(PDL借款周期短 7 1430天居多,所以不良定义),而一般的消费类或分期多以M6+为不良,在我的印象中某银行的不良是Y3+(3年以上不还款)

首先:

定义  M3+(M4)客户逾期金额在总放款金额中的比例

计算公式 M3+()客户剩余本息÷[3个月前的放款总合同金额+总利息)-3个月前放款客户已结清的合同金额+利息]

 简单一点:剩余本息÷X前期 (应收总金额-已收中金额)

或者 剩余本金÷X前( 应收-已收))

另外一种计算:剩余本金÷(当期应收-当期已收)

另外还有一种:剩余本金÷当前应收

举例说明(以下数据皆来自与仿造):

 

月份

客户姓名

期数

当前期数

贷款金额

贷款利息

本期应还本金

已还本金

贷款余额

是否逾期

逾期期数

逾期本金

2016/12

马走日

12

0

10000

600

0


10000




2016/12

象走田

12

0

10000

600

0


10000




2017/1

马走日

12

1

10000

600

833.3333333

0

10000

1

833.3333

2017/1

象走田

12

1

10000

600

833.3333333

833.33

9166.67

0

0

2017/2

马走日

12

2

10000

600

833.3333333

0

10000

2

1666.667

2017/2

象走田

12

2

10000

600

833.3333333

833.33

8333.34

0

0

2017/2

韩梅梅

12

1

10000

600

833.3333333

833.33

9166.67

0

0

2017/3

马走日

12

3

10000

600

833.3333333

2499.99

7500.01

0

0

2017/3

象走田

12

3

10000

600

833.3333333

833.33

7500.01

0

0

2017/3

李雷

12

1

20000

1200

1666.666667

1666.67

18333.33

0

0

2017/3

韩梅梅

12

2

10000

600

833.3333333

0

9166.67

1

833.3333

20174

马走日

12

4

10000

600

833.3333333

833.33

6666.68

0

0

20174

象走田

12

4

10000

600

833.3333333

833.33

6666.68

0

0

20174

李雷

12

2

20000

1200

1666.666667

1666.67

16666.66

0

0

20174

韩梅梅

12

3

10000

600

833.3333333

0

9166.67

2

1666.667

20175

马走日

12

5

10000

600

833.3333333

833.33

5833.35

0

0

 

根据以上数据出数据透视如如下表

MOB

贷款剩余金额

M3+金额

201612

20000


20171

20000

833.3333333

20172

30000

1666.666667

20173

50000

833.3333333

20174

50000

1666.666667

20175

10000

0

总计

180000

5000

 

那么:总体不良率=5000/18000=2.78%;

 1月份不良率如何计算?有几种算法我粗糙的列举一下

A833/20000=4.615%  B: 833/(20000+20000)=2.083%

AB分母是不同的。一个上月放款金额,一个是当前合计放款金额。一般对外多用B类算法,有的会对内绩效考虑采用A类算法。AB的不良算法其实就是一个延滞和即期的算法概念。

从纯风控角度来说,我推荐使用延滞算法计算不良率。这也是因为算法的不同,导致当前市面上报表不良的算法不同,例如某著名文章算出的某信托计划逾期数据大相径庭。

 

3.1.5.      净损失率NCL指标

定义:(成为坏账的金额减去回收的金额)/转坏账前应收。

一般净损失率也有一些会计上的计算方法,这里就不举例了,净损失率最主要目的是计算表内净损失的指标。

净损失率与回收率正好相反。一个是针对于呆坏账之后的损失情况一个是呆坏账的回收情况,两者加起来和值等于1

3.1.6.      递延率指标

为催收单位最常使用的绩效指标,其目的为观察前期逾期金额经过催收之后,仍未缴款而于次期继续落入下一bucket的几率。

3.1.7.      疑似欺诈率与欺诈、首逾指类标

疑似欺诈率指标针对于自身进件数据以及逾期、坏账数据而进行分析的一种内部反欺诈分析常用指标。该指标也可以配合风控内部反欺诈策略,对数据进行集中分析后执行相关的反欺诈策略。另外一点需要指出的是,这个数据不仅仅可以用在客户方面,也可以用在内部客户经理统计绩效方面。这个指标也可以作为发现或内外勾结的一种简单参考,具体的内容还需要根据自身实际情况处理,这里不再赘述。

定义:账龄mob处于某个阶段期间,某月末还款期数较少。例如MOB39直接的,截至当月末还款期数少于3期。

计算公式 MOB处于N1-N2之间,T月末未还款期数未超过x期的剩余本金)除以(MOB处于N1-N2之间,T月末的中剩余本金)

内部反欺诈也有一类欺诈指标,定义:自放款月后,连续三期未还。这样的客户初步确定为欺诈类客户,需要及时根据后续风控手段,例如停止进件、增加追偿等。特别是在教育分期中X+Y模式,X期前期还款较少甚至机构代还的现象出现,很容易掩盖欺诈行为。

还有一类指标首期逾期指标。定义:放贷后首期还款日未还款,产生首次逾期。此类指标需要对客户进行判断,以区分是否是欺诈类客户。另外,不仅仅是首期逾期的,前两期,首三期都是重点对象,适当时候需要提前启动资产保全相关手段。

本文暂不提供数据举例。

3.1.8.      进件类相关指标

比如一些进件核准率、通过率、反欺诈黑名单命中率、拒绝率等一些进件相关的指标。对于此类指标我个人观点,需要根据业务的发展规模与实际情况而定,比如新产品或新公司成立阶段,需要大力发展,在资金规模较小的情况下在可以接受的亏损范围内可以适当的提高通过率或降低相关命中率或拒绝率,以适应业务快速发展并沉淀内部风控数据为主。当业务发展到一定规模后,需要谨慎处理进件类相关指标,严格控通过率、黑名单和白名单相关数据。

以国内著名某信为例,刚登录国内的时候属于无差别放款,通过率非常高。经过烧钱后建立了授信模型之后开始大规模的实行风控手段,短时间内做到了百亿规模,这个与前期的小额试错战略有着非常重要的关系。

 

3.1.9.      风险系数指标

风险系数各家都有不同的定义,我个人观点以流动性、损失率、成长率这主要三个维度来考虑。在保证流动性的前提下,挖护城河建城墙是首要任务,城墙越高未来损失越小,护城河越深成长率越高。

 

 

3.2.    指标的选择

每一件事情的发生都有其前因后果,分析事情切忌从单方面切入。否则就是瞎子摸象,容易使决策发生错误。选择指标时关注如下重点,以厘清不同指标之间的关联,为报表使用者提供完整可靠的分析。

l  相对性

即事件的一体两面,若仅以一个指标骤下判断是非常危险的,例如核准率的上升相对地有可能会带动延滞率的提高。这两个指标代表业务的增长和风险的增长,两个对应指标应同时并列于报表中以供使用者权衡利弊。

l  比较性

实际值和预设值的比较。

l  互补性

某些指标若单独呈现,解释力过于薄弱,必须采用互补性质的指标进行补强。这种互补性常见于比率和绝对数字之间。

l  多面性

有时候单一指标所呈现的讯息,再以另一方面切入会产生完全不同的解释。例如某一产品核准率持续上升,在审核流程无重大变动情况下,表明进件质量良好。但若观察金额核准率指标后可能出现相反的走势,客户申请金额和核准金额存在明显差异,也就是说进件质量实际上并不如件数核准率所显示的那么乐观。

l  顺序性

有些指标有前后关系,若要清楚掌握整个事件的始末,就必须对这些指标做一系列的观察。比如进件量、核准量和放款量,这三个指标依序发生,彼此环环相扣,任一环节出现异常皆会影响最终结果。

l  层次性

指标中的层次关系。

l  落差性

时间上的落差,一个指标数据出现后,另一个指标需要经过一段时间才会有所体现。因此需要同时列出观察期及反应期的数据,以便报表使用者解读。如核准后逾期的出现一般需要三到六个月的发酵时间。

 

3.3.    维度介绍

维度一词来源于数据集市和数据仓库的维度建模概念,维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能,著名的有雪花模型和星型模型。这里不多做专业知识介绍,有兴趣的朋友可以学习相关数据仓库、数据集市及数据挖掘的相关内容。多年前看过一本《大嘴巴漫谈数据挖掘》这本书入门不错,有兴趣的朋友可以自学。

3.3.1.      产品维度

    产品维度包括各类产品的属性,例如产品种类、期限、期数、类型、额度、等相关产品属性。以贷款类业务为例最主要的贷款六要素(借款人、贷款金额、利率和费率、期限、用途、类型)。

    顺便吐槽一下:对于教育类分期产品中有一个奇葩设计就是X+Y模式,X期先还利息,Y期后还本息。产品类型来说,此设计无可厚非,属于适应市场需求,问题是,X利息非常少,从风控的角度来说时间越长回收和损失潜在概率越大。为了烧钱,使劲烧钱占领市场无可厚非,但是有哪家依然敢这么做。。只能说明金主有钱!任性!

3.3.2.      客户维度

客户的维度包含很多中,例如身份特征、自然人或者法人或者其他类型身份,性别、年龄、区域、学历、收入、行业等都很关系,特别是要针对客户的逾期、坏账分布来挖掘一些事情。

例如多年前上海的各个以后禁止向福建某区域贷款,这就是一个以客户维度出发做的数据汇总。另外去年闹得沸沸扬扬的女大学生裸贷,我相信除了一部分别有用心的人的别有用心的目的,另外一部分也是应该基于女大学还款的情况而定的,至少我在2015年做大学生市场的时候,的的确确的数据表明女大学生几乎没有逾期和坏账的发生,而基于这一数据分析结果专门针对此群体设计了五分钟极速放贷产品。除此之外,通过数据也发现有着较高学历和较多社交圈的客户逾期与坏账也明显较少。这样就可以针对某区域某行业某类型的客户进行快速放贷或提高授信。

客户特征类型严重影响这一个产品和一个企业的发展。相信很多做资产的朋友有深刻体会。

3.3.3.      信用维度

信用维度这个概念比较大,比如人行征信、芝麻分以及各种各样的信用分,具体的应用还需要看场景和客户群表现而定,如果单纯的就认为芝麻分700+以上的都是好人而且请用的扩大授信额度,是需要三思的。

3.3.4.      行为维度

一般来说行为多以客户内部行为为主,因笔者学识浅薄,无能力谈论行为维度相关内容。

3.3.5.      其他的数据维度

其他的可以通过内部,外部获得一些数据,这些数据维度可以通过大数据的方法来进行处理。不过对于弱项的影响力还需要进行科学的验证方可。

3.3.6.      设备信息维度

在互联网金融中,因为可以通过移动设备来申请贷款,所以较传统银行业,我们多了一个设备信息这方面的维度,主要包括如下几个大类,各大类又可以进行细化

1)申请行为类:在移动设备上各环节填写时间、阅读条款时间、申请时间等。

2)数据识别类:移动设备位置信息、安装应用信息、手机型号、App版本信息等。

3)社会关系类:通过分析移动设备中的联系人,得到其社会关系信息。

 

3.3.7.      用户画像实例

通过一下图片,给大家展示一下我们做的一点点客户画像的demo实例。


4  风险数据应用

       在进行任何数据分析时,大多分析包含在如下四大类中:分布、变化、对比、预测。进行任何分析前都要先进行问题界定。问题轮廓越清晰,分析方向越明确,

越容易切中要害。下面通过几张风控IT系统化建设demo截图给大家展示一下相关内容,具体细节内容不再赘述。

4.1.    信审类




4.2.    决策类

 



4.3.    疑似欺诈类


 


 

 

5   风险数据预测

预测分析法分为定性法及定量法,前者较偏向主观经验判断,后者则侧重客观的计量方式。两者经常搭配使用。可以采用:关联推测法;定性的推测法;; 移动平均法;指数平滑法;线性回归法; 对数趋势法等多种预测方法。这里就不再赘述,有兴趣的朋友可以参考统计学中预测相关内容。

内容待续。。

声明:

本文版权均属本文作者刘鹏程所有,任何媒体、网站或个人未经授权不得转载、链接、转贴或以其他方式复制发布/发表。

申请转载请后台留言或直接联系。

       已经授权的媒体、网站,在下使用时必须注明"来源:消金风控联盟 刘鹏程",违者将依法追究责任。 





佰瑞金服提供完整IT系统建设服务









您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存