商业银行信用风险内部评级方法与实践——非零售客户评级打分卡评估与验证!
关注本平台
作者:叶征
经授权转自公众号:狗熊会
微信号:CluBear
的评估与优化
相对于零售和目前互联网金融的利用线上数据进行风控和信用评估,非零售信用风险由于其固有的特点,比如违约数据稀少甚至无违约数据,某行业由于是国有垄断行业可能只有几家国有企业的数据等,这些问题一直给非零售信用风险内部评级的开展带来极大挑战。
而传统商业银行,非零售客户资产占比普遍较高,如果这部分资产不能通过科学有效的方法确定指标和权重,使得模型指标的选择和权重的确定可重复可检验,则无法通过银监会资本计量高级方法的核准以达到节省资本的目的,而越来越严苛的资本监管,使得资本对于商业银行的业务发展成为极为稀缺的资源。
因此,本文将对低违约资产组合的评估与验证做详细论述。
非零售客户评级打分卡优化项目的目标
通过项目建设,使银行非零售客户评级打分卡具备良好的风险识别能力,使银行打分卡开发体系更加科学、规范和透明。
项目所要达到的具体目标如下:
第一,非零售客户评级打分卡评估:对银行现行非零售客户评级打分卡的表现进行整体评估,清晰、客观分析银行评级打分卡存在的缺陷,提出打分卡优化的范围和具体实施方案。
第二,非零售客户评级打分卡优化:对银行重点非零售客户评级打分卡进行优化,提出优化建议及打分卡优化的系统需求,使银行优化后的打分卡及系统更加贴合银行业务实际,为银行信贷业务中信用风险的有效控制提供科学、客观、高效的工具支持。
非零售客户评级打分卡优化项目的内容
项目的工作内容主要包括以下几个方面:
(一)对银行现行非零售客户评级打分卡的表现进行整体评估。通过审阅前期的开发文档和对总分行打分卡使用相关情况的调研,对打分卡的开发以及推广和使用中的问题进行分析,整体评估打分卡的表现,提出打分卡优化的范围和具体实施方案。
(二)对银行重点非零售客户评级打分卡进行优化。根据评估结果,针对排序能力、准确性、稳定性等表现不好,且客户数占比以及信贷余额占比较大的非零售客户评级打分卡,提出优化建议。
(三)结合行内信贷系统实际情况,提出业务需求,以便上述调整能够落地实施。
(四)结合优化后的非零售客户评级打分卡体系,对银行的非零售客户评级相关政策、制度和流程进行审阅,并提出修订建议。
(五)基于优化后的非零售客户评级打分卡体系,提出持续验证和优化的数据需求和数据管理标准,以便银行能够持续收集相关数据,用于后续的打分卡验证与优化。
项目内容主要包括以下两个模块:
模块一:非零售客户评级打分卡评估与验证。通过案头分析开发文档和对总分行相关情况的调研,对现行打分卡的表现进行定性评估和定量验证,根据非零售客户评级打分卡上线以来的使用情况,对评级结果表现不好且客户数占比以及信贷余额占比较大的打分卡进行重点优化,并确定优化的主要方面和主要内容。
模块二:提出现行打分卡的优化建议。对模块一工作中所选定的打分卡设计具体的优化方案和优化策略,包括指标调优和权重调优的建议。优化过程将采用专家判断计量模型开发方法。
项目解决方案的总体架构如下图所示:
图2.1 项目解决方案架构
2.3非零售客户评级打分卡评估与验证
本模块将通过审阅前期的开发文档和对总分行相关情况的调研,明晰客户评级打分卡开发的方法、策略和流程,对打分卡的检验以及推广和使用中的问题进行分析,掌握客户评级打分卡上线以来的评级情况,提出打分卡可以优化的领域,最终形成打分卡优化的建议书。
对低违约组合如何进行验证和评估,是目前业内的难点,也是监管机构对信用风险内部评级体系进行审查的重点内容。可参考国际国内银行业对低违约资产组合验证的观点,按照监管要求,探索研究银行低违约资产组合的评估验证方法,并选取合适、科学、合理的验证方法对银行现行打分卡进行定量验证和定性评估。评估验证框架如下图:
图2.2 评估验证框架
2.3.1 定量验证的方法
1)区分能力验证:确保模型能够按照债务人风险大小有效排序。模型区分能力将采用不少于两种方法进行检验,包括监测累积准确曲线(CAP)及其主要指数准确性比率(AR)、ROC曲线及AUC系数和KS检验结果等。
累积准确曲线(CAP)及其主要指标准确性比率(AR)主要用来检验模型对违约和非违约客户进行正确区分的能力。
CAP曲线的原理是,首先自高风险至低风险排列模型的分数,即模型分数从低至高;横坐标X表示客户总数的累计百分比;纵坐标Y表示违约客户的累计百分比;横纵坐标的关系在于在CAP曲线上,评级风险较高的X%客户,占违约客户的Y%。即纵坐标描述了评级分数小于或等于(一般选取等于)相对应横坐标X的违约个数百分比。一个有效的模型应当在样本客户处于同一排除率的情况下,排除更高百分比的坏客户。AR(准确率,Gini系数)的定义为模型的CAP曲线和45度线间的区域面积,与介于45度线和完美模型的区域面积的比率,这个值越接近1,表示模型的效果越好。应用CAP曲线和AR比率方法, 对于每一个验证期, 得到一个CAP曲线图和一个AR比率。通常情况下, AR值越接近1越好,说明验证的模型对于违约客户的区分能力很好。
在业界, 对于AR比率没有一个标准的衡量尺度。一般来说,AR值大于40%都是比较好的。下图为CAP曲线示意图:
图2.3 CAP曲线
ROC曲线及AUC系数主要用来检验模型对违约和非违约客户进行正确区分的另一种方法。ROC曲线描述了在一定累计好客户比例下的累计坏客户的比例。其原理是通过选定的评分判断债务人在下一个期间是否违约,决策者通常使用的一种方法是设定临界值C,评分低于C的债务人为潜在的违约客户,高于C的债务人为非违约客户。
在最佳模型下,无论临界值C的取值,模型的命中率是100%, 因而最佳模型的ROC曲线是一条纵坐标为1的直线。在随机模型下, 基于任一临界值C,其正确区分违约和非违约客户的几率是50%, 故ROC曲线表现为45%的直线。待评级的预测模型的ROC曲线即分布在随机模型和完美模型之间。待评级的预测模型的区分能力越强,ROC曲线越往左上角靠近。AUC系数表示ROC曲线下方的面积。AUC系数越高,模型的风险区分能力越强。AUC系数表示ROC曲线下方的面积。ROC曲线越往左上,即ROC曲线下的面积越大,表示该模型的正确性越好。ROC曲线下面积的大小可以作为模型预测正确性高低的评判标准。
根据相关的研究,若曲线下的面积为0.5,则代表模型不具区别能力;若曲线下面积为0.7-0.8,代表模型的区别能力是可接受的;若曲线下面积为0.8-0.9,代表模型有很好的区别能力;若面积在0.9以上,则代表模型有相当优越的区别能力。下图为ROC曲线示意图:
图2.4 ROC曲线
K-S检验主要是验证模型对违约对象的区分能力,通常是在模型预测全体样本的信用评分后,将全体样本按违约与非违约分为两部分,然后用KS统计量来检验这两组样本信用评分的分布是否有显著差异。
运用KS检验来验证模型能否区别出违约户与正常户,当两组样本的累积相对次数分配非常接近,且差异为随机时,则两组样本的评级分配应为一致;反之当两组样本的评级分配并不一致时,样本累积相对次数分配的差异会很显,如下图所示:
图2.5 K-S经验分布曲线
2)准确性验证:采用不少于两种方法分析实际违约频率与违约概率估值的吻合程度,包括二项检验、卡方检验、正态检验等方法。
二项检验是验证内部评级体系各级别违约概率估计值的一种有效方法,其前提是每个级别下违约事件是相互独立的,在应用时应注意每次只能应用于一个评级级别。
卡方检验验证模型不同风险级别PD值与主标尺匹配程度,可以一次同时对多个级别进行检验,但样本需要满足独立性(违约事件在风险级别之内和风险级别之间相互独立)以及呈正态分布的假设。卡方检验的P值可以用来估计违约概率的准确性,P值越接近0,准确性越差。
3)检验违约概率估值在时间和客户群变动情景下是否具有稳定性。常用方法包括迁徙矩阵方法等。
转移矩阵分析是假设在最稳定的模型,在其它条件不变下,同一评级客户前后期的评级等级应当维持不变。对于转移矩阵方法,因为只用一个转移矩阵无法给出评级模型效果的很多信息,所以需要比较在不同时间段的转移矩阵以衡量模型效果。将转移矩阵情况与宏观经济情况比较可以发现模型表现的问题,例如在经济增长时期却发现评级结果有向更差等级转移的趋势,说明模型本身可能存在问题。
2.3.2定性评估的方法
主要包括违约定义评估、打分卡开发数据评估、开发过程评估、评级结果评估等。定性评估的方法和步骤下图所示:
图2.6 定性评估的主要步骤
2.3.3 低违约资产组合的验证
根据新资本协议实施工作组的验证工作组(AIG-V)的研究(巴塞尔委员会第六期新闻公报,2005年9月),银行资产组合是在低违约和高违约两类状态之间连续变化的。当银行内部数据系统包含了较少的违约事件,则资产就更接近于低违约状态,这对风险参数量化即风险计量和验证工作都构成了挑战。
目前,业界的最大担忧是缺乏足够的统计数据,因此导致了风险参数返回检验的困难,使得低违约资产组合(客户)难以运用内部评级法。基于业界的担忧,AIG-V在2005年9月发表了一篇新闻公报,其中阐述了违约数据的缺乏并不能使得低违约资产组合排除在应用内部评级法之外。
目前,对低违约资产组合的验证,已有成熟的方法前期应用于国内外银行的实践之中。目前业界所采用的主要验证方法如下图:
图2.7 低违约资产组合验证方 56 27744 56 15756 0 0 811 0 0:00:34 0:00:19 0:00:15 2905
上图所列示的验证方法中,内外部基准测试是低违约组合验证工作中最常运用的验证方法。基准测试(benchmarking)是内部评级的估计结果与内外部可观察信息(公开或非公开)之间的比较。对于内部评级体系来说,可观察的公开基准包括例如:标准普尔、穆迪等评级机构给出的评级,这些是主要的评级机构,所以被评级公司的详细信息是可以得到的,从而检查和分析评级体系是可以实现的。非公开的基准是银行内部或监管当局采用的基准等一般不对外披露。
这里内外部基准被隐含的认为具有某种特殊的可信度,如与外部基准有偏差就应检查内部的估计值。在该方法下,外部基准用来对内部估计值进行校准或者验证。需要注意的是,由于确定绝对的基准很困难,所以使用基准时应小心。针对低违约组合的验证步骤如下图所示:
图2.8 低违约资产组合验证步骤
银行违约客户数量稀少,传统模型评估的返回检验方法只能得出有限的结论,在这种情况下,基准测试可以检验低违约资产组合评级模型的区分能力。通过比较评级模型和基准模型对相同债务人评级结果的相关性进行验证。因此,如果银行的违约客户数量和数据质量不够理想,建议采用基准测试的方法对风险评估模板的区分能力进行验证。如果银行客户缺乏外部机构的评级数据,也缺乏可信度较高的市场数据,不易获得外部基准数据,建议采用内部专家基准测试的方式对风险评估模板的区分能力进行验证。具体验证步骤如下:
第一步,确定测试样本客户行业和清单
根据银行提供的历史客户及现有客户的行业分布情况统计表,综合考虑各行业的客户数量占比和信贷余额金额占比情况,从中筛选出几个主要的行业,并分别确定了各行业的测试样本客户数量。
第二步,确定内部业务专家对客户信用水平的排序结果
内部专家基准测试的方法对专家的要求较高,选择业务经验丰富、熟悉市场环境、了解客户风险特征的业务专家,是确保基准测试结果合理性的关键。经过确定的专家根据银行评级框架的评级定义,为测试样本客户进行专家主观认定评级,并按照主观认定评级结果为测试样本客户进行排序。上述排序结果作为内部专家基准测试的“专家基准”,并以此为基础进行基准测试。
第三步,计算基准测试量化结果Spearman秩相关系数
通过基准测试评估打分卡对债务人的评分结果与专家的排序结果的相关性,正相关性高代表风险评估模板对客户信用水平的排序能力良好,反之亦然。
根据定量验证与定性评估结果,选取评级结果表现不好且客户数占比以及信贷余额占比较大的打分卡进行重点优化,提出优化建议。
如果您觉得本文对您有帮助,欢迎您推荐给朋友,您的支持和鼓励是我们前进的动力,点击本平台最左侧菜单“往期精华”或“回复数字“m"查看本平台精华文章目录,点击下面链接直接查看相应文章。
1、本平台230篇精华文章汇总!
5、祝言抒:超实用的小微客户信用评估模型——指标、权重及实例,
11、信贷员如何写好年终总结?
信贷风险管理 ∣一个有用的公众号
简介:专注信贷风险管理,内容涉及银行、小贷公司、担保、民间借贷、P2P网贷等热门领域,22万优质用户关注,包括高管、客户经理、风控、法务等,每日分享行业资讯、业务知识和法律实务文章,内容实操、实战、实用,只分享对您有价值的内容,还在等什么,长按上面二维码赶紧关注吧!
点击“阅读原文” 查看平台历史信息
↓