穆长春：征信不是超级警察

穆长春 IMI财经观察 2022-05-03

近日，中共中央、国务院发布支持民营企业的28条意见，其中明确提出“要进一步规范失信联合惩戒对象纳入标准和程序，建立完善信用修复机制和异议制度，规范信用核查和联合惩戒”。中央文件发出了纠偏的信号，意味着目前无限制扩大化的失信联合惩戒措施将受到规制。IMI学术委员、中国人民银行数字货币研究所所长穆长春就征信问题，对大数据和征信的关系、信用评分的来源和如何使用信用评分发表个人观点。

以下为文章全文：

大数据的推导结果是相关关系，并非因果关系

什么是大数据（big data）？大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据就是巨量数据集合，包括结构化、半结构化和非结构化数据。其中，非结构化数据越来越成为数据的主要部分。因此，大数据无法用单机进行处理，必须依托云计算进行分布式处理。大数据分析是将实时数据流分析和历史相关数据相结合，然后分析并发现其中隐藏的模式、相关性、趋势、偏好等等，并建立所需的数学模型，就是找规律，并运用从过去数据中得到的规律，来预测未来。需要注意的是，大数据分析模型显示的是数据相关关系，并不是因果关系。这两者有何区别，举例而言：有人收集了一年内冰激淋销量与溺水死亡人数的大量数据，发现冰激淋销量高的月份里，溺水死亡的人数就多；冰激淋卖的不好的月份里，溺水死亡的人就少。这能不能得出结论：为了减少溺水的人数，这些月份里不要卖冰激淋了？大家都知道：绝对不行！这是因为，冰激淋销量和溺水死亡人数的关系，只是相关关系，并不是因果关系！那么大数据分析到底能不能应用在征信上？是李逵还是李鬼？根据前述，“个人信用数据基本上是指借债还钱的数据”，从性质上来说，征信数据必须是与合同、契约有关的因果关系数据。如果在征信模型中应用大数据分析，需要把一个人方方面面的信息都收集起来，包括本人信息、生活习惯、社交关系等等，大而全、细而精，恨不得无孔不入、挖祖宗三代，然后对大量的相关数据进行分析，来找到做信贷决策的模型。但需要强调的是，这是相关关系，不是因果关系；以大数据分析建立的征信模型并不符合金融基础设施的信息收集原则！而且这些非金融信息的行为数据既不能用于分析一个人的还款意愿、也不能用于判断借款人的偿还能力。再比如，一个人闯了红灯，不遵守交通规则，这个数据算不算信用数据？如前所述，征信数据用于预测一个人在非即付并无抵押的经济活动中是否守约。由于这个闯红灯的人之前并没有向任何人承诺遵守交通规则，并不能算失信；同时，这个行为数据与经济活动无关。所以，开车闯红灯可以开罚单扣分，走路闯红灯可以罚款，帮助协警管理交通，但这种数据不能用于征信！又有人说，“通过我们对各种大数据的研究，我们发现，很多看起来与信用没关系的事件之间，是存在着关联的。”按他这个逻辑，这不是征信数据，属于大数据。假如根据大数据分析，有可能发现爱闯红灯的人，还款的信用表现确实不怎么样，但这只能证明两者的相关关系，而不是因果关系。因为如果在这个爱闯红灯的人每天必经路口全修上立交桥，他再也不用闯红灯了，那么，他的信用分或者信用表现就会因此提高。而如果银行据此进行信贷决策，贷款就可能会打水漂。正像冰淇淋和溺水死亡率的例子一样，就算其中存在强相关性，也不能拿闯红灯的数据去判断一个人的信用，更不能用于征信。同样，如果一个人开车闯红灯或超速，吃了罚单，交通局再三催促也不交罚款，甚至这一记录被移交给催债公司。这个数据算不算信用记录？大多数人觉得这个算，比如美国征信局就收集这个数据。但准确地说，美国征信局曾经收集过这些闯红灯的数据，那些不交罚款的司机的信用评分会下降。但是2016 年 6 月，美国三大征信局和 31 个州的检察长们达成庭外和解，个人征信机构不得收集任何与合同或协议无关的付款信息，包括罚款、罚单等数据。因为征信机构在收集这些闯红灯的行为数据时，数据质量可能存在问题，比如拍照机器误读、数据不准、缺乏证据等，这违反了消费者保护法中关于行业欺骗和不公平操作的有关条款，将面临整顿和600万美元的罚款。而且，前述和解协议的效力是可以回溯的，就是说征信机构之前收集的那些记录都将删除。这个和解协议对征信业的影响是深远的。对于征信机构来说，权力受到约束，而消费者的征信权益则受到了保护。再举个例子，超级网购的大买家和“信用好”这两者是否存在相关性，这还需要数据验证。但可以确定的是，这两者之间根本谈不上因果关系。这不仅不符合征信原则，还对无网购行为的消费者和其他网购平台的消费者造成了歧视。如果仅仅因为闯红灯或者没有网购被剥夺借贷权利，就如同要降低溺水死亡率而禁止销售冰淇淋一样可笑，老百姓的征信权益因此受到侵害。所以说，大数据分析用于征信是有边界的，因为要保护消费者权益，反对不公平竞争。

信用评分怎么来的？

一个人在征信机构里的数据是很多的，信用报告内容很丰富，包含了这个人在过去几年的信用记录，审贷人员从头到尾看一遍要花不少时间，如果两个审贷人员去看同一个申请人的信用记录，就算他们是双胞胎，也很有可能会由于个人的经验和主观判断不同而得出不一样的决定。所以，单纯用信用报告来做决定，既不能达到审批标准的一致性，也无法提高效率，毕竟个人信用产品的申请人数目特别大，信贷审核成本也会无法承受。于是，信用评分闪亮登场！信用评分，指的是征信机构在收集了数据以后，通过对信用记录数据的清洗、加工和分析，输入到数学模型里得到的一个非常直观的分数。根据传统习惯，分数越高越好，高分表示信用风险低。分数的范围是可以事先界定的，萝卜青菜，各有所爱，有人喜欢百分制，有人喜欢 300-900 这个范围。信用评分模型是怎么得来的？首先，巧妇难为无米之炊，做饭需要原材料。开发数学模型的原材料，就是信用数据。一个人的信用数据有很多项，比如：这个人有几张信用卡、信用卡的最早开卡日期等很多“变量”。在开发数学模型的时候，不仅仅会用收集来的变量，还会根据已有数据再加工出来一些变量，比如：最早的信用卡开卡日期距今天的天数等。至少涉及上千个变量。接下来，数学家们要决定需要开发多少个数学模型。举个例子，信用污点严重的、轻微的和没有信用污点的就需要分开建模；信用历史比较长、刚有信用记录的菜鸟，也需要分开建模。确定好建模型对象和建模数量之后，数学家要确定模型变量和参数，他们不会把所有的变量都放进模型，并不是因为算不过来，而是因为变量之间的关系比较复杂，有的变量之间互相干扰；也有的变量需要进一步考察再决定，比如，如果一个人的信用记录在一段时间内被查询了很多次，说明这个人可能最近很缺钱，是比较负面的信息，会带来信用评分的下降；但是在进一步考察后，应剔除来自招聘单位的查询，因为招聘单位查个人信用的目的并不是要给他贷款。此外，有些变量值需要做组合，比如上个月实际还款金额占应还款金额的百分比，就需要分成从 0 到 100%之间好几档，而不是直接用百分比。这种组合分档是为了让使模型更加稳健，不至于因为一点小变化带来分数的大幅度变动。最终进入到一个模型里的变量在 10-20 个之间。建好一个数学模型，把各种参数和模型使用的条件都输入到电脑系统里，就像做了一个“月光宝盒”。根据个人情况选定适用模型，算出来一个分数。金融机构根据分数的高低来决定是不是贷款，收多少利息，贷款多长期限等。究竟哪些因素是信用评分模型中最重要的，是不是网购时多买点东西就能改变我们的信用评分呢？再举个例子，根据公开信息，著名的 FICO 评分是这样算的：35%的信息来源是个人还款记录，30%是欠款金额，15%是信用历史长度，10%是信用产品类型，10%是近期内开始使用的信用产品。怎么来理解FICO 评分中信息来源的构成？对信用评分的正确解读是：对那些与贷款申请人有类似信贷行为表现的人，根据按时还款比例的高低，类推该申请人将来按时还款的可能性高低。请注意，信用评分高的张三不一定会按时还钱；而信用评分低的李四也不一定就一定不会按时还钱。只能说，信用分高的张三，将来按时还钱的可能性高，信用分低的李四，将来按时还钱的可能性低。于是，银行就设个分数线，低于这个分数线的人都不给贷款。同理，银行的行长也不一定信用分就高，因为信用分从来就不是近水楼台先得月的事。所以信用分是个历史表现的标尺，相对稳定，不会大起大落。所谓“青山易改，本性难移”，要提高自己的信用分，要靠多年的表现好换来的。如果说一个征信公司的信用分，可以靠在一个购物平台血拼一个月暴涨，这不叫信用分，这是网购积分。

如何使用信用评分

《西游记》里有一个故事，唐僧师徒过平顶山，遇到金角、银角大王拿着紫金葫芦和净瓶，把悟空装了进去。后来悟空从里面出来，用一个假葫芦换了妖怪的宝贝。那么信用评分是不是个无所不能的宝葫芦呢？最近几年，中国的一些机构发明了信用评分的新用途：比如信用评分高的人可以走快速安检通道；信用评分高的人可以快速拿到某国签证；信用评分还被用于征婚平台，说评分高的人肯定会是个浪漫的人，可以托付终身。但是这真的靠谱吗？通常，数学模型的使用原则是，在什么数据条件上开发出来的模型，就在什么数据条件下使用。拿上面的例子说，即使模型采集了安检的历史数据，放在评分模型里，也不能完全决定是否此人在未来可以走快速安检通道，更何况信用评分并不是安全评分。假如这个信用评分高的人是个恐怖分子呢？而前述诸多怪现象，无非是为了夸大其信用评分产品的作用，属于误导消费者的娱乐化营销，甚至侵犯消费者的权益。首先，信用评分这个宝贝不是随便一个路人甲拿来就能用的，使用者主要是信用产品的提供者，比如银行、信贷公司等。这些放贷机构通常在四个方面使用信用评分。第一个方面是信贷决策。比如，银行收到信用卡申请表之后，去征信局查申请人的信用报告，然后做出是否发卡的决定。银行如果希望获得风险很低的客户，就设定一个较高的征信分及格线，如果银行愿意多承担一些风险，就可以降低及格线。这里要注意了，根据征信业的最佳实践，对金融机构依据信用评分做出的不利决策，贷款申请人有知情权。如果金融机构拒绝贷款申请，要给出原因，就是要把模型里丢分最多的变量内容告知申请人。实践中，征信局在提供信用评分的同时，会提供几个代码，表示申请人丢分多的评分项，银行会把这些代码所代表的含义翻译成大白话告诉申请人，比如：“你最近开了太多新信用卡”，但不能仅仅敷衍说评分不及格。此外，银行还会书面告诉申请人：如果觉得告知信息不对，可以去征信局申诉。另外，拒贷的原因不能与性别、年龄、种族、出生地等有关，这可能涉及歧视。比方说，银行不能因为有人姓穆罕默德而推测这个人的种族或宗教，然后拒绝信贷申请。换句话说这些因素也不能用于征信评分。第二个方面，是判定现有客户整体信用风险。金融机构一般只知道客户在本行的信用状况，要了解整体信用风险，一种方法是查询客户的整体信用报告，但价格贵，也看不过来。比较简单的方法是定期查询现有客户的信用评分，并重点关注评分快速下降的客户。因为这种客户很可能拖欠其他银行的钱了。第三个方面，是选择催收方式。对于有拖欠行为的客户，银行要根据其信用评分决定是自己花时间、精力催收，还是按分数高低定好价格，把贷款转卖给催债公司。第四个方面，是市场营销。这种应用比较复杂，也容易造成误解。举个例子，一家放贷机构，推出了一个信贷产品，目标客户是信用评分 600-700 分之间的中等风险的人。但根据消费者保护规定，征信局不能直接提供符合条件的客户名单，放贷机构只能委托征信局把促销信息发给符合条件的客户。这个过程要有第三方监督，以确保合规。除去以上四个方面，信用评分一般来说是不能用于其他领域的，也就是说，信用评分并不是什么都还能做的“宝葫芦”。比如，信用评分不能用于招聘，这种做法会让目前没钱还债的人找不到工作，会因此被截断收入来源，相当于遭到双重惩罚。可见，用大数据做征信就像“从公牛身上挤奶”，是否能得出准确的结果值得商榷，但是，这些大数据可以用来做内部风控，由于不属于公共产品范畴，只要能够保护消费者权益，不造成隐私保护问题和信贷歧视，可以根据企业自身的决策来决定。

编辑王偲竹

来源财新网

责编金天、蒋旭

监制朱霜霜

点击查看近期热文

王国刚：补短板是中国经济发展的重心

视点 | 从金融市场基础设施建设看数字金融的前景展望

赵锡军：坚守使命持续完善资本市场建设

视点 | 中国版“监管沙盒”如何设计和实施？