金融风控的护航员——聊聊ERNIE在度小满用户风控的应用
如今,随着技术的发展,对于普通消费用户来讲,想在网上借点钱花变得越来越容易,技术带给我们的便利性日渐突显。同时,随着消费金融的兴起,征信体系成为了消费金融公司发展背后的主要障碍之一,信贷欺诈大量涌现。这给金融行业的发展带来了极大的阻碍,致使很多借贷行为无法圆满解决。
这个问题有多严重?
央行发布的《2018年第三季度支付体系运行总体情况》显示,我国信用卡逾期半年未偿信贷总额880.98亿元,环比增长16.43%。
这意味着金融行业的风控需求异常迫切。面对更加下沉的客户群体、更加复杂的用户信息,既需要保证业务安全合规,也需要把控风控尺度和客户体验之间的平衡。
那么现在的金融机构是如何做这些的呢?
传统金融机构里会请金融风控师、审核员等对借贷资质进行人工审核,但该工作对相关从业人员的要求极高,既要有相关的背景知识能够对客户的资信状况做全面了解,又要求严谨认真,有独立的判断能力。同时,随着互联网金融的发展,每天在平台上发上的借贷行为数以万计,对于人力的消耗非常巨大,审核标准的统一性、效率都难以保证。
另外,传统的风控建模技术是基于小样本的监督学习,依赖于特征挖掘,需要耗费大量人力且依赖个人经验。同时,对于小样本的文本类数据处理往往缺乏对上下文的理解,无法提取其重点,导致对用户的理解出现偏差。
那怎么办?这些难题如何破?
度小满目前为用户提供教育贷和教育现金贷等业务,旨在“让每一个梦想有钱花”,帮助用户进一步深造自己或者学习新的职业技能,属于非常普惠的项目。
度小满本次与百度的合作,目标是将百度自研的持续学习语义理解框架ERNIE应用到度小满的用户风控场景中。
ERNIE通过建模超大规模数据中的词、实体以及实体之间的关系,能够学习到真实世界中丰富的语义知识,因而对于中文语义理解相较于传统神经网络更深入。预训练语言模型ERNIE蕴含丰富的语义知识,因而能够将其应用于需要文本语义理解的场景,只需将预训练ERNIE在少量的人工标注数据上进行Finetune,就可以得到一个任务定制化的ERNIE模型。定制化的ERNIE模型不仅学习到特定任务训练数据中的信息,还蕴含其预训练的语言模型信息,因此该模型能够达到非常好的效果。
在度小满用户风控场景中,通过ERNIE对用户行为信息进行语义层面深度建模,定制化产出一个用户风控ERNIE模型。利用ERNIE模型的长文本建模能力和预训练语义知识,结合小规模用户行为文本和用户风控标签的标注数据进行ERNIE精细Fine-tune,在训练2轮左右的时间内即可完成用户风控模型的收敛,而传统模型动辄需要训练100轮模型才能收敛。模型收敛速度提升50倍,由此可见ERNIE具有收敛快、拟合强、泛化好等优点。
基于ERNIE的度小满金融风控模型KS指标绝对提升1.5,AUC指标绝对提升1.5,优化了21.5%的用户排序,有效地提升了优质客群人数,有效地降低了贷款风险并且大幅度减少审核人力。
未来双方还将进一步深入合作,将ERNIE强大的语义理解能力应用到更多的金融领域应用场景中,如:金融获客、贷中管理等,助力金融行业的健康发展。