杨明:知识图谱在反欺诈领域的应用实践
随着互联网的快速发展,电子银行、网络支付、互联网贷款等互联网金融业务为客户带来了更加便捷地服务与体验,互联网也逐渐成为各家银行为客户提供金融服务的主要渠道。与此同时,由于互联网业务的特定商业模式,其业务发展过程中长期面临种类繁多的欺诈风险,如电信诈骗、网络钓鱼、撞库攻击、薅羊毛、商户欺诈、黑产中介等各类欺诈行为与欺诈事件,复杂多变、快速蔓延,并呈现出产业化、组织化的发展趋势。该类风险一旦发生,影响范围迅速扩大,且难以进行事后追踪与弥补。
重庆富民银行风险管理部总经理 杨明
充分应用金融科技,武装智能风控大脑
重庆富民银行(以下简称“我行”)业务规模持续扩大,客户借款需求不断增加,面临的恶意欺诈风险越来越高。互联网金融欺诈普遍存在黑产化、专业化、高频化、关联化四个典型特征,也更具有隐蔽性。为此,搭建各类数据互联与互通的反欺诈系统势在必行。在反欺诈技术发展过程中,“知识图谱”因其智能、高效的知识组织优势,能够帮助用户快且准地查询、关联、挖掘潜在信息,被广泛应用于反欺诈领域。为提升我行反欺诈能力,降低欺诈风险,我行开始探索、研究、构建知识图谱,将海量结构化、半结构化,甚至非结构化信息实现自动化的利用,为我行反欺诈应用决策提供更精准、更可靠的依据。
小步快跑,持续迭代反欺诈知识图谱
我行从2019年4月份启动知识图谱项目以来,持续迭代完善知识图谱,深化其在反欺诈领域的应用。经过两年的不断迭代优化,知识图谱已应用于业务贷前、贷中、贷后全流程各环节。
1.构建关联模型。结合我行项目场景和反欺诈业务需求,确认实体、实体间关系及其属性,即知识图谱需要展示的实体、实体间所属关系、实体和关系的属性。目前我行知识图谱包括20余种实体、30余种实体间关系,数据量已达亿级。
2.开发知识图谱预警平台。基于异常关联指标,开发知识图谱预警平台,并在预警平台内配置关联规则,实时扫描客户风险,如遇指标异常,将关联风险及时向相关人员提示,实现风险早阻断。
3.计算实体间关联关系的关联权重,识别实体间的紧密程度。针对已识别出的团伙欺诈的标签客户,为了找出影响力最大的节点,科学量化各实体欺诈关联的影响程度,例如应用中心度算法PageRank,识别欺诈源头。
4.上线可视化应用。结合我行业务情况,知识图谱分析平台主要功能包含关联分析查询、关联路径查询、指标计算查询。关联分析查询提供智能搜索功能,查询目标实体的多度以内的关联关系;关联路径查询,可计算多个实体间的最短或全路径;指标计算查询,计算目标实体的关联率、触黑率等指标。为便于业务人员开展欺诈分析,开发了具有较强易用性的可视化操作界面。系统功能因其可视化、便捷性,已作为调查辅助工具帮助欺诈案件调查人员进行深层次的风险排查。在日常工作中,如发现疑似欺诈案件,调查人员将通过知识图谱分析平台进行初步风险甄别及欺诈挖掘,帮助调查人员厘清疑似欺诈人员的关联关系,提升工作效率。
5.制定和开发关联指标接口及其标准模块,构建知识图谱策略体系。基于知识图谱技术,开发关联指标接口用于贷前实时审批策略以识别客户的关联风险,为我行搭建关联网络策略体系。当前用于反欺诈策略的关系网络指标有120多个,主要包含设备关联、IP关联、地址集中度关联、联系人关联、身份证关联、手机号关联等维度。
图 知识图谱在反欺诈领域的应用实践
创新反欺诈技术,实现高效精准风控
1.打造数据实时传输的高效能知识图谱平台。我行利用canal技术实时抽取实体和运用Kafka传输消息,打造数据实时传输的高效能知识图谱平台。与传统知识图谱平台相比,我行实时知识图谱平台可以实时传输客户行为及信贷交易数据,实现关联关系的实时查询,用于风险评估,从而有效侦测欺诈风险。在响应速度方面,通过一系列的优化,知识图谱预警功能可实现3秒以内准实时告警。查询目标实体的关联关系,3度以内实现毫秒级查询。查询多个实体间的最短关联关系路径,5度以内实现毫秒级查询。基于知识图谱技术,设计和开发了近百个关联风险指标,输出标准的API接口,其性能TPS>300,为业务提供有力支撑。
2.提出地址相似度计算方法。因部分前端客户填写的地址不标准,无法直接区分多个地址是否是同一地址,需进行地址相似度匹配,识别地址异常集中度风险。最初直接计算两个地址的经纬度距离,因计算复杂度过高,效率低下,无法应用到信贷策略。如果用传统的编辑距离算法(EditDistance)、n-gram算法,地址相似度计算结果准确率低。为解决前述问题,我行通过构建地址树,优化了地址模糊匹配算法,极大提升计算效率,可应用到信贷策略和异常集中度预警方面,扩大了项目的应用范围。
知识图谱赋能反欺诈业务,
助力精细化反欺诈运营
我行已将基于知识图谱的反欺诈策略部署到贷前、贷中、贷后反欺诈策略中,关系网络指标已覆盖全行项目。在实践过程中,截至目前,通过关系网络规则触发的关联风险客户转到人工进行欺诈调查的案件数为3293笔,经人工排查,确认欺诈389笔,确认的欺诈率为11.8%,涉及金额数百万元,通过提前预警并介入清收,有效减少了欺诈损失。
下一步重点工作
下一步,我行将继续深化金融科技工具的应用,持续迭代知识图谱,丰富知识图谱的功能,提升智能风控水平。一是定义和识别可疑团簇,分析知识图谱演绎团簇的形成过程,挖掘欺诈团簇的形成过程,深入理解欺诈团伙形成路径,制定有效策略拦截欺诈客户,反哺贷前策略。二是基于无监督学习的异常关联点检测,智能挖掘可靠关联变量,提供可靠有效的风控变量。三是制定节点权重,计算欺诈团伙分,输出欺诈团伙报告。四是丰富反欺诈评分卡的入模变量维度,基于知识图谱技术,开发关联关系衍生的特征变量,提高识别欺诈行为的准确性和有效性。
(栏目编辑:韩维蜜)
推荐阅读
(点击图片查看精彩内容)
精彩内容回顾
(点击查看精彩内容)
■ 会议预告丨2021长三角数字金融论坛,5·20数智相约!
■ 案例丨夯实科技赋能风控,同盾云图助力商业银行精准打击信用卡套利
《金融电子化》新媒体部:主任 / 邝源 编辑 / 傅甜甜 潘婧