查看原文
其他

观点 | 自然语言处理技术在反洗钱监测分析中的应用展望

金融电子化 金融电子化 2023-01-22

欢迎金融科技工作者积极投稿!

投稿邮箱:newmedia@fcmag.com.cn

                                              ——金融电子化



      

文 / 中国反洗钱监测分析中心  李莉   孔繁颖   张煜   赵姗姗

近年来,国内和国际反洗钱形势均发生了复杂而深刻的变化。从国际角度,反洗钱工作重心由“规则为本”转向“风险为本”,有效性与合规性并重日渐成为国际共识。从国内角度,洗钱相关犯罪呈现高发多发态势,同时犯罪分子利用数字手段筹集、转移或分散资金,掩饰违法活动,客观上加剧了打击洗钱和恐怖融资行为的挑战。此外,我国仍处于第四轮国际互评估的后续整改阶段,金融行动特别工作组(FATF)的40项建议和11项直接目标也对我国提升反洗钱监测分析能力提出具体要求。与此同时,以自然语言处理为代表的新兴科技也为反洗钱和反恐怖融资事业发展带来新机遇。2021年7月,FATF发布研究报告《反洗钱和反恐怖融资创新科技带来的机遇和挑战》,系统论述反洗钱和反恐怖融资事业应用新技术的机遇和挑战,并推选出以自然语言处理NLP为代表的五大新兴科技(包括NLP、人工智能AI、分布式账本技术DLT、客户尽职调查数字化解决方案和应用程序接口APIs)最有潜力提高反洗钱和反恐怖融资的有效性。


自然语言处理是人工智能的核心能力

自然语言处理,即帮助计算机理解、解释和使用自然语言,一般细分为自然语言理解(NLU)和自然语言生成(NLG)。现实应用中,由于自然语言的抽象性、组合性、歧义性、进化性、主观性、知识性,让计算机真正理解和处理自然语言是信息时代的艰巨任务,也是人工智能的重要分支和研究方向。一般认为,人工智能发展会经历计算智能、感知智能再到认知智能三个阶段,其中在实现从感知智能到认知智能的跨越时,自然语言处理是核心能力。自2010年至今,在海量数据、超强算力和深度学习的推动下,自然语言处理在机器翻译、问答系统、自动文摘等多个现实应用中均取得良好成效。


自然语言处理是国际FIU数字化转型的主要科技手段

近年来,世界各国FIU(金融情报机构)都在积极实施数字化转型,应用新兴科技和高级工具提升反洗钱和反恐怖融资能力。自然语言处理技术作为文本解析和处理的支撑工具,在反洗钱监测分析“数据分类”“数据融合”和“数据分析”等重要业务中发挥关键作用。例如,德国FIU引入自然语言处理提取可疑交易报告的文本特征,并应用在二元分类模型中,对可疑交易报告风险领域和风险等级进行分类;马来西亚FIU应用自然语言处理技术,应对大数据量情况下的模糊检索和链接分析;加拿大FIU通过自然语言处理技术提取可疑交易报告中的概念作为标签,大幅提升可疑交易报告的检索能力和效率。


自然语言处理是提升我国反洗钱监测分析效能的重要推力

在我国的反洗钱监测分析场景中,自然语言文本类数据占有相当比重,例如大额交易报告中的客户名称、资金用途、交易备注,以及可疑交易报告中的疑点分析、资金交易及客户行为情况和附件等。相较于易于检索分析的结构化数据,文本类数据凝结了大量的洗钱风险信息,其监测分析辅助的价值极高,但是对数据的处理分析难度较大。


在传统监测分析场景中,对文本类数据的处理分析主要依赖专家的人工研判。这种筛查方式不仅耗费大量的分析资源,而且由于研判视野有限,难以有效整合数据并发现全局性和趋势性风险。而自然语言处理技术能够有效提取、分析和组织文本数据中隐匿的洗钱风险信息,提高反洗钱监测分析工作的全面性、精准性和有效性。


自然语言处理在我国反洗钱情报分析中的优势场景

为探索自然语言处理技术提升反洗钱监测分析能力的可能路径,本文通过爬虫工具获取裁判文书网2014~2020年度刑事案件公开判决书近万条,并从中提取案件背景信息作为反洗钱可疑交易报告的模拟数据,创新性开展四个应用场景的实证展望。


1.可疑交易报告信息挖掘,充实情报网络。传统结构化反洗钱信息构建的情报网络仅包括资金关系、账户关系等,缺乏主体工作单位、职务等社会背景信息以及可能的涉案信息,难以完整勾勒被查主体的社会网络、资金轨迹和可疑行为。而自然语言处理中的信息抽取技术,支持从可疑交易报告中自动提取、分类和完善主体、关系、事件,充实反洗钱情报网络。此外,信息抽取还可应用于公开舆情信息的提取和补充,提高对外部关联信息的有效利用。例如,从某判决书公布的洗钱案件背景信息有效提取主体信息,并以结构化知识图谱呈现,补充反洗钱情报网络,提升反洗钱监测分析的全面性和有效性。


2.可疑交易报告主题分类,完善推荐机制。可疑交易报告是反洗钱监测分析的重要风险研判资源,但是错误的、防御性的报告混杂其中,占用监测分析资源。特别是涉罪类型定义不准确,容易误导监测分析方向。而自然语言处理中的主题分类模型,支持对反洗钱可疑交易报告进行准确主题分析,完善可疑交易报告推荐机制,充分发掘长尾效应。例如,LDA文本主题模型(Latent Dirichlet Allocation,又称“隐含狄利克雷分布”)支持对裁判文书网的案件背景信息进行清晰明确的主题区分,以构建可疑交易报告个性化、主题化的推荐机制,助力挖掘涉案主题鲜明、情报分析价值高的可疑交易报告,优化资源配置,提升监测分析能力。


3.可疑交易报告质量评级,助力线索分析。反洗钱监测分析实践中,有限的人工分析资源与海量的可疑交易报告之间的现实矛盾,推动构建可靠的可疑交易报告质量评级机制,以支持分析资源集中于优先级更高、情报分析价值更大的可疑交易报告。自然语言处理中的文本分类等技术天然适用于这一任务。例如,应用自然语言处理技术和机器学习模型,分别构造文本信息抽取判别模型、自然语言流畅度评分模型和文本分类准确度判别模型等对可疑交易报告进行分项评价打分,最后再通过集成学习模型(如图所示)对可疑报告质量进行综合评级打分,完善可疑交易报告质量评级机制,提高反洗钱监测分析的质量和效能。

图  可疑交易报告质量评价模型示意图


4.可疑交易报告文本分析,服务战略研究。随着“风险为本”的反洗钱监管原则日益成为国内外共识,战略研究成为反洗钱监测分析的重点工作。如何有效挖掘可疑交易报告中的风险研判资源,动态识别新的洗钱风险和业态,实时监测国家洗钱风险发展和变化,也成为反洗钱监测分析的重点课题。而自然语言处理中的文本分析技术,能够有效挖掘自然文本中隐藏的趋势性信息,监测宏观层面的洗钱风险变化,并进行多维度的比较碰撞。例如,关键词提取和词云展示技术支持概览、比较不同涉罪类型、不同时间维度的文本词云结果,推动更有效地落实“风险为本”的反洗钱监管原则。


总结与展望

当前,国内外反洗钱形势交织变化,对我国反洗钱监测分析能力提出更高要求。特别是洗钱分子利用数字技术隐匿、掩饰洗钱行为,跨行业、跨机构、跨账户的快速转移、分散资金,成为反洗钱监测分析面临的现实挑战。以自然语言处理为代表的新兴科技,支持有效挖掘反洗钱信息、自动区分主题类型、综合评价交易报告,以及监测、比较宏观层面的洗钱风险变化,提升反洗钱监测分析工作的全面性、精准性和有效性,打击洗钱类经济犯罪,维护国家金融安全与稳定。


后续,自然语言处理在反洗钱监测分析场景的落地实施,需要不断地完善,持续性探索创新。具体可从三个方面推进:首先,加强顶层设计和战略规划,明确目标愿景的同时审查现状,并确定获益最大的应用场景,逐步有策略地引入自然语言处理技术;其次,加强预研和试点,充分验证和调整以确保自然语言处理技术充分适配反洗钱监测分析场景,避免实施失误和资源浪费;最后,加强科技条线和业务条线的交流融合,注重复合型人才的培养,同时加强培训和外联,以紧跟自然语言处理技术的发展迭代。

(本文内容为作者个人观点,不代表所在单位意见)


(栏目编辑:韩维蜜)





往期精选:

(点击查看精彩内容)


● 观点 | 光大银行基于eBPF云可观测之路的思考

● 观点 | 夯实智能运维发展之基,赋能数字金融创新之路

● 观点 | 隐私计算:探索构建数据要素新生态

● 观点 | 特定养老储蓄试点丰富养老金融体系

● 观点 | 绿色金融数字化发展路径探索与实践










新媒体中心:主任 / 邝源  编辑 / 傅甜甜  张珺  邰思琪

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存