查看原文
其他

【数字技术·研究精粹】大数据时代的金融风险管理:新挑战、新思考、新技术

大数据时代的金融风险管理:新挑战、新思考、新技术

大数据时代人类的行为被各个系统有意无意甚至肆意地记录了下来,这些数据对人类金融活动产生了前所未有的影响。带有GPS或蓝牙的智能手机对人们在办公大楼、咖啡店、银行或ATM等场所的出入活动进行详细记录,基于轨迹的重合能够推断人们的社会关系;互联网上的搜索、点赞和浏览时间等信息被大量收集,用于用户的信用和偏好分析;轨道卫星拍摄的地面图像,能够用于分析建筑物的变化,评估企业、机构的经营状况。如今的金融业已经发展成一个复杂和不断外延的系统,不仅限于传统的银行和交易系统、股票和期货市场,更是延伸到新兴的数字货币、在线购物和支付系统,甚至与社交媒体和网络、政治活动以及物联网等形成交集。金融科技作为互联网、大数据和金融技术的结合,借助智能算法在支付、存款、贷款、投资、市场设施等各个领域催生出新业务和新商业模式,对传统业务产生巨大冲击的同时,给金融安全带来了隐患。例如比特币的流通成为一种潜在的洗钱途径,考验着国家的外汇管理水平。因此,大数据时代的金融风险已经打破了传统数据、算法和系统的边界,对决策者和研究者提出了全新的挑战。


近期,中国科学院计算技术研究所的程学旗研究员课题组在国家自然科学基金委员会主管、主办的Fundamental Research 期刊上发表论文,总结了大数据时代金融风险管理的主要挑战,从数据、技术和应用等角度详细讨论了大数据时代下的金融风险管理。面向多模态数据利用、长程异质关联、动态、实时和对抗等挑战,文章首先总结了当前金融大数据的收集和整理方法,强调了数据多模态对金融分析的影响和价值,并列举了一系列研究中常用的金融类公开数据集。接着进一步整理了可用于金融风险管理的大数据分析方法和技术,涵盖了表示学习、行为建模、图分析、知识图谱等多个方面:表示学习能够从多模态异质的金融数据学习高效的统一空间表征;行为建模能够刻画金融市场中金融实体的交易行为;图和网络能很好地表示长程异质的复杂关联和演化过程(如图1和2分别展示出了金融交易网络的多切片复杂性和多级穿透的洗钱模式);知识图谱技术能够表达金融系统中不同实体间的关系和依赖,进行知识推理。这些技术能够从海量的金融数据中自动地挖掘出金融系统的(异常)模式和趋势,用于识别和检测可能的隐藏风险。同时,文章按信用风险、流动性风险、波动性风险、金融犯罪合规风险和系统性金融风险等主要风险类别,回顾了利用这些技术来应对金融风险的应用案例研究,为未来实践提供了充分的依据。最后,文章探讨了未来在深度伪装的检测、对抗攻击的防御、模型算法的因果和可解释性、隐私安全保护以及从微观到宏观的多智能体仿真等前沿研究话题上,可能对大数据时代金融风险的研究提供更多角度的参考和启迪。


本综述从大数据分析技术角度对金融风险的研究提供一些理解和思考,希望能够推进新技术、方法、算法和系统的研究及应用实践。

图1  金融交易中时序的多切片网络模式。该图描绘出金融交易网络的时序多切片特点,即在同一时间切片内交易链接,以及跨时间切片的关联,带来模式分析的复杂性。

图2  多级穿透的洗钱网络模式。1-4节点迅速地将大量非法资金通过中间代理节点5-16,多级穿透转入到目标节点17和18(颜色代表交易量大小,红色达到上亿元)。

以上内容节选自期刊Fundamental Research 2021年第5期发表的文章“X. Cheng, S. Liu, X. Sun, Combating emerging financial risks in the big data era: A perspective review, Fundamental Research 1(5)(2021) 595-606”。

请识别二维码下载PDF原文

主要作者简介

程学旗

中国科学院计算技术研究所,研究员。主要研究方向:数据科学、网络搜索与挖掘、大数据分析、算法安全等。

沈华伟

中国科学院计算技术研究所,研究员。主要研究方向:社交媒体计算和网络数据挖掘等。

刘盛华

中国科学院计算技术研究所,副研究员。主要研究方向:大图挖掘和时序分析、谱图理论、异常检测等。

【研院动态】2022年学术沙龙第一讲:从数字化到数智化的变革之路

【数字法治·最新资讯】互联网信息服务算法推荐管理规定

【数字社会·研究精粹】坚持人民至上是数字化改革的根本价值取向

内容来源 / Fundamental Research,2021年12月9日

今日编辑 / 陈恬乐

责任编辑 / 戴晟昱

城市大脑研究院提供开放研讨平台,所有文章仅代表作者个人观点,欢迎共同探讨。原创文章,转载请注明来源:城市大脑研究院。部分图片来源于网络,如涉及版权问题,敬请及时联系我们。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存