又一利器!声纹识别技术创新银行业风控新模式
验“金”室
导 读
银行金融业务欺诈风险正随着科学技术发展演进,从传统的信贷、柜面、外部盗抢向线上化、智能化电子银行业务领域延伸。特别在今年新冠疫情冲击下,“非接触式”银行业务线上化办理成为智慧银行又一发力点。工商银行一直以智慧、开放、共享、融合为目标,为用户提供专业、高效、安全的远程业务体验,通过攻克电话信道声纹识别难题,创新性地将声纹识别技术应用于信用卡反欺诈,首创行业声纹风控新模式。
声纹识别成宇宙行又一利器!通过电话银行,工商银行在线上办理信用卡申请、启卡、尽职调查环节,利用声纹识别快速无感地为客户经理提供身份识别和欺诈风险判断依据,全面提升风险防控能力和客户服务体验。
01
What is声纹识别技术?
语音识别
指将说话人的语音内容转换为文本的过程,通俗地说就是让机器听懂人说的话,所以语音识别也成为人机交互的主要方式之一,其识别流程如图1所示。
图1 语音识别流程
声纹识别
声纹是一种可用电声学仪器显示的携带语言信息的声波频谱。声音中包含能表征和标识说话人声音的特征。声纹识别就是通过辨识声音特征进而识别说话人身份的过程(如图2所示)。
图2 声纹识别
研究表明,声纹与指纹、人脸、虹膜等生物特征类似,具有唯一性和稳定性,每个人说话时声音特征(音调、响度、音色)和发音习惯几乎是独一无二的;同时,声纹也是一种行为特征,每个人在讲话时使用声音器官(舌头、牙齿、声带、肺部、鼻腔)的方式各不相同,运用声纹识别作为身份认证方式具有唯一性和稳定性。声纹与其他生物特征识别因子特点对比见表1。
表1 声纹与其他生物特征识别因子特点对比
声纹识别技术的发展经历了三个阶段:信号处理方法阶段、高斯概率模型方法阶段和深度学习方法阶段。早在20世纪30年代,人们便开始了对说话人声音识别的研究。2012年以来,深度学习、大数据给人工智能的发展带来了巨大影响,加速推动了声纹识别发展,声纹识别技术逐渐成熟并开始产业化。走出实验室的声纹识别技术因其广阔的应用场景和巨大价值,迎来巨大的商用化浪潮。
2
宇宙行声纹识别技术大招在哪里?
声纹识别从语音内容上可分为文本相关、文本半相关、文本无关三种类型,在应用场景上区分为电话信道和网络信道两种,从声纹识别服务上区分主要有:声纹注册、1:1声纹确认、1:N声纹辨认、声纹查询、声纹删除5种类型,其技术框架如图3所示。
图3 声音服务技术框架
文本相关:声纹注册时需要用户录入指定内容的声纹数据,在认证时用户说出与注册时完全一致的内容进行声纹识别;
文本半相关:声纹注册时录入用户念出0~9之间数字的声纹数据,认证时,用户说出系统随机返回的6~8位数字进行声纹识别;
文本无关:无需特定文本内容,用户可以通过任意内容的声纹进行声纹注册和认证。
大招1:声纹质量检测
参差不齐的声纹输入质量对声纹识别结果有较大影响,通过制定标准化的声纹处理格式,在采集阶段首先判断声纹质量,保证声纹数据质量过关,在服务端进行声纹识别,提升识别准确率。声纹质量检测项主要包含语音有效时长检测、噪声检测、音强检测、音频格式检测(见表2)。
表2 声纹质量检测说明
大招2:活体检测
利用事先录音、合成语音等假声纹进行识别,对声纹识别系统造成恶意攻击,通过前端部署活体检测算法,可极大地减少录音与合成语音的假体攻击,具体做法为:在文本相关和文本办相关场景增加固定文本内容交互进行活体检测,在文本无关场景增加动态数字交互进行活体检测(如图4所示)。
图4 活体检测
大招3:语音兼容处理
来源于不同采集端的声纹具有不同的格式,且一段声纹可能同时混合来自客户、座席人员、复杂环境的声音,处理这种复合类型的声纹成为声纹识别技术的重点难题之一。通过声纹兼容处理将来自不同信道、不同格式及复合类型的声纹进行拆分处理,同时对声纹实现标准化,提升声纹识别准确率(如图5所示)。
图5 语音兼容处理
大招4:高性能检索跨信道处理
如果电话语音数据接收和声纹语音内容过大,可运用websocket、RTP流解析技术和DDS服务框架进行跨信道处理。
websocket+RTP流解析:通过websocket通信完成电话声音RTP流数据的接收。通过RTP流解析获取声纹识别语音文件。
DDS服务:声纹注册、声纹辨认、声纹确认服务交易报文过大,通过DDS实现服务化提升声纹处理效率。
3
宇宙行在同业首创声纹风控新模式
工商银行持续提升智慧风控水平和客户服务体验,降低信贷业务欺诈风险,为金融业务保驾护航。
2020年6月,工商银行创新性地将声纹识别技术应用于信用卡反欺诈,首创行业风险管控新模式。
(1)声纹注册:客户在电话银行办理信用卡业务时,明示并征询客户同意后注册客户声纹信息。通过电话银行将采集好的声纹数据进行预处理(语音增强、降噪、活体检测),并将合格的声纹导入声纹引擎进行建模,注册为声纹模型存入声纹库;
(2)声纹确认用户身份(1:1确认):办理业务时,接通语音服务后无感完成声纹1:1用户身份确认,保证业务安全,杜绝木马盗取密码和指纹数据风险;
(3)声纹辨认欺诈风险(1:N辨认):业务授权确认时,通过声纹1:N辨认,搜索黑声纹库,将识别具有相同声纹但登记了不同身份信息的可疑人员进行备注,供客户经理参考,防范欺诈风险,缩短业务办理时间,提升客户体验。
4
声纹风控业务价值有哪些?
提升业务安全性
在业务办理时,通过声纹唯一性进行用户身份确认,可提升安全性。
“非接触式”远程服务
客户无需操作终端,自然语音表达时即可完成身份识别和业务办理,享受非接触式远程业务办理。
提升风险管控能力
在客服与客户自然语音交互中通过声纹识别,同步实现客户身份二次确认和可疑声纹检索,提供欺诈行为判断依据,提升风控管理自动化能力。
提升业务办理效率
传统交易中,客服需通过多轮安全问题交互,对客户应答信息进行人工核验,耗时长(50s/每笔),效率低,且存在答案被盗/冒名顶替欺诈风险;利用声纹识别,客服与客户交互变得轻松简单,身份识别和欺诈风险判断结果在400ms内可返回,识别准确率达95%,大幅提升业务办理效率和客户体验。
随着金融业务线上化的趋势越来越明显,声纹识别技术的创新场景应用正迎来爆发式增长。
未来,随着5G、大数据、云计算等新技术的发展,声纹识别技术将愈加成熟。毫无疑问,工商银行将积极探索金融科技创新,树立金融行业标杆,依托金融科技,以大行智慧为客户打造更安全、智能、高效的金融服务体验。宇宙行布局的下一个声纹创新应用领域会是什么?让我们一起拭目以待。
更多精彩内容
FCC30+
长按左边二维码
关注我们不迷路