首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
上海
2
习近平
3
新疆
4
鄂州父女瓜
5
乌鲁木齐
6
疫情
7
H工口小学生赛高
8
习明泽
9
芊川一笑图包
10
印尼排华
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
高三女生醉酒后被强奸致死?检方回应
常德悲剧:让谴责无差别杀戮之声更加响亮一点
2024【公共营养师】培训报名通道已开启,不限学历,23岁及以上可报!还能领2000补贴
【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时
女人最偏爱的十种男人
生成图片,分享到微信朋友圈
查看原文
其他
AI语音+声纹识别 实现“未见其人,先辨其声”
中科曙光
2023-01-23
红楼梦中,只有王熙凤足够独特的声音,才能让大观园众人“未见其人,先闻其声”。
如今,借助AI语音技术与算法,就算大观园里有人说英文,有人说德语,依然能“未见其人,先辨其声”。
这就是声纹识别,即根据待识别语音的声纹特征,识别该段语音对应的说话人。声纹指说话人的语音生物特征,理论上,同指纹一样,声纹具有专属独特性。目前,声纹特征也已应用于特定人合成与变声、特定人分离、特定人唤醒等具体的特定人应用场景。
声纹识别的核心难点在于系统的鲁棒性,即无论语音文本是什么内容、说话人用什么语言、语音信号的时间长短、声音录制和传输的信道方式、声音采集时的环境噪声干扰等都需要能准确识别说话人的身份。
在实际场景落地中,如面对智能家居和智能机器人,说话人与智能设备交互时会有一定距离,这就属于远场声纹识别。与近场声纹识别相比,其信道比更低,且伴随有混响和噪声,识别难度更高。目前,许多成熟的算法使得上述声纹识别的准确率和鲁棒性得到了显著的提高。
文本相关的远场声纹数据集
曙光所建设的“全国一体化算力服务平台”,基于业内首个算网原生资源底座,为声纹识别技术提供大规模算力算法服务,通过一体化资源协同调度系统,智慧化、定制化地根据作业需求匹配计算资源与环境,可以点对点实现供需双方的顺畅对接。因声纹识别技术有良好的准确性、经济性和可扩展性,拥有广阔的发展空间,将有望大规模应用于金融安全、公共安全、社保生存认证、移动互联网安全、车联网安全等各个领域。
点击
阅读原文
,查看
视频回放
关注“中科曙光”抖音号、视频号
Get更多内容
往期回顾
您可能也对以下帖子感兴趣
{{{title}}}
文章有问题?点此查看未经处理的缓存