喜报!三连冠!
以下文章来源于科大讯飞 ,作者iFLYTEK
连续三次夺冠!
近日,国际多通道语音分离和识别大赛(CHiME)组委会在线揭晓最新一届CHiME-6成绩:
科大讯飞联合中国科大语音及语言信息处理国家工程实验室(USTC-NELSLIP)在给定说话人边界的多通道语音识别两个参赛任务上夺冠。
大量的语音交叠(Speech Overlap)
远场混响和噪声干扰对录音的影响
对话风格非常自由、近乎随意
训练数据有限
联合团队夺得CHiME-6冠军 (Track1:Ranking A)
联合团队夺得CHiME-6冠军 (Track1:Ranking B)
在前端信号处理方面,联合团队提出了基于空间-说话人同步感知的迭代掩码估计算法(Spatial-and-Speaker-Aware Iterative Mask Estimation, SSA-IME),该算法结合传统信号处理和深度学习的优点,利用空时多维信息进行建模,迭代地从多个说话人场景中精确捕捉目标说话人的信息。该算法不仅有效降低环境干扰噪声,而且可以有效消除干扰说话人的语音,从而大幅降低语音识别的处理难度。
在后端声学模型上,联合团队提出了基于空间-说话人同步感知的声学模型(Spatial-and-Speaker-Aware Acoustic Model, SSA-AM),通过在声学模型输入端拼接多维度空间信息和不同说话人信息,使其能自适应区分目标说话人和干扰说话人。因此,声学模型不仅依赖前端算法的处理结果,也能够自适应完成对目标说话人语音特征的提取,大幅提升多人对话场景下语音识别声学模型的容错率和鲁棒性。
科大讯飞致力于智能语音技术的源头创新及行业应用,并不断挑战语音识别实际应用中的技术难题。
2010年发布语音云,持续改善语音输入、语音交互场景的准确率。
2015年发布讯飞听见,逐步提升人人对话场景的准确率。
本次CHiME-6的研究成果无疑将进一步拓展语音识别的应用空间:
推荐阅读
中国科大两位校友入选2020年中国40位40岁以下商界精英
逆天颜值!!内外兼修的建筑群要来了!
梦里的科大,还是我爱的样子
中国科大强基计划招生访谈回放,报考科大你不容错过!(附各省招生咨询QQ群号)
中国科学技术大学2020年强基计划招生简章
中国科学技术大学2020年自强计划招生简章
点“在看”给执着攻关创新的中国科大点赞