AIIA携手产业聚焦应用场景,共建智能语音服务可信生态
智能语音技术在人工智能领域的日益发展,已经在娱乐、教育、金融等领域有了广泛应用,产品落地场景丰富,成为智能语音平台服务和产品硬件终端的核心基础支撑。
为进一步推进智能语音技术产品应用水平,中国人工智能产业发展联盟(以下简称联盟或AIIA)以“技术基础服务为核心,产业场景应用为宗旨”,开展了系列智能语音评估规范制定、可信评估和数据集建设工作,旨在通过公平、公正、公开的测试对标增强用户对产品选择可信度,为产业提供优质服务参考标准,推动技术和产业深度融合,打造AIIA智能语音服务可信生态。
目前工作情况
中国人工智能产业发展联盟智能语音评估工作自2018年11月启动,共有科大讯飞、阿里、腾讯、百度、思必驰等五十家余企业参与规范制定与讨论。
目前,联盟完成规范2篇,包括《中文语音合成基础服务评估规范》、《中文语音识别基础服务评估规范》已完成定稿;立项在研规范5篇,包括《声纹识别服务系统评估规范》、《全双工语音交互技术评估规范》、《语音采集质量评估规范》、《中文口语智能化评测评估规范》、《中文语音语义测试数据集标准体系》。
重点二:可信评估测试
2019年,联盟开展了中文语音合成可信评估工作,立项讨论并发布相应评估规范,共有腾讯、阿里、思必驰和同盾四家企业参与首轮中文语音合成可信评估并获得证书,在质量基准度、定制相似度和场景表现力都表现突出,总体在7分以上(满分10分)。可信评估测试充分贴近实际应用情况,考虑不同场景中环境、领域等因素,从用户角度出发总结相应评估指标和方法。
针对评测数据的构建,依托中国信息通信研究院的研究力量,联盟基本已形成评测数据构建的基本方法和要求,立足测试需求梳理数据集指标要素,考虑数据分布平衡性、完整性、规范性等各项要求,建设符合技术服务产品可信评测的评测数据集。
下阶段工作安排
第一,立足实际场景需求,继续开展智能语音可信评估。
2020年4月,联盟评估工作组已启动语音识别和语音合成的可信评估工作,依据《中文语音识别基础服务指标评估规范AIIAPG 0025-2020》和《中文语音合成基础服务指标评估规范AIIAPG 009-2020》,企业可依照产品实际情况选择必要的测试指标项,通过多维度评估测试验证技术服务能力,通过的企业可获得测试报告和证书。
评估具体内容详见 《关于开展中文语音识别和语音合成基础服务可信评估的通知》!
第二,充分挖掘技术、服务、场景互相融合,完善智能语音评估体系。
后续联盟将继续组织举办智能语音技术的评估规范讨论会议,开展语音合成、语音识别、声纹识别等基础语音技术评估规范的修订和更新,并结合实际应用扩展全双工语音交互技术、麦克风阵列语音增强技术、口语测评、语音唤醒等融合技术,具体时间安排如下。
除以上评估规范外,欢迎企业深入参与到规范的制定和讨论中,并积极提出新的评估规范方向。
第三,依托联盟推进组促进语言资源共享,完善面向产业应用的权威中文测试数据集。
联盟拟成立语言资源智能化应用推进组,旨在建立语言资源智能化服务平台,推动落实国家相关政策要求,联合产学研各方力量在技术、产业、生态建设等方面助力语言资源智能化应用推进。推进组将面向全体AIIA会员,通过整合优质资源和补充建设等方式,为联盟企业提供资源供需对接、数据建设咨询、标准评测等服务,满足科研和产业对语言数据资源需求。
推进组目前主要的工作方向之一是结合我国语言应用特点和现状,联合国内企事业单位、高等院校和研究机构,共同建立面向产业应用的中文测试数据集,对标国外智能语音语义评测数据集。测试数据集主要从技术、场景、领域和地域四个方面进行设计构建,技术包含语音识别、语音合成、机器翻译等产业化应用落地的主流方向,场景包含远场识别、多人对话、噪音等各类贴近实际应用的环境指标,领域包含交通、医疗、教育等语言智能化应用较为广泛的行业,地域包含方言、少数名族、东南亚等语言种类。
推进组目前处于筹备阶段,期望可以得到产学研各方机构和专家的支持和宝贵建议,如果意愿参与相关工作,可与以下负责人联系。
李 荪 18611353631
lisun@caict.ac.cn
张秋显 18361297790
zhangqiuxian@ngai.ac.cn
End