和传统翻译相比,手语翻译过程更为复杂,主要在于手语翻译并非按照日常说话的顺序逐字翻译,而要根据语句意思进行语言精炼和语序调整。手语是真正的小语种,数据量难以支撑训练,各类场景声学环境复杂难部署,还需要唇语及表情的配合辅助理解,对 AI 手语平台的构建提出层层挑战。 想实现高可懂度的 AI 手语能力要解决三大技术点:语音识别的清晰度、手语翻译的准确度、手语动作的流畅度。在经过开幕式、赛事播报等重重考验,AI 手语主播也印证着“AI 手语平台”已成功解决这三大难题,以行业领先的全链路 AI 能力实现“听得清”、“翻得准”、“打得好”的手语服务。 首先,在语音识别清晰度上,百度智能云曦灵-AI 手语平台通过 SMLTA 语音识别算法模型,实现声学、语言一体化端到端建模语音识别,在手机端近场语音识别率可达98%以上。百度语音技术部总监高亮表示,基于百度自研的深度学习算法,还可针对诸如旅游、医院、司法等不同领域的词准率进行针对性训练,词准率可达96%,使得 AI 手语平台一体机更好地应用于不同场景中。
最后,在手语动作的流畅度上, AI 手语平台通过“动作融合算法”, 基于《国家通用手语词典》规范精修近11000多个手语动作,让每一个动作的起落之间自然衔接,带来真人手语般地连贯性表达。再配合4D 扫描技术训练,使得 AI 手语数字人表情自然生动,口型生成准确度高达98.5%。 无障碍环境建设直接决定着残障人士的生活质量,也是国家及社会文明的标志。百度智能云曦灵“AI 手语平台”及“AI 手语平台一体机“的发布,将快速解决各类场景中无障碍窗口稀缺的问题,助力社会文明及美好生活的持续构建。