查看原文
其他

TIOBE 场景测试:评书 单田芳-白眉大侠

SpeechIO SpeechIO 2022-02-26



SpeechIO TIOBE Benchmark

场景测试:评书 单田芳-白眉大侠


SpeechIO TIOBE 历史文章回顾:

引篇

规范

场景测试:新闻联播

场景测试:鲁豫有约一日行

滚动测试报 2020.04

......

其它更多文章,请点击最顶部“专辑”阅读


场景:评书 单田芳-白眉大侠


1素材来源

youtube 抓取单田芳高音质评书节目《白眉大侠》,随机选取约2.5小时音频


单田芳老先生生前的作品,可以说代表着评书界的标准,为大家所熟知(尽管这项艺术形式在逐渐走向消亡)。该类节目的语音具有鲜明的特点,因此选取该场景作为本期的测试素材。


2场景特点

  • 环境

    • 安静录音室,无背景噪声

    • 无配乐

  • 拾音设备

    • 专业近场麦克风

  • 说话人

    • 单田芳

  • 说话方式

    • 标准评书说书人叙述

    • 有脚本,准备充分

    • 语速慢,感情丰富,带有鲜明的抑扬顿挫

  • 方言

    • 标准普通话

  • 内容领域

    • 江湖,武侠故事

    • 包含人物名、流派、武器等偏门词汇


3测试结果

测试时间:2020.11

本场景会进行定期重测(1-2个月),关注最新滚动测试报告查看最新结果。

CompanyPlatformAccuracy(%) = 1-CER
Alibaba
阿里云88.80
Baidu百度智能云76.16
iFLYTEK讯飞开放平台83.38
Microsoft
Azure79.94
Startup S创业公司S87.4
SogouAI开放平台82.70
Tencent腾讯云84.77
YITU Tech语音开放平台90.58

* 讯飞被低估,详见(SOTA)


4简评

  • 声音上,评书的语速、发音口音、录音质量等均是语音识别的理想条件。

  • 但从测试结果可以看到,各家对于评书场景的准确率相对较低。原因一方面是因为评书中包含各种偏门词汇和人名,难度较大;另一方面,评书这样的冷门语音数据在各家的基础数据中覆盖应该都不是很好,相对薄弱。


欢迎转载,大家有什么好的建议和意见,可以通过后台私信提供给我们。

扫描下面二维码 或 微信搜索 SpeechIO,关注公众号。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存