查看原文
其他

TIOBE 场景测试:老罗语录

SpeechIO SpeechIO 2022-03-21



SpeechIO TIOBE Benchmark

场景测试:老罗语录


SpeechIO TIOBE 历史文章回顾:

引篇

规范

场景测试:新闻联播

场景测试:鲁豫有约一日行

滚动测试报 2020.04

......

其它更多文章,请点击最顶部“专辑”阅读


场景:老罗语录


1素材来源

Bilibili哔哩哔哩 老罗语录

我们搜罗并爬取了老罗在新东方讲课时期的录音,即[老罗语录]。从中选取了一部分相对清晰的音频,累计约 3.5 小时原始音频

素材示例:


2场景特点

环境

  • 新东方教室(礼堂、大型讲堂)

  • 老师讲台上面讲课,学生下面听课,存在学生笑声、交头接耳等噪声

拾音设备

  • 学生自己的手机 & 录音笔

  • 收音距离一般较远,属于远场,音频质量较差

  • 教室较大,因此录音存在一定混响

说话人

  • 罗永浩

说话方式

  • 自然语言,有备课,语言流畅,语速较快

方言

  • 普通话

内容领域

  • 主要是闲聊,偶尔穿插英文解题内容


3测试结果

测试时间:2020.06

本场景会进行定期重测(1-2个月),关注最新滚动测试报告查看最新结果。


字准确率(%) = 1 - CER
阿里云
58.07
阿里云+
67.66
百度智能云52.34
讯飞开放平台
63.18
Microsoft Azure
62.59
创业公司S
67.75
搜狗AI开放平台
62.31
腾讯云
68.65
依图
70.72


4简评

  • 该场景对一些会议室内主讲人讲话,听众用自己手机或者传统录音笔等设备录制的类似场景,有参考意义。难点:距离远,拾音质量差,自然语言。

  • 对于该类远距离拾音的场景,解决方案纯靠软件算法很困难。多远算远?基本上超过一臂距离的录音场景,距离越远性能下降越快,一般都要配合更专业的硬件录音设备。

  • 读者也可以联想下平时看到的产品,如智能音箱、电视、各种智能录音笔、会议室智能设备,是不是都在解决类似的场景问题。当大家抱着这样的场景需求,不应对公有云的通用服务报太高的期望,应花更多时间去考察市面上的专用智能硬件设备,才是现阶段更明智的做法。


欢迎转载,大家有什么好的建议和意见,可以通过后台私信提供给我们。

扫描下面二维码 或 微信搜索 SpeechIO,关注公众号。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存