其他
TIOBE 场景测试:老罗语录
SpeechIO TIOBE Benchmark
场景测试:老罗语录
SpeechIO TIOBE Benchmark
场景测试:老罗语录
SpeechIO TIOBE 历史文章回顾:
......
其它更多文章,请点击最顶部“专辑”阅读
场景:老罗语录
Bilibili哔哩哔哩 老罗语录
我们搜罗并爬取了老罗在新东方讲课时期的录音,即[老罗语录]。从中选取了一部分相对清晰的音频,累计约 3.5 小时原始音频
素材示例:
2场景特点
环境
新东方教室(礼堂、大型讲堂)
老师讲台上面讲课,学生下面听课,存在学生笑声、交头接耳等噪声
拾音设备
学生自己的手机 & 录音笔
收音距离一般较远,属于远场,音频质量较差
教室较大,因此录音存在一定混响
说话人
罗永浩
说话方式
自然语言,有备课,语言流畅,语速较快
方言
普通话
内容领域
主要是闲聊,偶尔穿插英文解题内容
3测试结果
测试时间:2020.06
本场景会进行定期重测(1-2个月),关注最新滚动测试报告查看最新结果。
字准确率(%) = 1 - CER | |
阿里云 | 58.07 |
阿里云+ | 67.66 |
百度智能云 | 52.34 |
讯飞开放平台 | 63.18 |
Microsoft Azure | 62.59 |
创业公司S | 67.75 |
搜狗AI开放平台 | 62.31 |
腾讯云 | 68.65 |
依图 | 70.72 |
4简评
该场景对一些会议室内主讲人讲话,听众用自己手机或者传统录音笔等设备录制的类似场景,有参考意义。难点:距离远,拾音质量差,自然语言。
对于该类远距离拾音的场景,解决方案纯靠软件算法很困难。多远算远?基本上超过一臂距离的录音场景,距离越远性能下降越快,一般都要配合更专业的硬件录音设备。
读者也可以联想下平时看到的产品,如智能音箱、电视、各种智能录音笔、会议室智能设备,是不是都在解决类似的场景问题。当大家抱着这样的场景需求,不应对公有云的通用服务报太高的期望,应花更多时间去考察市面上的专用智能硬件设备,才是现阶段更明智的做法。
欢迎转载,大家有什么好的建议和意见,可以通过后台私信提供给我们。
扫描下面二维码 或 微信搜索 SpeechIO,关注公众号。