查看原文
其他

今天速记员失业了吗?丨百宝袋

大绵羊 果壳硬科技 2022-04-11

为了给你看看我们手上的“宝贝”,我们决定成立一个新的栏目,百宝袋。


随便一部手机都有录音功能,录音笔还有市场吗?


难。根据新思界产业研究中心发布的《2019-2023年录音笔行业深度市场调研及投资策略建议报告》,2015~2018年,我国录音笔行业产量年均复合增长率为-1.57%,行业产量持续小幅下滑,仍然供大于求。[1]


但这个行业也隐约有些变数:在人工智能的驱动下,一类能完成录音转文字、翻译等功能的“智能录音笔”的外来客正入场搅局——与传统声学厂商索尼、TESCAM等造的高品质录音笔不同,主流智能录音笔更像是人工智能公司的硬件业务。


“生产力工具”成了这些产品最大的噱头和高价的主要原因:在这些厂商的语境中,智能录音笔作为工作赚钱必备工具,天然便应拥有更高贵的身价。


大绵羊丨作者普通酱、Danny丨编辑


智能录音笔,“智能”在哪?

智能录音笔千奇百怪,并无行业标准。打开淘宝或京东,你能搜到各种大小品牌、从百元入门到数千元发烧级的不同智能录音笔产品。


这些产品的共同点在于可以把录音文件同步至手机,把录音识别为文字稿,乃至翻译、同声传译等工作——这也就是所谓的“智能”。


具体实现“智能”的方式则多种多样,效果也是良莠不齐。


其中最简单粗暴的“变智能”方式是让录音笔能连接手机。毕竟,随便一个家电做个App控制都能叫“智能家居”,以此类推,给录音笔加一个与手机互相连通的App就叫“智能录音笔”,好像也没毛病。


更何况,连上手机的录音笔,还能通过手机的软件语音转文字呢!(别问我为什么不直接用手机软件录音转写,我不知道。)


另一类比较认真“变智能”的录音笔,则是围绕录音语音识别这个基本需求专门打造的,例如搜狗和讯飞的相关产品,售价大几百元至三千元不等。


搜狗智能录音笔S1丨图:放大灯(ID:guokr233)


李逵和李鬼好歹都姓李,好歹也都会使两把斧头,不论山寨的还是认真的,看起来都能满足“录音转采文字”这个智能录音笔的基本业务。


“录音转文字”真的那么重要么?当然!要不然怎么会有速记员这种职业?


智能录音笔往往被认为是一款记者、律师和速记员的生产力工具。录音和速记的结合,听起来确实让人心动。


为什么智能录音笔闻起来这么香?


智能录音笔的本质

历史上最早的录音设别可以追溯到1877年爱迪生发明的留声机。140多年过去,录音设备从半人高的留声机,变成巴掌大的录音机,最后压缩到一支笔的大小——真·录音笔说的就是它。


爱国者R6688,真的就是“笔 ”| 爱国者官网


用户对录音设备的要求其实很简单:录音、储存、播放。在功能未发生实质性变化的前提下,录音笔的优化点就落在了体积和性能上,更便携和使用,或者录音更清晰。


万变不离其宗。传统意义上的录音笔,在追求的无非是一个“可靠记录、准确回放”,而智能录音笔则是满足用户对录音承载的信息的需求——比如记录一场在咖啡厅的采访,背景音乐再好听,也只是毫无用处的噪音。


这就是智能录音笔的本质。普通录音笔的终极目的是回放声音给人听,而智能录音笔是把语言包含的信息提炼出来给人看。你说有没有一种用户,既需要文本,又需要回放?当然是有的,例如电台等音频内容的录制和文字稿整理。


但两种需求往往是割裂的,这就是支持智能录音笔以动辄一两千元的价格,每月销售上千台的基本逻辑。


提炼语音信息的需要切实存在,如何实现它,可以有两种不同的路径:


  1. 使用智能录音笔,直接输出录音与文本,胜在方便,劣势在于录音质量可能略差。

  2. 使用高品质的非智能录音笔,输出录音,再用其他工具软件识别文本。胜在录音质量和可以自主选用更高品质的智能识别平台,劣势在于操作太麻烦了。


所以,智能录音笔的问题变成了——


把软硬件糅在一起是好主意吗?

硬件录音、软件处理与识别,非要搞成一体化吗?这是智能录音笔的“生死之问”。出结论,还得仔细看看产品。


硬件的问题:满足需求,但太贵了


我们手上有一款搜狗智能录音笔S1,它为我们的采访工作立下了汗马功劳。在罗永浩担保“全网最低”的直播间里也要2448元,足够在拼多多上买一台第七代iPad。


光看体积,智能录音笔笨重的外观不仅没让人看到科技的进步,反而有所倒退。一块3.5英寸的屏幕直接把录音笔行业打回到十年前的iPhone 4时代。


智能录音笔的硬件配置可以非常华丽。在明确需求指导下的豪华堆料,让智能录音笔有了不同于传统录音笔的功能优势——搜狗与讯飞两家公司的旗舰智能录音笔均搭载了两颗来自哈曼卡顿的指向麦克风和6个全向麦克风,根据用户需求拾音,完成不同场景的录音工作。[2]


其中,顶部两颗指向麦负责给了录音更好的音质上限,分散在屏幕四周的全向麦克风除了配合降噪,还能识别声源的方位,区分不同的讲话人。


不但区分位置,而且能辨男女 | 放大灯团队


基于硬件配置,智能录音笔往往准备了多种录音场景模式(一对一采访、多人会议等等)及声音处理方式(原始声音、突出人声甚至仅保留人声)等等。情景模式与用户需求高度匹配,在这方面,智能录音笔的确比能拿去录音乐会的索尼D系列更接地气。


依靠硬件实现了独到的功能不假,然而高昂的成本也会成为用户的负担。


高端智能录音笔有上得了台面的质感与设计,但模具和制造组装都要花钱;智能录音笔是安卓系统的智能设备,芯片、屏幕也是额外成本;而实现录音笔核心功能的麦克风,本身也价格不菲。


这两颗指向麦相当昂贵。”据科大讯飞智能录音笔产品负责人王志军向放大灯团队(ID:guokr233)介绍,“8颗麦克风阵列的成本能占到总成本的10%。”这还不包括为了配合麦克风额外安装的处理器等元件。


软件的问题:要智能录音笔何用?


让智能录音笔变得更好用也更贵的不止麦克风,还有语音转写服务。


与其说智能录音笔是传统录音笔行业的革新和升级,倒不如视之为语音识别或者转写系统的一个副产物。对生产商来说,智能录音笔也只是转写引擎的商业化的形式之一。


  • 2015年,科大讯飞发布了语音转写系统“讯飞听见”。两年后,搜狗上线同类产品“搜狗听写”,两家在智能转写赛道上的竞争从此开始。

  • 2019年两会,刘庆峰和王小川分别带上了自家最新的智能录音笔,把会议实时文字转写系统压缩到手机大小的设备中。


看起来软硬件一体会让录音识别更轻松,但实际上使用体验完全谈不上流畅。


由于转写是付费功能,想在录音笔上把录音转换成文字需要经过复杂的确认操作——录音上传、文件解码、选择语言、确认转写和付费,云端完成转写后才能在手机端和PC端导出文字转写结果。


既然转写在云端,那跟用电脑上传录音文件又有什么区别?这一套操作流程,甚至还不如直接把录音笔插电脑上,把文件拷贝到转写平台来得简单。


事实上,在线转写服务对录音音质的要求并不高。王志军称,类似通话录音的录音质量是语音转写的下限。


智能识别的技术进步,将进一步抹平硬件优势。识别低品质录音是其一,声纹识别则是其二——区分讲话人,不必再用昂贵的麦克风阵列判断声音方向了。


所以,“智能录音笔”是不是好主意?


我们大致可以这样判断:


智能录音笔有着为语音场景深度定制的高品质硬件,并围绕硬件配置了不同的录音方案,它能实现相对更高质量的录音。识别软件的准确性直接影响智能录音笔的可用性,但识别平台能力越强,智能录音笔就越没有存在的空间。


因此,结论可能是——智能录音笔可能将向着硬件凑合够用、提升软件能力和易用性的方向发展。


看看讯飞近期发布的智能录音笔A1,一款三百元价位的智能录音笔,可能就有点这味儿了。同类产品还有搜狗在去年下半年推出的智能录音笔C1/C1 Pro。在高端智能录音笔(搜狗S系列、讯飞SR系列)面前,这两个小东西看着像个玩具,但很可能就是行业的大势所趋。


音频深加工的生意不好做

语音识别转写平台与智能录音笔,它都是在做一个音频深加工的生意。它是某些职业的生产力工具,是刚需,理论上说有着充足的溢价空间去获取利润,但残酷的市场竞争没有给厂商赚大钱的机会。


原因有二:


第一,软硬件一体的智能录音笔尽管可以卖高价,但手机录音+转写平台就可以实现它的主要功能,并且随着算法水平提高,更多原本硬件提供的功能将被软件替代。


第二,自然语言识别行业竞争激烈,国内外巨头参与,让转写服务本身没法定高价。


智能录音笔的市场操作也很迷惑。这类捆绑了增值服务的硬件,可以有两种销售策略:一种是每卖出一部产品就赚一部利润,另一种是亏本卖货,靠服务赚钱。


搜狗全线录音笔均只赠送一年的转写服务会员服务,而科大讯飞SR501和SR701提供的是终生的免费转写。王志军称,这是为了打开市场做出的让利。


图丨科大讯飞天猫旗舰店


在科大讯飞和搜狗官方旗舰店里,除了售价1659元的讯飞SR501月销量接近1000台,其他旗舰款的智能录音笔,最贵一款2999元、最便宜的也要799元,月销量均没超过500。


在京东平台,讯飞录音笔共计获得了超过6.2万条评价,而包含上述简化款录音笔的搜狗智能录音笔则共计获得8.4万条评价。


作为对比,爱国者、纽曼等其他品牌的传统录音笔的月销量动辄三四千。但考虑到平均售价,说人工智能公司冲击了传统录音笔公司的市场,没毛病。


只不过,高价产品还是“劝退”了不少潜在消费者。


放大灯团队(ID:guokr233)找速记从业者Zoey聊了聊——他们的工作离不开录音笔,但她和同事们都没有使用过智能录音笔。Zoey说,目前的录音笔转写的识别率已经足够减轻她的工作,但智能录音笔价格还是过于高昂,打消了她购入一款的想法。


用户有廉价的替代方案、过高的定价抑制了用户的购买意愿,稳妥的销售策略自然起不到好的销售效果,难道只有亏本促销才能打开智能录音笔的市场?


但讯飞和搜狗不是亚马逊,它们亏不起。


2020年5月,科大讯飞和搜狗先后发布了2020年第一季度的财报。受疫情牵连,科大讯飞Q1净利润-1.31亿元人民币,同比下降229.02%,同期搜狗净利润-2.2亿元人民币,同比下降719.49%。[3][4]


亏损扩大、现金流吃紧,而前端亏本的销售策略收回成本的周期长,又十分考验用户的复购意愿,选择前端盈利是综合了公司经营状况后的无奈之举。


智能录音笔是不是一个好主意?以现有的产品形态,可能并不是。但它直面消费者刚需的态度却是今天消费电子领域数得上的认真,而在硬件背后的自然语言识别,是一种平台能力,除了智能录音笔,还能在其它产品上大放异彩。


声音的加工,肯定还有很多更有想象力的玩法——比如,智能录音笔能否成为一个声控的平台,一个随身的Alexa或者天猫精灵,或者变成我们每个人都拥有的智能手机的一个标准能力?


当然,每一种可能性都意味着试错和风险,想收割声音深加工的市场,并不容易。



References

[1] 新思界,录音笔市场增长动力不足 智能化发展成为重要趋势http://www.newsijie.com/chanye/dianzidianqi/jujiao/2019/0426/11247672.html


[2] 讯飞商城,智能录音笔SR701
https://www.xunfei.cn/goods.php?id=37


[3] 巨潮资讯,科大讯飞2020年一季度财报
http://www.cninfo.com.cn/new/disclosure/detail?plate=szse&orgId=9900004565&stockCode=002230&announcementId=1207552218&announcementTime=2020-04-22


[4] 搜狗官网,搜狗2020年一季度财报
http://ir.sogou.com/index.php?s=117





- 我们的文章,也许你会感兴趣 -

《为了成为单身母亲,我去美国买了份精子》
《中国宝宝,海外制造》《“人民的希望”,无人问津》


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存