声音黑科技!PS声音!Adobe 展示 Project VoCo
一年一度的Adobe 年度 MAX 大会本月在旧金山召开,会上除了展示Adobe一系列产品包括图像编辑的创新成就,会上还展示了一个新的实验工具 Project VoCo。这款工具帮助用户像PS照片一样编辑语音。用户不仅能编辑现有文本,还能使用同样的语音模型去创建新记录。
请看视频:但从纯技术的角度来看,印象深刻。https://v.qq.com/txp/iframe/player.html?vid=s0343jt8l4v&width=500&height=375&auto=0
这款工具的使用方式:Project VoCo 需要获得说话人约 20 分钟的语音。随后,该工具会分析这段语音,将其分解成为音素并记录,随后创建语音模型。目前如果你仔细聆听,那么可以听出单词的转折,不过,这种人工制作语音和真实语音之间的差异消失或许只是时间问题。
这一工具并非基于传统的语音合成技术,其技术被 Adobe 称作“语音转换”。尤其强大的是几乎完全不需要人工干预。用户可以更正自动生成的内容,从而优化合成技术。此外,用户完全没有必要设定时间戳,算法将自动确定时间。
当然,目前只是演示了英文的测试,对于国内广大影视制作者们最关心的问题。是否支持中文,另外,在表演情况下是否还可以应用,如果在有环境声的情况下会不会还能成功,都是个问题,但无疑,这个技术终将会在某一天实现,这也是虚拟视听技术未来关键的技术,是否多年后,我们可以与我们曾经逝去的亲人对话,是否可以创造一个“黑客帝国”一样的世界,
在 Adobe 公司发布的一份官方声明中表示:
当录制画外音、对话或是叙述时,人们往往会想要修改或插入一个词或是一段话,这是因为人们在说话的时候很容易出现口误,特别是在表述一大段内容的时候,口误就会随之增大。现在,我们已经开发了一个名为 Project VoCo 的技术,用户在编辑音效的时候,可以轻松输入一个词或几个词,然后修改或插入到语音文件之中。我们的演算法可以帮你搞定剩下的一切,让最终的音效听上去和原发音者讲的一模一样。
听上去,Project VoCo 技术真的就像是音效编辑领域里的“Photoshop”,这款工具甚至有可能颠覆音效工程师的声音处理工作,包括声音编辑、润色、清理纪录等。当然,这个工具很可能会涉及到一些道德问题,比如使用 Project VoCo 技术,我们就有能力伪造出某个人的声音,让他 / 她表达一整段句子,就像 Photoshop 出来的时候,很多人 PS 出不少误导大众的图片一样,而现在,这个问题很可能会同样出现在音效编辑领域。
对于这些试验项目,Adobe 并未承诺将最终推向普通用户。不过过去多年中,该公司以这种方式启动的多个项目最终都成为了产品。
推荐阅读:点击下方图片即可阅读
同期网独家 ▲ | 获奖声音设计师Chris Goodes专访
众测1期反馈(二) ▲ | 一位云南影像教师的Azden SMX-30使用手记