查看原文
其他

30k+点赞!有了这个开源项目,说你是老板都有人信?(附源码)!

GitHub猿 2022-07-01

来源:开源最前线(ID:OpenSourceTop) 猿妹编译 

连接:towardsdatascience.com/you-can-now-speak-using-someone-elses-voice-with-deep-learning-8be24368fa2b

往期文章:看看人家那快速开发代码生成器系统,那叫一个优雅(附源码)!


正文


大家好,我是GitHub猿。
只要你采集了你Boss的语音,这个项目就可在短短几秒之内,克隆生成与之类似的语言,你想让它说什么,它就跟你说什么。


要实现这样的功能,首先不得不提文本转语音(TTS),它是指将文本转换为音频,人类只需阅读即可完成此任务,良好的TTS系统的目标是让计算机自动完成。


有趣的是有人构建了一个系统,可以选择你想要的声音生成音频,它可以是男声也可以是女声,你还可以选择他的声音是洪亮的还是低沉的。


在进行深度学习的TTS时,你必须收集文本-语音的数据集,并且录制这个音频的演讲者必须是固定的。如果你想要创建一个能够模仿自己/他人声音的音频,要做的第一件事就是收集音频



Real-Time-Voice-Cloning就可以帮你实现,这是一个基于深度学习的语音合成项目,它通过采集分析一段具体的声音样本,可在 5 秒内生成与之类似的克隆语音。


那么它的工作原理是怎样的呢?


比如,假如我们想让蝙蝠侠读“我爱披萨”这句话,那么我们需要提供两样东西给系统:一个”我爱披萨“的文本和一段蝙蝠侠的语言样本,这样它才知道蝙蝠侠的声音是怎样的,以及他要读的文本是怎样的,具体流程如下:



在过去几年中,文本转语音系统在深度学习社区中得到了很多研究关注,如果你也想尝试,首先你需要克隆存储库:

git clone https://github.com/CorentinJ/Real-Time-Voice-Cloning.git


安装所需的库。一定要使用Python 3:


pip3 install -r requirements.txt


在README文件中,你还可以下载预先训练的模型和数据集,尝试一些样本。


最后,你可以通过运行以下命令来打开GUI:


python demo_toolbox.py -d <datasets_root>


如下图所示,系统将输出的语音文本为:“你知道多伦多猛龙队是篮球冠军吗?篮球是一项伟大的运动。



你可以单击“Random”按钮随机化语音输入,然后单击“加载”将语音输入加载到系统中。

搜索公众号程序员小乐回复“智能家居”,送你一份惊喜礼包。


你还可以通过以下视频查看视频演示:https://www.youtube.com/watch?v=-O_hYhToKoA


如果你感兴趣也可以用自己的声音试一下,或者把Boss的声音录下来,然后你想让他说什么就说什么,比如:这个月的Bug都不用找了。所以,躲在音频背后,说你Boss,都有人信。



目前,这个项目已经在GitHub上获得 30.9K 个Star,5.7K 个Fork。


不过,对于这项技术,有网友评论道:虽然很酷,但也是不道德的,容易造成谣言传播,使用需谨慎,对此,你怎么看呢?

源码获取

扫码下方二维码,后台回复【Boss】即可获取

--END--


猿哥个人微信


添加猿哥个人微信即送一份惊喜大礼包


→ 技术资料共享

→ 技术交流社群



版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

往日文章:
推荐一套开源通用后台管理系统(附源码)
一款神奇的极客工具,用了永无 Bug
推荐一个酷炫的监控系统(附源码)!
看看人家那 IM 即时通讯系统,那叫一个优雅(附源码)
看看人家那物业管理系统,那叫一个优雅(附源码)
SpringBoot+Vue 完整的外卖系统,手机端和后台管理(附源码)!
为什么国内 996 干不过国外的 955呢?
技术圈热议:阿里 GitHub 项目被爆 "刷 Star"!这波又摊上事了...

最近,GitHub猿建了一个「GitHub猿交流群」,欢迎大家一起交流优秀开源项目,也可以宣传自己的开源项目,在 「GitHub猿」公众号后台回复【加群】邀请你入群。

你点的每个赞,我都认真当成了喜

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存