30s克隆声音,被这开源的文本转音频震惊了!
近两年,AI发展的速度真的太迅猛了。
当你还没尝试过传统的文本转语音,或许更新的技术已经到来,甚至都被另一个技术超越了。
上面是我和一位同事的聊天对话,她让我帮她把文本转成语音。
这几年我都发过10篇左右的文本转音频文章了,他们都还没有尝试过。且这还是最传统的文本转语音方式,使用的是平台内置的播讲人。
这一年多以来,大家更是把目光转向了AI音频克隆和生成,文本转音频能更多样化、个性化。
最近又诞生了一个开源的AI文本转音频项目,瞬间冲上热榜(7.4K⭐),可以在线使用,也可以自行搭建。
在线使用
网址(复制后浏览器访问):44886.com/go-398
传统的文本转音频,要么是预制好了播讲人,要么是自己克隆后自己悄悄用。
这个平台最大的特点是——可以模型共享。你可以使用别人创建的声音模型来文本生成语音。
这些别人调好的模型,细节优化非常好,你可以直接使用。
瞬间生成音频文件,来听一听:
在生成的时候没有参数可以调整,只可以选择模型,所以生成的质量和模型的好坏紧密相关。可以挑广场中热度高的模型来生成试试。
自己创建模型(克隆)
只需要30秒时间,就能用自己的声音创建模型。
如果你不想自己的声音被公开使用,一定记得这儿要选择“私有”。
你可以直接在创建的网页上,现场录音。大约朗读3段文字即可,太多反而不行。
录完音频,你的模型瞬间就能生成了,赶快去试试生成效果如何吧!
平台和开源的区别
在平台上免费使用是有限制的,每天可以免费用50次。
很多人不理解:为什么很多项目声称开源,但进官网还分免费和收费?
集中给大家科普一下:
开源是指项目源码是开放的,你可以用源码自己去搭建一个平台,这需要一定的门槛。
官方用源码搭建好了示例平台,这个平台会有很多人使用,服务器是很贵的,所以会有收费计划。
如果你动手能力强,可以用自己的电脑来跑这些开源项目,不花钱;如果你想图方便,就用官方的示例平台,不是重度使用,每天50次已经足够了。
开源地址:https://github.com/fishaudio/fish-speech
🔥灵感提示:你可以用这个克隆声音的功能,自由发挥,去二次创作影视作品。
- end -
2024-09-10
2024-08-18
2024-09-01
2024-09-02
2024-09-03