查看原文
其他

民间大佬开发,无限制调用大厂接口,低调用!

砺心 阿虚同学
2024-11-05

阿虚同学

读完需要

8分钟

速读仅需 5 分钟

“注意看,这个男人叫小帅...”

看到这行字是不是大家脑子里已经自动冒出语音了?

其实抖音上爆火的影视解说原音出处阿虚早在 2022 年的文章就介绍过了,是来自微软的TTS

在之前的文章里,想要用上这个TTS可是相当不容易,又是信用卡又是创建资源组啥的

好在后来阿虚又写文章介绍过:微软其实已经将这款TTS语音内置到 Edge 浏览器了,甚至我们可以白嫖用其来实现免费听书

而也正也因为微软的如此作为,有不少第三方作者基于微软的接口开发了免费的文字转语音工具

今天就再借此来聊聊文字转语音这个话题~

1


   

TTSMAKER(网页/Win/Mac)

地址:https://ttsmaker.cn/

马克配音是一个主要调用微软接口的在线文字转语音网站,无需注册登录即可免费使用,右上角还能下载 Windows 或者 Mac 客户端

其中的阿伟就是微软的 Yunxi 语音,也是抖音短视频常用的爆款音频

不过网站没有具体说明音色来源,但除了微软,估计还有其他的语音接口,总之目前共有 60 种音色可工选择

唯一的限制是每周限制只能转换 30000 字符(大约可以转换成约150分钟时长的音频)

但由于无需注册登录,其实打开浏览器的隐私模式,或者换个浏览器访问,就能轻松破解这个限制,等于没有限制

2


   

文本转语音(网页)

地址:https://www.text-to-speech.cn/

一个非常简单明了调用微软 Azure 文字转语音接口的在线网站,但功能却相当强大!

不仅可以选择音色,还可以控制生成语音的质量、模仿、感情、音量、语速、音调,能给每个句子末尾添加停顿!

对于有精细化语音生成需求的人来说,这算是相当好用的一个网站

3


   

TTS-Online(网页)👍

无锡趣创科技有限公司旗下网站,就目前来看,非常良心!

3.1


  

真人语音合成

地址:https://www.ttson.cn/

这是其提供的真人语音合成网站,每次最多可合成 3000 字,支持中英混合(如你好啊 how are you)、插入停顿、调整音调和速度

内置200+声音可以直接点击试听,标签分类清晰,男生、女生、童声、二次元、方言等都有,热门标签里包括抖音、B站常用的微软音色

3.2


  

动漫语音合成

地址:https://acgn.ttson.cn/

更牛逼的是,网站还提供了 938 种日漫角色,65 种原神角色,36 种 LOL 角色的音效合成

不过需要注意:此网站每次合成最多可输入 500 字(但阿虚实测600字其实都行)。同时日漫角色音效不适合中文,建议输入日文文本选择输出语言为日文(或者输入中文打开自动翻译)

4


   

Genshinvoice(网页)

地址:https://v2.genshinvoice.top/

上述网站不是提供了原神语音合成吗,但事实上的源头应该是 Genshinvoice 这个网站。支持的语音不变,但功能更加强大,支持提示模式(可选文字提示或音频提示,用于生成文字或音频指定风格的声音),同时还可以设置SDP Ratio、Noise、Length 等复杂参数

疑似源自:https://github.com/w4123/GenshinVoice

有着包括派蒙在内的上百种原神角色音效供你选择!


5


   

一点红语音合成(Win)

由吾爱破解坛友@zbb2012开发的工具,调用 Edge 接口,可简单调整角色风格强度、语速、音调(AzureTTS接口不可用)

来源:https://www.52pojie.cn/thread-1727545-1-1.html

当然 Edge 的人物音效是都包含的,共有 34 个,音色都可以试听

相比上方介绍的网站,没有太大优势,但强在多了一个音频拼接、混合、提取/格式转换的功能

由于有人持续对公众号自动回复进行举报,遂暂时不再通过公众号自动回复提供软件下载,后续阿虚会把资源下载地址提供在文章置顶留言。若置顶留言也被和谐的话,请到储物间(axutongxue.com)右上角,搜索以下关键词获取资源:

文字转语音

6


   

VPOT(Win)

相比一点红,吾爱论坛@iloveyoubest开发的VPOT又有独特的优势, 免费 Edge 接口的语音合成自然是有(支持除中文外的多种语言)

来源:https://www.52pojie.cn/thread-1874427-1-1.html

最大的优势是可以调用你自己申请的微软的TTS(👈具体申请方法见之前的文章)

由于有人持续对公众号自动回复进行举报,遂暂时不再通过公众号自动回复提供软件下载,后续阿虚会把资源下载地址提供在文章置顶留言。若置顶留言也被和谐的话,请到储物间(axutongxue.com)右上角,搜索以下关键词获取资源:

文字转语音

7


   

TTS-VUE(Win)

除外 Loker 使用 Electron + Vue + ElementPlus + Vite 开发了一款同样的语音合成工具,还搭建了专门的官网:https://loker-page.lgwawork.com/home.html

内置 Microsoft、Edge、Azure Speech API 3 个接口(不过第1个已经不能用了),我们可以继续使用 Edge 接口,缺点是 Edge 接口不能调整说话风格、角色扮演类型,但语言语调还是可以自定义的

另个在设置中配置好 Azure 参数的话,则一样可以使用 Azure 进行文字转语音

值得一提的是 TTS-VUE 支持批量 TXT 文本转语音,如果有相关需求,倒是不错的选择(PS:这款软件非绿色版,需要安装才能使用)


8


   

高手必会(网页)

但以上平台、工具都只能说是牛刀小试,真要生成高质量的文本转语音,强大的编辑功能绝对少不了


8.1


  

微软👍

其实微软就有非常良心的提供在线免费文本转语音试用!

这个服务是真的用于帮你创作有声书的:https://speech.microsoft.com/audiocontentcreation

不仅支持普通话,更甚至连东北官话、广西普通话、吴语、台湾普通话、粤语等等都支持

关键是同时可以插入多个角色的声音,控制说话风格、停顿、静音、语速、单独字词的发音、语调、音高、音量,甚至可以非常细致的调整强中弱等停顿、语速音调相对值,甚至两个句子间的静音时长...

简单来说用他来创建有声书是高效利器,用来给短视频配音那简直是大材小用~

只是这里存在一个问题:微软的这个服务,并没有提供下载功能

这个合成的语音无法靠 IDM 等资源嗅探器下载,原本有的一个油猴脚本也早早失效、之前还有一个名为「Microsoft 音频内容创建 TTS 导出器」的扩展能实现下载,但现在也开始收费了🤷🏻‍♂️

难道就只能眼看着这么好的服务,没办法白嫖吗?

其实方法还是有的,并且和阿虚之前介绍过的只要能在线看的PDF就能免费下载只要能在线看的视频就能下载,方法有着异曲同工之妙

说白了就很简单嘛,既然我都能完整试听了,那我直接完整录音一遍不就等于我下载下来了

这里阿虚推荐用一个我一直珍藏的免费单文件录音软件——楼月MP3录音

直接打开软件,点开始录制,然后播放网页音频即可实现系统声音内录,鼠标等点击声音并不会录制进去

点击软件左上角文件 » 设置,可以自行设置启动快捷键,然后就是勾选「仅录制从电脑播放的声音」即可,录制的音频采样率、比特率、输出文件夹可自行另外设置

由于有人持续对公众号自动回复进行举报,遂暂时不再通过公众号自动回复提供软件下载,后续阿虚会把资源下载地址提供在文章置顶留言。若置顶留言也被和谐的话,请到储物间(axutongxue.com)右上角,搜索以下关键词获取资源:

文字转语音

Mac 系统更是简单,直接用系统自带的「语音备忘录」就能进行录制


8.2


  

讯飞智作👍

同理,懂了这个方法之后,除了微软,国产现在也有强大的文本转语音工具了

比如依靠这个方法,我们还能白嫖讯飞讯飞智作里面的「制作合成配音」:https://peiyin.xunfei.cn/make

也支持添加换气、停顿、控制连续发音、多音字、实现多人配音等,还能进行局部变速、局部变调、调整局部音量,同时最大优势在于一次性最多可以输入10000字!

本来这些主播声音都是需要VIP才能使用的(不开VIP只能试听这些声音,无法下载),最低价格都是45元/月

学会阿虚上述方法,不又省了

8.3


  

阿里云

另外阿里云在「登录并完成实名认证后」也可免费输入自定义文字进行文本转语音体验:https://ai.aliyun.com/nls/tts

提供的音色也是相当之多,并且拟真度不输微软,体验服务里也一样能控制文本的停顿、局部音量、多音字,还可以添加一些效果音等等

缺点就是体验版一次最多只能生成 300 个字的语音

8.4


  

腾讯云

腾讯云也是有免费文本转语音体验服务的:https://cloud.tencent.com/product/tts

同样可以借助上述录音方法来下载,不过就是没有更多的可操作性了,体验版一次也最多只能生成 500 个字的语音

8.5


  

百度云

百度云同样也有免费的文本转语音体验服务:https://ai.baidu.com/tech/speech/tts_online

不过能免费体验的音色就更少了,同时一次也最多只能生成 200 个字的语音,相比之下实属抠门

9


   

剪映(Win)

不过,如果你是为了做短视频配音,那直接用抖音旗下的「剪映」估计会方便很多:https://www.capcut.cn/

虽然大多数音色都需要付费,但免费的音色也有不错的选择,比如烂大街的解说小帅

不过用剪映来生成配音最大的好处是什么呢,就是支持「朗读跟随着文本更」新这个功能了

在反复修改视频文案的时候,就不用麻烦的到其他平台生成音频,拖入视频剪辑软件,重新对音视频轨道——简单来说主打一个方便

 

以上给大家安利的都是文字转语音工具,那反过来,语音转文字呢?

其实阿虚早在去年就有写过,网易、阿里、百度、上述的剪映,还有 OpenAI 开源 AI 语音识别模型 Whipser 都能用于免费的语音转文字、视频转文字,具体可以点击下方卡片看之前的文章

语音合成、语音识别其实都离不开 AI 技术的发展,如果你到现在都还简单的以为 AI = ChatGPT,那可真的就太掉队了

当然对于多数人而言,我认为最关键的还是——AI 它拉平了「学习能力认知高的人」和「有资产的人」之间的差距!

很多你之前得花钱才能办到的事,比如:各学科私教、视频会议总结、字幕翻译、编程、播音级配音、插画配图...等等都能靠 AI 免费实现了

如何利用 AI 替自己降本增效?可以点击看看阿虚之前这篇文章



继续滑动看下一个
阿虚同学
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存