炸裂了!ChatTTS,中文语音AI天花板,附免费使用网址,可平替 GPT-4o
炸裂了,兄弟们,今天给大家推荐一个中文TTS天花板,可广泛的用在一切需要配音的地方,电商、直播、各种自媒体、在线教育、客服、售后、情感主播...
关键它还是免费的,开源的,你可以用ChatTTS来训练自己的声优,变现赚钱
最近国产 AI 越来越给力前,几天出了一个 Yi-large,杀入“文字 AI 兵器排行榜” lmsys 前十名
这两天,又有一个国人做的语音TTS AI 横空出世
TTS,即“文字转语音”
这位叫ChatTTS 的少年英雄,一出来就冲顶 Github 热搜,并连续霸榜
ChatTTS是我听过的同类AI 中,最有人味儿的,语调自然,韵律表现力强,超过很多知名 TTS 软件
我拿着去问了周围人,确实区分不出来声音是不是AI生成的。
先看效果,下面是我在网上找的一个效果奇特的案例。下文我用 Elevenlabs,微软晓晓做了对比
之前介绍过的GPT-4o,微软晓晓,效果也不错,但是要收费!
关键ChatTTS还是开源的,我们不但可以免费用,还可以用自己的语料训练它,让它更符合自己的特定要求。以后想用便宜、性价比高的语音 AI 就靠它了
经常有小伙伴来问我,有没有什么简单好用的AI,让普通人也可以AI变现?
今天我就告诉你.,这就是机会
有了ChatTTS,不懂技术的小白,可以轻松合成不同的声音,下一步还可以将自己的声音克隆,再结合自媒体,利用AI变现赚钱
我前两天已给大家做了初步介绍,《ChatTTS,平替 GPT-4o“新语音”》
官方演示效果:
才过两天,好几个ChatTTS 网站上线,大家直接可以在线体验了
进入网站,输入你的文字,即可免费生成各种语音,还支持下载
我测试了5、6个类似网站,下面这个最靠谱,国内直联,使用稳定:
传送门:ChatTTS.com
另外还有人做了一个 ChatTTS Web UI,有技术的小伙伴可以自行部署
ChatTTS Web UI:github.com/jianchang512/ChatTTS-ui
下面为你详细介绍:
一、ChatTTS 简介
ChatTTS 专注于“对话场景”的文本转语音 AI
经过优化,适用于自然、对话式文本转语音详见:《ChatTTS,平替 GPT-4o“新语音”,中文语音 AI 天花板!附本地安装包》
“专注于对话”场景这个特性,很适合做一些对话类项目,“今夜不寂寞”之类,而情感类变现赚钱很容易!
想想现在打赏为啥流行?因为或洋或土、或唱或跳的主播们,提供了情绪价值
这里再给大家说一下ChatTTS的产品规划图
分为 4 万小时训练和 10 万小时训练,前者开源免费,后者要收费(暂无 API)
上图说得太专业,改用人话说就是:
“免费的已经发布,即将支持克隆语音,情绪方面还要进一步强化,还将上线实时生成,也许有 APP”
实时生成,类似于 gpt-4o,免费版效果接近微软晓晓 3.0,但操作下来比晓晓简单多了
二、在线使用
1、登录
网址:ChatTTS.com
为防止失联,我把它放到了 AI 工具聚合网站 91aitools
大家点击“阅读原文”,在“数字人”专栏选择
登录后,在右上角将文字调整为中文
注意:这个 ChatTTS.com 不是 ChatTTS 的官网
注意页面最下面的那行小字:“©2024 All rights reserved. unofficial website of ChatTTS”
“unofficial”,意思是非官方的
应该是哪位动作快的大神做的,不过这是个开源软件,套壳也算不上侵权
2、在线使用
进入主页后,就是生成界面
各参数如上:
① text: 要合成语音的文字
② Refine text:是否自动优化文本
③ 温度:随机性参数,越大,随机性越高。可能更好,可能更差
④ voice: 默认 2222, 决定音色的数字, 2222 | 7869 | 6653 | 4099 | 5099,可选其一,或者任意传入将随机使用音色
⑤custom_voice:用于定制声音音调生成的种子值,必须是正整数。如果设置了这个值,将优先使用,并忽略 voice
参数。
⑥ prompt:设置笑声、停顿等。例如,[oral_2][laugh_0][break_6]
再次强调,这个模型最大的好处是开源,可以用你自己的语音语料训练。
使用请遵守法律,公德良俗
3、与其他 AI 对比
下面,我们将ChatTTs与 微软晓晓 3.0、elevenlabs.io V2 对比下效果:
(1)谈职业生涯
第一段文稿:“但我现在对这个职业的热爱还是非常的,呵呵,非常的,嗯,怎么说呢?日月可鉴的,哈哈,嗯还是希望可以把这个职业做下去或者做这个声音相关领域的工作,嗯,就是把自己的优势发挥的大一点,尽可能能用到自己擅长的东西,而不是说为了工作,为了挣钱而工作。”
① ChatTTS
用的 2222,感觉语气有点声音,可以去掉
② elevenlabs.io V2
中文发音支持不好
③ 微软晓晓
晓晓3.0是商业软件
(2)谈做菜
第二段文字:“我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,不会轻易的滑落。”
① ChatTTS
② elevenlabs.io V2
③ 微软晓晓
见上个视频第二段
4、测试感受
总体测试下来:
(1)生成速度一般
(2)音色不可控,抽卡;情绪还差一点,适合平和的朗读,类似日常对话
(3)遇到一些符号,如括号,逗号等可能会出问题,数字也读不对。
(4)生成的音色确实不错,虽然不是字字都能对上,但是语音多读的文字不影响大体意思。
下次给大家讲讲如何本地部署!
想象一下,一个普通人,没有任何特殊技能,也没有专业MCN团队包装。只要你找到细分领域,用AI加持,当同行们还在用传统方法撰写文案,配音、做图时,你却能够利用AI工具快速准确地完成这些任务,坚持做短视频,平均每天发3条短视频。大富大贵不敢说,攒个零花钱还是有可以的。
今天的分享就到这里,请关注“AI变现研习社”,以免错过精彩内容。
别忘了点个赞、收藏、分享,来个“在看”哦!
想深度学习AI的朋友,也可直接加入VIP学习群!
付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!
以下是新人优惠券