Тёмный

最强中文文本转语音!ChatTTS安装部署方法 本地一键部署chattts、谷歌colab部署 GitHub Codespaces部署 普通话文本转语音TTS流畅和自然度的天花板 中文解说视频必备工具 

氪學家
Подписаться 53 тыс.
Просмотров 11 тыс.
50% 1

本期视频您将学到。chat tts 的3种使用方法,包括本地部署、谷歌colab部署,GitHub codespaces部署,部署方法100%成功。好兄弟们,这两天相信玩AI 文本转语音的小伙伴都被一个叫chatTTS的文本转语音工具刷屏了。
因为这个项目刚出不久,而且项目方这边更新的也比较频繁,项目分支呢也比较多,所以如果大家在实际使用中遇到和视频不符的情况,也可以看一下我视频下方的评论,也欢迎各位大佬在视频下方随时分享有关这个项目的动态。然后我也会把chatTTS官方的b站链接和Q群放在视频的描述,大家也可以联系官方获取最新的更新。
我简单说一下我使用chattts的一点心得。那chattts在生成语言的流畅度和拟人度上确实效果惊艳,这个大家有目共睹。但是如果目前作为生产力来说还存在一些问题。那首先就是我们无法训练自己的声音,只能用seed值去控制音色,这可能还暂时满足不了有声音定制化需求的小伙伴。当然在官方的开发计划上对于lora的训练也已经在计划之中。其次就是声音的稳定性和长文本输出上,其实当前官方放出的这个版本,并不适合生成太长的文本。那有些小伙伴可能说,我可以将文本切分之后分段生成,那这个是没有问题的,但是实际操作的时候,可能就会遇到切分之后分段文本的音色不统一。即使控制了seed也可能会出现这种情况。所以分段录制只能在一定程度上去解决统一性的问题,实际操作起来理论和成果还是有一定差距。最后就是在不同的硬件上跑,即使控制了seed值生成声音音色也可能会有变化。比如我相同一套参数,在colab上生成五个音频,然后再本地用同样的seed去跑,有三段的音色是差不多的,两段就完全不同。如果大家有控制音色需求的话,最好还是保持同一台设备去做输出。
𝕏 我的推特: / ytkexue
💎加入频道会员 享视频优先观看: / @kexue
相关链接:
官方项目:github.com/2noise/ChatTTS
官方B站:space.bilibili.com/455643159
官方Q群:808364215
注意:以下链接为第三方开发者开发,非官方版本:
colab版:github.com/6drf21e/ChatTTS_colab (作者也刚更新了win一键整合包)
GitHub codespaces版:github.com/yihong0618/ChatTTS
win一键包:github.com/jianchang512/ChatT...
关于GPU不生效解决方法:x.com/YTkexue/status/17972158...
热门AI应用:
💎ChatGPT Plus会员合租平台:bit.ly/hezu888
🔥 输入优惠码kxj 享全场95折
🔥 MJ、Netflix等会员均可使用优惠码
视频语言翻译(含对口型)
💎Heygen:bit.ly/Hey-Gen
💎Rask.AI:bit.ly/xRaskAI
💎Elevenlabs:bit.ly/11elevenlabs
✅相关链接:
Stable Diffusion入门到精通教程系列:
• Stable Diffusion教程 从入门到精通
谷歌账号注册教程:
• 🐼100%成功!Google账号2023注册...
Stable Diffusion汉化包:
github.com/VinsonLaro/stable-...
短信接码平台:
bit.ly/3uxXNAJ
Midjourney入门到精通教程系列:
• Midjourney教程 入门到精通
00:00 前言
01:16 colab 一键部署
07:12 GitHub 一键部署
10:25 本地部署 方法1
13:44 本地部署 方法2
14:02 使用技巧和不足

Наука

Опубликовано:

 

20 июл 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 80   
@jjcm6675
@jjcm6675 Месяц назад
先赞为敬
@kexue
@kexue Месяц назад
感谢支持哈哈
@user-vw1pq8bb8p
@user-vw1pq8bb8p Месяц назад
第一个好,可以a卡跑的快 感谢
@shawvi3892
@shawvi3892 Месяц назад
请问下博主,colab里面生成的声音seed后,如何在关闭后的第二天,再次打开colab训练的时候还可以找到这个seed?
@kexue
@kexue Месяц назад
colab里生成的seed 编号记下来 下次重开的时候填入就好了呀
@weijie_wang
@weijie_wang Месяц назад
mac用户骂骂咧咧点开了视频,并留下了一个赞😊
@kexue
@kexue Месяц назад
哈哈
@tyvanhou7800
@tyvanhou7800 Месяц назад
macOS真的没有一点办法吗?想用M1的MacBook部署到本地到底能不能实现啊?请教各位神仙哥哥姐姐,神烦!
@user-ze6ys9kx1g
@user-ze6ys9kx1g Месяц назад
感觉是比GPT-sovits好,sovits用起来吞字情况特别多。
@kexue
@kexue Месяц назад
嗯 不是一个类型的 sovits主打小样本训练克隆 tts主要是流畅度和拟人化
@user-hh7sr3lt1n
@user-hh7sr3lt1n 2 часа назад
大佬,有流式输出音频的视频没
@fenqin-td9zf
@fenqin-td9zf Месяц назад
这执行力还是可以了
@tyvanhou7800
@tyvanhou7800 Месяц назад
请问下win一键整合包要如何使用?Mac用户在ai这件事情上感觉严重落后。谢谢作者,期待回复!
@kexue
@kexue Месяц назад
mac下可以参考这个 github.com/jianchang512/ChatTTS-ui?tab=readme-ov-file#macos-%E4%B8%8B%E6%BA%90%E7%A0%81%E9%83%A8%E7%BD%B2 (我不是mac所以测试不了抱歉)
@tyvanhou7800
@tyvanhou7800 Месяц назад
@@kexue 非常感谢您!
@fenqin-td9zf
@fenqin-td9zf Месяц назад
请问你运营这个油管你是服务器ip还是专门买的住宅了
@kexue
@kexue Месяц назад
就最普通的✈
@fenqin-td9zf
@fenqin-td9zf Месяц назад
@@kexue 多谢了
@kexue
@kexue Месяц назад
@@fenqin-td9zf 加油
@user-kl5qv5go5o
@user-kl5qv5go5o Месяц назад
你显卡太牛,我980表示羡慕
@kexue
@kexue Месяц назад
前。。。前辈好
@Mobaiya
@Mobaiya Месяц назад
期待训练模型
@kexue
@kexue Месяц назад
哈哈 好饭不怕晚
@statnet-bv2qu
@statnet-bv2qu Месяц назад
good
@kexue
@kexue Месяц назад
奈斯
@user-td9mf8ey6r
@user-td9mf8ey6r Месяц назад
如何匹配到视频上用?只是读文字,那只能用于播客
@kexue
@kexue Месяц назад
??我这个视频的开头算不算用在了视频上。。。如果说要对口型的话 需要配合其他lip-sync项目 可以参考ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-qWvCFDMdkuA.html
@liujinhui7046
@liujinhui7046 Месяц назад
群满了
@kexue
@kexue Месяц назад
太火了哈哈
@zoearthmoon
@zoearthmoon Месяц назад
❤❤
@weizhang-en9ks
@weizhang-en9ks Месяц назад
大佬,我问一下 为什么我用谷歌云端训练完成,下载模型的时候同时下载了三个模型,但是只有一个下载到了,其余两个蓝色圈圈转完了 浏览器下载那里也看不到另外两个模型,下载文件那里也没有😅。
@kexue
@kexue Месяц назад
???这个模型不支持训练啊?
@weizhang-en9ks
@weizhang-en9ks Месяц назад
@@kexue 不是,我用的是花儿开发的那个谷歌云,训练完成了,下个那个模型的时候只能下载一个,其余的点了下载 蓝色圈圈转完也没有看到文件。。。
@weizhang-en9ks
@weizhang-en9ks Месяц назад
他们都用本地部署,问他们全都不了解,看你用谷歌云 想问问你知不知道什么问题,哈哈 还请见谅。
@kexue
@kexue Месяц назад
@@weizhang-en9ks 大概率是梯子不稳 或者浏览器拦截了 现在浏览器为了安全只能下载一次 下载第二次的时候 会在地址栏右边 有一个感叹号 需要手动确认
@weizhang-en9ks
@weizhang-en9ks Месяц назад
@@kexue 哈哈,他是一点提示都没有 就很离谱,我已经换个Dl云端解决了。
@iithades
@iithades Месяц назад
真是盼什么来什么,想学什么就出什么,氪学家威武霸气屌炸天!
@kexue
@kexue Месяц назад
哈哈 请给我寄点护肝片
@iithades
@iithades Месяц назад
@@kexue 请教个问题大佬,如果我要增加笑声是在想增加的地方填写[laugh]还是填写[uv_laugh]? 还有[laugh_2]的意思是啥,laugh 2s么?
@kexue
@kexue Месяц назад
@@iithades 额 参数我也没来得及研究抱歉 可以都试一下。。。我主要就调了一下温度还有top p和top k 这几个值调小之后音频会更稳定 吃字和错字更少
@user-fe3bo6ss1m
@user-fe3bo6ss1m Месяц назад
有api接口版本吗?
@kexue
@kexue Месяц назад
第三个提到的本地版本是有个API的按钮的 但是我没测试过
@user-de4xv7dk6k
@user-de4xv7dk6k Месяц назад
同样的音色(一摸一样的配置)2次配的音都不一样,大家有没有测试到
@kexue
@kexue Месяц назад
有遇到过这种情况 可以多刷几次
@user-jb7mv7bj6e
@user-jb7mv7bj6e Месяц назад
玩玩可以,还是等后期完善吧
@kexue
@kexue Месяц назад
嗯 官方在憋大招
@dianzhonglong1123
@dianzhonglong1123 Месяц назад
怎么训练特定的音色呢
@kexue
@kexue Месяц назад
现在还没开训练。。。
@jinxing-xv3py
@jinxing-xv3py Месяц назад
呀咩爹😂
@kexue
@kexue Месяц назад
哒咩!
@stu-work3326
@stu-work3326 Месяц назад
声音模型咋训练呢?
@kexue
@kexue Месяц назад
官方未开放训练
@stu-work3326
@stu-work3326 Месяц назад
@@kexue 那只能抽卡,抽出三上老师了啊😅
@kexue
@kexue Месяц назад
@@stu-work3326 哈哈哈 请交出你的番号。。。额不是。。。SEED。。。哔。。。我们是一个正经的频道
@stu-work3326
@stu-work3326 Месяц назад
@@kexue 不要种子,现在是磁力时代😜
@kexue
@kexue Месяц назад
@@stu-work3326 啥呀 我说的是声音的seed哈哈哈
@RogelSeavey
@RogelSeavey 21 день назад
QQ群已经满了,申请加入组织。
@kexue
@kexue 20 дней назад
额 我没组织没记录无业游民抱歉大佬。。。
@user-ix8re6lj6g
@user-ix8re6lj6g Месяц назад
为什么我关闭了梯子,也关闭了代理,app.exe打不开,打开闪退
@kexue
@kexue Месяц назад
试一下我视频中提到的另一个
@allaboutEPL
@allaboutEPL Месяц назад
学习ING
@kexue
@kexue Месяц назад
加油加油!
@vidyamayi
@vidyamayi Месяц назад
可以克隆声音吗
@kexue
@kexue Месяц назад
现在不行
@mantulife
@mantulife Месяц назад
不能
@jiupeak9250
@jiupeak9250 Месяц назад
本期番号多少
@kexue
@kexue Месяц назад
110120119
@hujuzhang
@hujuzhang Месяц назад
你这个头像出个教程可好?
@kexue
@kexue Месяц назад
这不用教程啊 就是一个静态的图片 然后嘴巴用了几个不同的形状拼了一下循环播放
@wujie3883
@wujie3883 Месяц назад
只能生成30秒
@user-rc4up2oy6n
@user-rc4up2oy6n Месяц назад
话说,up主,使用的是什么靠谱科学上网😂
@user-jb7mv7bj6e
@user-jb7mv7bj6e Месяц назад
一般只要主做视频的都是自建的,网上教程多的是,还有,这个应该叫youtuber,UP主是B站的称呼
@NoneCc-dw3pm
@NoneCc-dw3pm Месяц назад
​@@user-jb7mv7bj6e对的,长期使用还是自己搭建一个好
@TPDR
@TPDR Месяц назад
将近3G的软件下载了,安装过程中提示没发现GPU显卡,只能用CPU生成声音,结果就是处理速度极慢200多字的英文生成声音需要将近10分钟!
@kexue
@kexue Месяц назад
关于用GPU的方式我在视频中提到了 而且视频下面描述也有方法 可以参考下
@TPDR
@TPDR Месяц назад
@@kexue 谢谢
@kexue
@kexue Месяц назад
@@TPDR 加油
@kunzew7503
@kunzew7503 Месяц назад
如果不能固定住人声,无限制长度,没鸟用
@kexue
@kexue Месяц назад
下一版可能会好一些 这个版本用官方的话说 应该是“学术探讨”,只不过没想到放出来这么火
@user-gw7xd8nx3q
@user-gw7xd8nx3q Месяц назад
群满了
@kexue
@kexue Месяц назад
哈哈太火了