6drf21e / ChatTTS_colab

🚀 一键部署(含离线整合包)!基于 ChatTTS ,支持流式输出、音色抽卡、长音频生成和分角色朗读。简单易用,无需复杂安装。
1.96k stars 245 forks source link

一个batch中,不同段的音色还是略有不同 #17

Open paulcx opened 4 months ago

paulcx commented 4 months ago

始终无法做到音色的控制啊

6drf21e commented 3 months ago

是的不同的seed稳定性不太一样。建议多测试几个,或者抽卡的时候填写多行文本去抽,方便找出音色不稳定的。

paulcx commented 3 months ago

几乎所有 seed都无法控制,区别是有的seed音色差异小,有的音色很明显不同。

Nanosk07 commented 3 months ago

几乎所有 seed都无法控制,区别是有的seed音色差异小,有的音色很明显不同。

没办法 他就是这样个样子 控制不了

6drf21e commented 3 months ago

https://github.com/6drf21e/ChatTTS_Speaker 2000条说话人音色稳定性评估+男女年龄划分(实验)+在线试听+音色pt文件下载

立即体验:

新的项目 稳定性评测+音色区分

可以试试能否找到更稳定和喜欢的音色,欢迎反馈。

6drf21e commented 3 months ago

其中的 rank_single 就是专门评估一个 batch 的稳定性

paulcx commented 3 months ago

https://github.com/6drf21e/ChatTTS_Speaker 2000条说话人音色稳定性评估+男女年龄划分(实验)+在线试听+音色pt文件下载

立即体验:

新的项目 稳定性评测+音色区分

可以试试能否找到更稳定和喜欢的音色,欢迎反馈。

为什么有的时候会吃字?