2000条说话人音色稳定性评估+男女年龄划分(实验)+在线试听+音色pt文件下载

2noise / ChatTTS

A generative speech model for daily dialogue.

https://2noise.com

GNU Affero General Public License v3.0

31.19k stars 3.39k forks source link

Closed 6drf21e closed 3 months ago

6drf21e commented 3 months ago

2000条说话人音色稳定性评估+男女年龄划分(实验)+在线试听+音色pt文件下载

项目代码已开源

直接体验：

kangyiwen commented 3 months ago

你V多少？请教下你怎么为音色打标签和分类。

6drf21e commented 3 months ago

你V多少？请教下你怎么为音色打标签和分类。

标签是自己找了一些样本音色，然后根据 https://modelscope.cn/models/iic/speech_eres2netv2_sv_zh-cn_16k-common/ 判断和目标音色的相似度。男女准确度还行其他差点

libukai commented 3 months ago

这个项目挺不错，已推荐

fastfading commented 3 months ago

音色多没有用，能不能只挑出来几个有用比较有特色的音色。
比如萌妹萝莉御姐老师 etc

jin1258804025 commented 3 months ago

我生产了1万个音色 http://ttslist.aiqbh.com/10000cn/

你V多少？请教下你怎么为音色打标签和分类。

请教下，怎么将wav文件转换为pt文件的？

orderer0001 commented 3 months ago

请教大佬音色很稳定，但是有一个问题，合成的语音，最开始总会出现一个sbdi的发音，这是为什么？试了几个seed pt都是这样。有解决办法吗？