2noise / ChatTTS

A generative speech model for daily dialogue.
https://2noise.com
GNU Affero General Public License v3.0
31.19k stars 3.39k forks source link

2000条说话人音色稳定性评估+男女年龄划分(实验)+在线试听+音色pt文件下载 #328

Closed 6drf21e closed 3 months ago

6drf21e commented 3 months ago

2000条说话人音色稳定性评估+男女年龄划分(实验)+在线试听+音色pt文件下载

项目代码已开源

https://github.com/6drf21e/ChatTTS_Speaker

直接体验:

image

image

kangyiwen commented 3 months ago

我生产了1万个音色 http://ttslist.aiqbh.com/10000cn/

你V多少? 请教下你怎么为音色打标签和分类。

6drf21e commented 3 months ago

你V多少? 请教下你怎么为音色打标签和分类。

标签是自己找了一些样本音色, 然后根据 https://modelscope.cn/models/iic/speech_eres2netv2_sv_zh-cn_16k-common/ 判断和目标音色的相似度。 男女准确度还行 其他差点

libukai commented 3 months ago

这个项目挺不错,已推荐

fastfading commented 3 months ago

音色多没有用, 能不能只挑出来几个有用比较有特色的音色。
比如 萌妹 萝莉 御姐 老师 etc

jin1258804025 commented 3 months ago

我生产了1万个音色 http://ttslist.aiqbh.com/10000cn/

你V多少? 请教下你怎么为音色打标签和分类。

请教下,怎么将wav文件转换为pt文件的?

orderer0001 commented 3 months ago

请教大佬 音色很稳定,但是有一个问题,合成的语音,最开始总会出现一个sbdi的发音,这是为什么?试了几个seed pt都是这样。有解决办法吗?