Plachtaa / VITS-fast-fine-tuning

This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion
Apache License 2.0
4.69k stars 703 forks source link

纯C底模,生成有大佐的调调 #530

Open lvsh2012 opened 9 months ago

lvsh2012 commented 9 months ago

数据集是13条 2-10s 的短音频,采用 纯C底模,没有添加辅助选项,训练了200 epochs

下面是效果:

示例文字:“VITS 快速微调这个代码库会指导你如何将自定义角色(甚至你自己),加入预训练的VITS模型中,在1小时内的微调使模型具备如下功能“

生成音频:

https://github.com/Plachtaa/VITS-fast-fine-tuning/assets/2322808/0c5ec901-9b18-4581-b934-c167f3baa0db

各位大佬,是数据集太少,还是epochs 训练太少,还是哪里配置的原因,才会出现大佐的调调

tom20180101 commented 9 months ago

同样的问题,我用了15个视频训练,训练了900 epochs ,没有辅助选项 ,使用的CJE,训练出来的中文一样有大佐的调调