纯C底模，生成有大佐的调调 - Githubissues

Plachtaa / VITS-fast-fine-tuning

This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion

Apache License 2.0

4.69k stars 703 forks source link

纯C底模，生成有大佐的调调 #530

Open lvsh2012 opened 9 months ago

lvsh2012 commented 9 months ago

数据集是13条 2-10s 的短音频，采用纯C底模，没有添加辅助选项，训练了200 epochs

下面是效果：

示例文字：“VITS 快速微调这个代码库会指导你如何将自定义角色（甚至你自己），加入预训练的VITS模型中，在1小时内的微调使模型具备如下功能“

生成音频:

https://github.com/Plachtaa/VITS-fast-fine-tuning/assets/2322808/0c5ec901-9b18-4581-b934-c167f3baa0db

各位大佬，是数据集太少，还是epochs 训练太少，还是哪里配置的原因，才会出现大佐的调调

tom20180101 commented 9 months ago

同样的问题，我用了15个视频训练，训练了900 epochs ，没有辅助选项，使用的CJE，训练出来的中文一样有大佐的调调