Plachtaa / VITS-fast-fine-tuning

This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion
Apache License 2.0
4.69k stars 703 forks source link

真人中文效果选择 #498

Open modiao2018 opened 10 months ago

modiao2018 commented 10 months ago

请问,中文真人微调场景,底模用C还是CJ好,从我目前的测试来看,我提供了将近30分钟的我自己高质量的语音,CJ(不带辅助训练集),跑了12000多步,推理的结果音色很接近,但就是很多字都不准(有点外国人读的感觉)。