netease-youdao / EmotiVoice

EmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine
Apache License 2.0
6.63k stars 555 forks source link

> 值得一提的是,我新克隆了一个音色,它对中文的效果很好,但是偶尔会掺杂一点点杂音。但是对英文的效果,读的流畅度不理想,更像是一个单词一个单词的念。我想请问,杂音的出现和英文流畅度问题分别是与数据前处理有关还是与预训练模型有关? #108

Closed li1213876867 closed 5 months ago

li1213876867 commented 5 months ago
          > 值得一提的是,我新克隆了一个音色,它对中文的效果很好,但是偶尔会掺杂一点点杂音。但是对英文的效果,读的流畅度不理想,更像是一个单词一个单词的念。我想请问,杂音的出现和英文流畅度问题分别是与数据前处理有关还是与预训练模型有关?

Could you please provide more detailed information about your dataset for voice cloning?

Originally posted by @syq163 in https://github.com/netease-youdao/EmotiVoice/issues/101#issuecomment-1886637815 我是想克隆一个音色id为01016的音色,我先使用该音色的TTS合成了300多条纯净的语音,然后在来早前处理与训练。