FunAudioLLM / CosyVoice

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.
https://funaudiollm.github.io/
Apache License 2.0
4.81k stars 489 forks source link

如何用 粤语女 的音色来合成普通话呢 #387

Open 16dian11 opened 6 days ago

aluminumbox commented 6 days ago

this is not very stable, it is more likely to speak Cantonese

16dian11 commented 5 days ago

感谢回复。 是的,这是我比较疑惑的地方。粤语的bpe与普通话看起来并没有区别,但他们的发音很明显是不同的,在您训练的数据中,是在粤语的文本前面添加 | < yue > |进行训练吗? 如果我想要新增一个同样使用汉字的方言,比如四川话,是不是应该把训练时的文本前增加 | < chuan > | 这种类似的标记,然后修改whisper /tokenizer.py 中的LANGUAGES 字典?