FunAudioLLM / CosyVoice

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.
https://funaudiollm.github.io/
Apache License 2.0
6.54k stars 703 forks source link

关于300M-instruct模型的问题 #660

Open yyliuCecilia opened 1 week ago

yyliuCecilia commented 1 week ago

请教前辈!感谢指导和解答~~~ 1.是否可以基于pretrained_models/CosyVoice-300M-Instruct继续微调新的模型呢? 2.如果可以的话,是否可以用examples/libritts/cosyvoice/run.sh里面的train脚本? 3.如果可以的话,微调数据是不是也要有wav和对应的prompt/instruct标签才行呢?比如我想用自己的声音微调300M-instruct模型,这能不能做到呢?

aluminumbox commented 1 week ago
  1. 可以
  2. 可以,但注意instruct推理时llm不需要embedding,训练时也一样修改一下
  3. 是的需要自己准备标签