关于300M-instruct模型的问题

FunAudioLLM / CosyVoice

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.

https://funaudiollm.github.io/

Apache License 2.0

6.54k stars 703 forks source link

关于300M-instruct模型的问题 #660

Open yyliuCecilia opened 1 week ago

yyliuCecilia commented 1 week ago

请教前辈！感谢指导和解答~~~ 1.是否可以基于pretrained_models/CosyVoice-300M-Instruct继续微调新的模型呢？ 2.如果可以的话，是否可以用examples/libritts/cosyvoice/run.sh里面的train脚本？ 3.如果可以的话，微调数据是不是也要有wav和对应的prompt/instruct标签才行呢？比如我想用自己的声音微调300M-instruct模型，这能不能做到呢？

aluminumbox commented 1 week ago

可以
可以，但注意instruct推理时llm不需要embedding，训练时也一样修改一下
是的需要自己准备标签