PlayVoice / vits_chinese

Best practice TTS based on BERT and VITS with some Natural Speech Features Of Microsoft; Support ONNX streaming out!
https://huggingface.co/spaces/maxmax20160403/vits_chinese
MIT License
1.15k stars 168 forks source link

关于学生模型 #144

Open TinaChen95 opened 10 months ago

TinaChen95 commented 10 months ago

请问学生模型为啥只重用了教师模型的 enc_q 和 flow,而不重用文本编码器呢? 学生模型的tuning是更适合用同一个数据集的教师模型做transfer,还是更适合用其他学生模型做transfer呢? 训练学生模型一般多久收敛呀?

MaxMax2016 commented 10 months ago

请问学生模型为啥只重用了教师模型的 enc_q 和 flow,而不重用文本编码器呢?

如果只需要减小decoder的参数,可以的啊

学生模型的tuning是更适合用同一个数据集的教师模型做transfer,还是更适合用其他学生模型做transfer呢?

这是以同一数据为前提进行的,可能叫法不准确,目的就是用同一数据上训练的大参数模型来训练小参数模型

训练学生模型一般多久收敛呀?

至少需要训练500 epochs吧

Isshang commented 7 months ago

请问学生模型为啥只重用了教师模型的 enc_q 和 flow,而不重用文本编码器呢?

如果只需要减小decoder的参数,可以的啊

学生模型的tuning是更适合用同一个数据集的教师模型做transfer,还是更适合用其他学生模型做transfer呢?

这是以同一数据为前提进行的,可能叫法不准确,目的就是用同一数据上训练的大参数模型来训练小参数模型

训练学生模型一般多久收敛呀?

至少需要训练500 epochs吧 作者你好,知识蒸馏用的什么方法呀?有参考文献或者项目吗?