2个疑问 - Githubissues

YoungSeng / DiffuseStyleGesture

DiffuseStyleGesture: Stylized Audio-Driven Co-Speech Gesture Generation with Diffusion Models (IJCAI 2023) | The DiffuseStyleGesture+ entry to the GENEA Challenge 2023 (ICMI 2023, Reproducibility Award)

MIT License

147 stars 21 forks source link

2个疑问 #29

Open YoungSeng opened 8 months ago

YoungSeng commented 8 months ago

1）你放出的模型是只在ZEGGS上训练的吗，step为450000时候的模型，我按照指示重新训了似乎结果不及你公开的那个模型效果 2）关于diffusion实时加速师弟你有好建议吗？（我试了什么都不动，PLMS 和DDIM 都还是慢）

YoungSeng commented 8 months ago

DiffusStyleGesture是在ZEGGS上训练的，plus是在BEAT和TWH上训练的，是的，我们也发现了这个，事实上应该越多越好；实时应该做不到，确实生成比较慢，是一个问题，跟这个模型的架构有关，如果推理一定要追求速度，可以推理的时候把噪声步改小，例如把1000改成100，尝试效果也还好。