yeungchenwa / FontDiffuser

[AAAI2024] FontDiffuser: One-Shot Font Generation via Denoising Diffusion with Multi-Scale Content Aggregation and Style Contrastive Learning
https://yeungchenwa.github.io/fontdiffuser-homepage/
298 stars 26 forks source link

About the color of background #62

Open Hryxyhe opened 2 weeks ago

Hryxyhe commented 2 weeks ago

您好,十分感谢您的工作的启示。我目前在尝试训练自己的扩散模型,生成白底黑字的图片时,目前模型总是会生成彩色的背景,请问在训练过程中您遇到过类似问题吗?您能给出一些建议吗

yeungchenwa commented 2 weeks ago

@Hryxyhe 您好,请问有具体的可视化样例供分析吗。

Hryxyhe commented 2 weeks ago

@Hryxyhe 您好,请问有具体的可视化样例供分析吗。

微信图片_20241112115052

您可以看看我的一些可视化,其中每组图片的第三张为生成图像,第四张为参考风格

yeungchenwa commented 2 weeks ago

@Hryxyhe 您好,请问有具体的可视化样例供分析吗。

微信图片_20241112115052 您可以看看我的一些可视化,其中每组图片的第三张为生成图像,第四张为参考风格

请问你训练了多久,多少个epoch或者iter数,batch size是多少。依据经验,这种情况很可能是因为训练的iters数还不够。

Hryxyhe commented 2 weeks ago

@Hryxyhe 您好,请问有具体的可视化样例供分析吗。

微信图片_20241112115052 您可以看看我的一些可视化,其中每组图片的第三张为生成图像,第四张为参考风格

请问你训练了多久,多少个epoch或者iter数,batch size是多少。依据经验,这种情况很可能是因为训练的iters数还不够。

在单卡bs=16,两卡的情况下迭代了80000次依旧没有解决这个问题。而看字形训练的思路应该是没有问题的,损失也收敛了。这是训练还不够吗?我需不需要进行更久的尝试?