dailenson / One-DM

Official Code for ECCV 2024 paper — One-Shot Diffusion Mimicker for Handwritten Text Generation
MIT License
298 stars 29 forks source link

关于训练细节 #11

Open czzerone opened 1 month ago

czzerone commented 1 month ago

你好,想问下one-DM在训练阶段,是整个模型从头开始训练还是基于其他模型进行finetune呢,论文里提到使用4张3090的卡进行训练,想问下你们一共训练了多久

dailenson commented 1 month ago

我们是从头开始预训练的。4张3090大概需要三天左右。

czzerone commented 1 month ago

想问下,论文里有放出中文的测试效果,这个结果是用基于中文训练集训练出来的模型推理得到的吗

czzerone commented 1 month ago

还有想问下,训练数据这里想请教下是怎么进行处理呢,如果要在中文数据集上训练的话,有处理好的数据集可以使用吗

dailenson commented 1 month ago

想问下,论文里有放出中文的测试效果,这个结果是用基于中文训练集训练出来的模型推理得到的吗

是的,在中科院自动化所发布的CASIA中文数据集上进行训练的