Open czzerone opened 1 month ago
你好,想问下one-DM在训练阶段,是整个模型从头开始训练还是基于其他模型进行finetune呢,论文里提到使用4张3090的卡进行训练,想问下你们一共训练了多久
我们是从头开始预训练的。4张3090大概需要三天左右。
想问下,论文里有放出中文的测试效果,这个结果是用基于中文训练集训练出来的模型推理得到的吗
还有想问下,训练数据这里想请教下是怎么进行处理呢,如果要在中文数据集上训练的话,有处理好的数据集可以使用吗
是的,在中科院自动化所发布的CASIA中文数据集上进行训练的
你好,想问下one-DM在训练阶段,是整个模型从头开始训练还是基于其他模型进行finetune呢,论文里提到使用4张3090的卡进行训练,想问下你们一共训练了多久