Open zengyangzang opened 10 months ago
请问你使用什么GPU大概训练了多久到240epoch?
请问你使用什么GPU大概训练了多久到240epoch? 我看作者说V100训1天,但是我用A100已经训了三四天了
请问你使用什么GPU大概训练了多久到240epoch? 我看作者说V100训1天,但是我用A100已经训了三四天了
很奇怪,我用的学校的平台的A800,batchsize=8,CROHME训练集、 之前跑大概5分钟就有1epoch,差不多20个小时就可以跑完240轮。 最近不知道怎么回事,可能是学校超算有问题了,大约16分钟一个epoch,240轮需要两天多吧 我觉得你用A100跑三四天应该不太对
请问你使用什么GPU大概训练了多久到240epoch?
A800,两天左右
直接使用Github中的代码,没有任何改动,epoch为240,batchsize为8,不使用数据增强,随机种子也没用修改。为什么在CROHME2014数据集的正确率为56.09%,比论文中的57%的正确率低了0.91%。如果想复现出论文中的效果,超参数应该如何设置