LBH1024 / CAN

When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition (ECCV’2022 Poster).
MIT License
364 stars 59 forks source link

为什么复现不出论文中的效果 #35

Open zengyangzang opened 10 months ago

zengyangzang commented 10 months ago

直接使用Github中的代码,没有任何改动,epoch为240,batchsize为8,不使用数据增强,随机种子也没用修改。为什么在CROHME2014数据集的正确率为56.09%,比论文中的57%的正确率低了0.91%。如果想复现出论文中的效果,超参数应该如何设置

Da1sypetals commented 5 months ago

请问你使用什么GPU大概训练了多久到240epoch?

gaoshaojie0708 commented 5 months ago

请问你使用什么GPU大概训练了多久到240epoch? 我看作者说V100训1天,但是我用A100已经训了三四天了

zengyangzang commented 5 months ago

请问你使用什么GPU大概训练了多久到240epoch? 我看作者说V100训1天,但是我用A100已经训了三四天了

很奇怪,我用的学校的平台的A800,batchsize=8,CROHME训练集、 之前跑大概5分钟就有1epoch,差不多20个小时就可以跑完240轮。 最近不知道怎么回事,可能是学校超算有问题了,大约16分钟一个epoch,240轮需要两天多吧 我觉得你用A100跑三四天应该不太对

zengyangzang commented 5 months ago

请问你使用什么GPU大概训练了多久到240epoch?

A800,两天左右