232525 / PureT

Implementation of 'End-to-End Transformer Based Model for Image Captioning' [AAAI 2022]
63 stars 12 forks source link

transformer分数 #24

Open LeXueTao opened 10 months ago

LeXueTao commented 10 months ago

你好,感谢你优秀的工作。我最近计划使用swin特征进行新的工作,使用swin特征标定transformer的效果,xe阶段cider分数112,scst结束是134,距离论文中136有距离,请问你训练transfomer时xe阶段cider分数是多少?感谢。

232525 commented 10 months ago

代码太久远了,找了一下没找到ablation结果的备份,不过如果想要更高的XE分数,你可以尝试一下Cosine LR Scheduler,据我的经验,应该会比Noam或者普通的warm up+linear要好一些

LeXueTao commented 10 months ago

好滴好滴,谢谢回复