Closed LemonQC closed 2 years ago
你好,这些数据都是在val set的结果。是我自己复现的
在VQA2上的差距这么d大么,还是参数设置的问题?
是按照offical release代码https://github.com/yanxinzju/CSS-VQA 复现的结果。但是论文提供的特征没有坐标信息,为了可视化和与需要额外标注的方法(HINT SCR)公平比较,我们改成了论文https://github.com/erobic/negative_analysis_of_grounding 提供的特征和HAT标注。也就是说除了用的特征和HAT标注不同,其他的部分应该都是和原论文公开代码一致的。
实验结果来看,复现得到的VQA-CP结果差别不大,我们是取了多次实验的均值。但是VQA v2上面复现的结果确实有比较大差距。我们table 1实验的所有的代码都是公开的,CSS这篇文章也是开源的,您可以自己复现一下。 按照我们的实验,所有利用了entropy惩罚的方法,都在v2上有比较明显的下降。
嗯嗯,多谢您的回复,不知道方不方便加一下好友,交流一下这个方面的问题呢
Shandong University | |
---|---|
@. | 签名由网易邮箱大师定制 在2021年11月10日 @.> 写道:
是按照offical release代码https://github.com/yanxinzju/CSS-VQA复现的结果。但是论文提供的特征没有坐标信息,为了可视化和与需要额外标注的方法(HINT SCR)公平比较,我们改成了论文https://github.com/erobic/negative_analysis_of_grounding提供的特征和HAT标注。也就是说除了用的特征和HAT标注不同,其他的部分应该都是和原论文公开代码一致的。
实验结果来看,复现得到的VQA-CP结果差别不大,我们是取了多次实验的均值。但是VQA v2上面复现的结果确实有比较大差距。我们table 1实验的所有的代码都是公开的,CSS这篇文章也是开源的,您可以自己复现一下。
— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.
嗯嗯,多谢您的回复,不知道方不方便加一下好友,交流一下这个方面的问题呢 | | Shandong University | | @. | 签名由网易邮箱大师定制 在2021年11月10日 @.> 写道: 是按照offical release代码https://github.com/yanxinzju/CSS-VQA复现的结果。但是论文提供的特征没有坐标信息,为了可视化和与需要额外标注的方法(HINT SCR)公平比较,我们改成了论文https://github.com/erobic/negative_analysis_of_grounding提供的特征和HAT标注。也就是说除了用的特征和HAT标注不同,其他的部分应该都是和原论文公开代码一致的。 实验结果来看,复现得到的VQA-CP结果差别不大,我们是取了多次实验的均值。但是VQA v2上面复现的结果确实有比较大差距。我们table 1实验的所有的代码都是公开的,CSS这篇文章也是开源的,您可以自己复现一下。 — You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.
兄弟,方便留个联系方式吗,我是一个刚入门NLP的菜鸟,想很探讨一下有关问题
@SakerLiu 兄弟,我发现你关注的内容和我比较相似,可以加个联系方式吗
@Shj451148969 当然可以,这个结果我用RTX titian可以复现,但是在30系列结构的显卡上可能效果略差。我的邮箱是SakerLiuJin@163.com
最近新调试了一下,3090也可以达到很好的
效果
在VQA2上的差距这么d大么,还是参数设置的问题?
您好,请问这个表格是您自己的复现结果吗?我发现自己复现的RUBi这个baseline效果和您表格差不多,但在v2 val上达不到RUBi或GGE原文,性能也是50出头,差距还有点大,方便问下后续您是如何提升v2性能的吗
您好,你在table.1中的实验数据都是在test上进行的么,是自己复现了一遍还是从原论文中cite的呢,谢谢