djiajunustc / TransVG

163 stars 27 forks source link

师兄您好呀 #37

Open 0000000wmz opened 1 year ago

0000000wmz commented 1 year ago

师兄您好,我重新训练了一遍TransVG的模型,用的resnet50在referit数据集上做的,但是test:0.66,val:0.68,但是一直没有得到您论文中的结果,我是用的双卡3090分布式训练,超参数保持不变,您看这有什么问题吗?还有一个问题请教您,您所公布的预训练模型精度验证了一下都是很低,您这所公布的预训练模型是需要加载到train里面再重新训练的吗?希望好师兄可以给我解答一下,呜呜呜

Nikol-coder commented 1 year ago

您好,师兄,请问您训练了一遍TransVG的模型,能帮忙提供一下您用到的数据集吗?我到处东拼西凑,前3个数据集真的不好下载TnT,谢谢师兄!

Nikol-coder commented 1 year ago

师兄您好,我重新训练了一遍TransVG的模型,用的resnet50在referit数据集上做的,但是test:0.66,val:0.68,但是一直没有得到您论文中的结果,我是用的双卡3090分布式训练,超参数保持不变,您看这有什么问题吗?还有一个问题请教您,您所公布的预训练模型精度验证了一下都是很低,您这所公布的预训练模型是需要加载到train里面再重新训练的吗?希望好师兄可以给我解答一下,呜呜呜

您好,师兄,请问您训练了一遍TransVG的模型,能帮忙提供一下您用到的数据集吗?我到处东拼西凑,前3个数据集真的不好下载TnT,谢谢师兄!

0000000wmz commented 1 year ago

你加我微信13330411658 ---- 回复的原邮件 ---- | 发件人 | @.> | | 发送日期 | 2023年08月23日 17:23 | | 收件人 | djiajunustc/TransVG @.> | | 抄送人 | 0000000wmz @.>, Author @.> | | 主题 | Re: [djiajunustc/TransVG] 师兄您好呀 (Issue #37) |

师兄您好,我重新训练了一遍TransVG的模型,用的resnet50在referit数据集上做的,但是test:0.66,val:0.68,但是一直没有得到您论文中的结果,我是用的双卡3090分布式训练,超参数保持不变,您看这有什么问题吗?还有一个问题请教您,您所公布的预训练模型精度验证了一下都是很低,您这所公布的预训练模型是需要加载到train里面再重新训练的吗?希望好师兄可以给我解答一下,呜呜呜

您好,师兄,请问您训练了一遍TransVG的模型,能帮忙提供一下您用到的数据集吗?我到处东拼西凑,前3个数据集真的不好下载TnT,谢谢师兄!

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

CoCNetHub commented 10 months ago

您好,我用公布的预训练模型进行训练,结果也很低,请问是什么原因呢?

0000000wmz commented 10 months ago

目前为止,基本上的visual grounding任务都比论文少一两个点,尽管使用预训练模型。我试了n多种方法基本无解。

---- 回复的原邮件 ---- | 发件人 | @.> | | 发送日期 | 2023年12月28日 16:56 | | 收件人 | djiajunustc/TransVG @.> | | 抄送人 | 0000000wmz @.>, Author @.> | | 主题 | Re: [djiajunustc/TransVG] 师兄您好呀 (Issue #37) |

您好,我用公布的预训练模型进行训练,结果也很低,请问是什么原因呢?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

CoCNetHub commented 10 months ago

目前为止,基本上的visual grounding任务都比论文少一两个点,尽管使用预训练模型。我试了n多种方法基本无解。 ... ---- 回复的原邮件 ---- |发件人 |@.> | |发送日期 |2023年12月28日 16:56 | |收件人 |djiajunustc/TransVG @.> | |抄送人 |0000000wmz @.>, 作者 @.> | |主题 |Re: [djiajunustc/TransVG] 师兄您好呀 (Issue #37) | 您好,我用公布的预训练模型进行训练,结果也很低,请问是什么原因呢? — 直接回复此邮件,在 GitHub 上查看,或取消订阅。 您收到此消息是因为您创作了该线程。邮件 ID:@.>

好的,谢谢~

djiajunustc commented 8 months ago

@0000000wmz 你的GPU数量和我不一样,batch size就不一样,试一下减少lr?或者看看能不能换成单精度,然后让batch size和我尽可能靠近。

我给的预训练模型就是预训练的backbone weight,需要在vg数据上finetune的。