xiuqhou / Relation-DETR

[ECCV2024 Oral] Official implementation of the paper "Relation DETR: Exploring Explicit Position Relation Prior for Object Detection"
Apache License 2.0
134 stars 11 forks source link

PositionRelationEmbedding的scale #31

Open Yzichen opened 4 days ago

Yzichen commented 4 days ago

Question

为什么PositionRelationEmbedding的scale要设置为100?一般不都是2*pi吗?

补充信息

No response

xiuqhou commented 3 days ago

我当时在写初版代码的时候是简单设置成了100,但发现效果挺不错,后续就没变过了。确实一般正余弦编码设置成2*pi,有时间可以验证下哪个效果更好,但我感觉影响没那么大。

Yzichen commented 3 days ago

在我这里影响很大. 对了, 你有没有试过直接利用几个linear layer来编码relation, 比如 4 --> 16 --> 16 --> n_heads.

xiuqhou commented 3 days ago

请问这个参数在你的结果中的AP差异有多大呢?如果2pi效果明显更好的话,我考虑在COCO上用2pi重新跑一下。另外我没有尝试过直接用linear来编码relation,relation经过sin-cos编码后的特征维度是4*16=64,如果你想尝试的话,可以考虑将linear设置成64。

Yzichen commented 3 days ago

我是在别的任务上使用的,设置为100有提升,但是设置为2*pi的话,就没有提升了。

Yzichen commented 1 day ago

你可以试试2*pi