Open kouyuanbo opened 6 months ago
因为decoder里做的那个回归之后有个detach的操作,这时候梯度是不传导的,所以获得了transformer的输出之后会再计算一次然后加上前一层detach的结果,这一部分操作在原先的Deformable DETR里也有你可以参考一下。
因为decoder里做的那个回归之后有个detach的操作,这时候梯度是不传导的,所以获得了transformer的输出之后会再计算一次然后加上前一层detach的结果,这一部分操作在原先的Deformable DETR里也有你可以参考一下。
谢谢回复!原来是梯度的问题。是的我在代码中也看到了Rotated Deformable DETR的代码,请问这个代码是您自己实现的吗?AO2-DETR中也实现了Rotated Deformable DETR的实现代码,不过与您的代码实现有一些不同
我发现在decoder中,已经使用reg_branches对decoder的中间特征回归过一次了,并且把回归的结果输出了,就是intermediate_reference_points。而在ars_detr_head.py文件的forward函数中,当获取transofrmer的输出后,使用reg_branches对decoder的输出的中间特征又计算了一次回归,然后将两次回归的结果加起来了。请问这样做是为什么呢?