hlsheng1 / RDIoU

"Rethinking IoU-based Optimization for Single-stage 3D Object Detection", ECCV2022 accept!
MIT License
128 stars 12 forks source link

a question about loss #16

Closed dandervis closed 1 year ago

dandervis commented 1 year ago

感谢您精彩的工作,我想请教一下在计算rdiou时所使用到的bboxes1,bboxes2这两组参数是否为模型预测的x,y,z,w,h,l,r_y和label的x,y,z,w,h,l,r_y呢(以kitti数据集为例)? 如果是的话您在代码中获取l,w,h时使用的torch.exp()是出于什么考虑呢为什么不直接读取label的l,w,h值呢?期待您的回复,感谢!

dandervis commented 1 year ago

补充一下,请问x,y,z是物体的3D中心位置坐标吗

hlsheng1 commented 1 year ago

Hi, I did not choose the real values of 3D boxes, pls refer to issue #14 .

dandervis commented 1 year ago

我参考了您所说的#14,我可以理解为您的意思是l,w,h采用的是回归值而xyz采用的是3D中心坐标吗,还是说xyz也是回归值并不是如kitti数据集的label中所标注的xyz呢

kellenf commented 1 year ago

这个xyz是经过anchor编码的,不是用的绝对值。lwh也是经过了log编码,所以需要exp一下,但是其实用了exp之后也是真实3D-size / anchor-size。作者这么做的目的是需要和orientation保持一个尺度。

dandervis commented 1 year ago

十分感谢! 我还有最后一个问题,在不考虑不考虑尺度一致性的前提下,如果不使用编码后的回归值转而使用大部分IOU所采取的真值方式代入代码中的bboxes1,bboxes2的话,代码中求其体积与角度的物理意义是否还正确呢

hlsheng1 commented 1 year ago

我考虑的是:如果使用真实值的话,那么x,y维度所对应的长和宽是难控制的,比如当角度为0度和90度的时候, (x,y) 和 (l,w)的对应关系是相反的。考虑到l,w的尺度差距较大,所以我保证了尺度一致性。

dandervis commented 1 year ago

感谢解惑!

hehualin-tut commented 1 year ago

@kellenf 您说的经过anchor编码指的是将预测的差值加到anchor上后的xyz对吧,还是说其他的一些编码方式

hehualin-tut commented 1 year ago

@dandervis @hlsheng1 您好,我想知道在计算iou时的相交体积,其中的inter_n-inter_m所代表的含义,我所理解的就是当发生旋转时,旋转后的相交体积可以表示为v*(1-sincos),这是近似计算还是精确计算,我计算出来的和预想的不符合,我想知道你们是怎么理解的。