a question about loss - Githubissues

hlsheng1 / RDIoU

"Rethinking IoU-based Optimization for Single-stage 3D Object Detection", ECCV2022 accept!

MIT License

128 stars 12 forks source link

a question about loss #16

Closed dandervis closed 1 year ago

dandervis commented 1 year ago

感谢您精彩的工作，我想请教一下在计算rdiou时所使用到的bboxes1,bboxes2这两组参数是否为模型预测的x,y,z,w,h,l,r_y和label的x,y,z,w,h,l,r_y呢（以kitti数据集为例）？如果是的话您在代码中获取l,w,h时使用的torch.exp()是出于什么考虑呢为什么不直接读取label的l,w,h值呢？期待您的回复，感谢！

dandervis commented 1 year ago

补充一下，请问x,y,z是物体的3D中心位置坐标吗

hlsheng1 commented 1 year ago

Hi, I did not choose the real values of 3D boxes, pls refer to issue #14 .

dandervis commented 1 year ago

我参考了您所说的#14，我可以理解为您的意思是l,w,h采用的是回归值而xyz采用的是3D中心坐标吗，还是说xyz也是回归值并不是如kitti数据集的label中所标注的xyz呢

kellenf commented 1 year ago

这个xyz是经过anchor编码的，不是用的绝对值。lwh也是经过了log编码，所以需要exp一下，但是其实用了exp之后也是真实3D-size / anchor-size。作者这么做的目的是需要和orientation保持一个尺度。

dandervis commented 1 year ago

十分感谢！我还有最后一个问题，在不考虑不考虑尺度一致性的前提下，如果不使用编码后的回归值转而使用大部分IOU所采取的真值方式代入代码中的bboxes1,bboxes2的话，代码中求其体积与角度的物理意义是否还正确呢

hlsheng1 commented 1 year ago

我考虑的是：如果使用真实值的话，那么x,y维度所对应的长和宽是难控制的，比如当角度为0度和90度的时候, (x,y) 和 (l,w)的对应关系是相反的。考虑到l,w的尺度差距较大，所以我保证了尺度一致性。

dandervis commented 1 year ago

感谢解惑！

hehualin-tut commented 1 year ago

@kellenf 您说的经过anchor编码指的是将预测的差值加到anchor上后的xyz对吧，还是说其他的一些编码方式

hehualin-tut commented 1 year ago

@dandervis @hlsheng1 您好，我想知道在计算iou时的相交体积，其中的inter_n-inter_m所代表的含义，我所理解的就是当发生旋转时，旋转后的相交体积可以表示为v*(1-sincos)，这是近似计算还是精确计算，我计算出来的和预想的不符合，我想知道你们是怎么理解的。