Open xiaowangzi6668 opened 4 years ago
Thanks for your interest. Only the monocular images are used as inputs.
非常感谢您的回复,我还想咨询的问题是您\MonoGRNet-master\data\KittiBox\training\label_2下的txt文件中具体调用了哪几个参数。例如:文件中是: Pedestrian 0.00 0 -0.20 712.40 143.00 810.73 307.92 1.89 0.48 1.20 1.84 1.47 8.41 0.01 分别对应: 1物体类别 2物体是否被截断 3物体是否被遮挡 4物体的观察角度 5~8物体的二维边界框 9~11三维物体的尺寸12~14 三维坐标系的位置15 三维物体的空间方向 16检测的置信度 。 如果您使用的是的仅仅是单目摄像头 是否只用了5~8物体的二维边界框作为输入,或者您调用了哪些参数呢 还是全部参数呢
二维边界框,三维尺寸,三维坐标,三维物体方向。虽然是单目图像为输入,但要学习3D检测,因此需要3D的输入
您好,您的论文使用的是单目摄像头,那就应该不需要点云数据,而KITTI的数据是包含点云的,您肯定没有用到这些点云信息,所以我想知道您最终具体使用了KITTI数据集中的哪些参数作为输入。