请问为什么可以用2D图像预测得到3D坐标呢

THU-DA-6D-Pose-Group / GDR-Net

GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D Object Pose Estimation. (CVPR 2021)

Apache License 2.0

277 stars 47 forks source link

Open Zephyr-One opened 8 months ago

Zephyr-One commented 8 months ago

网络输入是2D图像，中间输出包括M_2D-3D图像，请问是怎么通过二维图像学习到三维点的坐标的？以往的一些方法，例如PVN3D，都是需要依赖点云数据的，挺好奇从二维学习三维的原理，以及为什么也能达到如此高的准确率？期待您的解答，谢谢~