THU-DA-6D-Pose-Group / GDR-Net

GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D Object Pose Estimation. (CVPR 2021)
https://github.com/THU-DA-6D-Pose-Group/GDR-Net
Apache License 2.0
277 stars 47 forks source link

请问为什么可以用2D图像预测得到3D坐标呢 #122

Open Zephyr-One opened 8 months ago

Zephyr-One commented 8 months ago

网络输入是2D图像,中间输出包括M_2D-3D图像,请问是怎么通过二维图像学习到三维点的坐标的?以往的一些方法,例如PVN3D,都是需要依赖点云数据的,挺好奇从二维学习三维的原理,以及为什么也能达到如此高的准确率?期待您的解答,谢谢~