prstrive / UniMVSNet

[CVPR 2022] Rethinking Depth Estimation for Multi-View Stereo: A Unified Representation
MIT License
228 stars 12 forks source link

关于fusion阈值的设置 #12

Open aggestsfw opened 2 years ago

aggestsfw commented 2 years ago

谢谢大佬分享那么好的成果,想再请教一个问题,我看代码里设置的fusion参数 '--prob_threshold', '0.3', \ '--disp_threshold', '0.25', \ '--num_consistent', '3']

然后我看CVP-MVSNet里设置的如下,这个一般是有什么依据的? parser.add_argument('--prob_threshold', type=float, default = '0.8') parser.add_argument('--disp_threshold', type=float, default = '0.13') parser.add_argument('--num_consistent', type=float, default = '3')

prstrive commented 2 years ago

我认为需要依据confidence的生成方式而定,回归方法(CVP)将每个像素点预测深度周围的四个深度假设层的权重之和作为confidence,而分类方法(R-MVSNet)或者我们的统一表示方法是将取所有假设层中的最大概率作为confidence。所以我们认为回归方法自然需要设置更大的prob_threshold来确保准确度。

cainsmile commented 2 years ago

我认为需要依据confidence的生成方式而定,回归方法(CVP)将每个像素点预测深度周围的四个深度假设层的权重之和作为confidence,而分类方法(R-MVSNet)或者我们的统一表示方法是将取所有假设层中的最大概率作为confidence。所以我们认为回归方法自然需要设置更大的prob_threshold来确保准确度。

那么最佳的参数是多少呢?可以复现得到你论文中的结果的值