模型训练、微调的疑问

Windsrain / Selective-Stereo

[CVPR 2024 Highlight] Selective-Stereo: Adaptive Frequency Information Selection for Stereo Matching

MIT License

89 stars 8 forks source link

作者您好，首先感谢您和您团队杰出的贡献！

我在论文中看到您在Middlebury数据集排行榜上提交的模型是由SceneFlow预训练，然后经过多个数据集（InStereo2k、SintelStereo、FallingThings、TartanAir……）微调得到的。在阅读您的论文和代码后，有几个疑问想请教一下。

您在Google Drive中提供的2个关于middlebury的预训练模型：middlebury_train.pth是只使用Middlebury微调，middlebury_finetune.pth是上述多个数据集微调，我的疑问是 1. 这两个预训练模型在准确性的这个指标上相差大吗？2. 我看上述的一些数据集（InStereo2k、SintelStereo、FallingThings、TartanAir……）加起来数量已经很多了，有很多是真实场景拍摄的，考虑应用在真实场景的话，如果直接挑出真实场景的数据集来训练，您觉得效果会好吗？

希望得到您的解答，感谢！

Windsrain / Selective-Stereo

模型训练、微调的疑问 #14