JiaRenChang / PSMNet

Pyramid Stereo Matching Network (CVPR2018)
MIT License
1.43k stars 423 forks source link

about the model and result on the scene flow dataset #53

Open zyfsa opened 6 years ago

zyfsa commented 6 years ago

您好,我发现你release的模型结构不是你论文中最好的模型结构?请问是这样吗?具体有什么不同啊?

我按照你的说明,下载了数据集,然后在scene folw上面直接跑(从头开始训练),我训练了10个epoch,loss(我理解的就是EPE)在测试集是3左右。这个EPE是我直接通过跑main.py那个代码电脑上显示的结果,没有用其他代码测试,请问你看这个EPE也是通过这种方式把? 此时我的环境是只用了一块GPU卡,bathc size是3,然后测试的时候是2。 请问是我哪里搞错了吗?麻烦您回复

JiaRenChang commented 6 years ago

@zyfsa 使用小batch size的訓練通常比較難練到好的成果,(論文中是使用batch size = 12) 如果您一定需要小batch size 您可以考慮把batch normalization全都換成group normalization

zyfsa commented 6 years ago

谢谢您的回答,因为你这个显存要小一些。,能够一块卡都跑3对图,而其他论文,比如GC-net,我记得他训练的batch size是1,是不是这片论文的更好的性能可能有部分原因来自于这方面呢?请问有对比过吗?

zyfsa commented 6 years ago

您好,我发现你release的模型结构不是你论文中最好的模型结构?具体有什么不同啊?麻烦说明一下,就是您放到kitti2015评测的结果用的是哪个模型啊?我发现代码中的dila=1,2 ,not the paper (2,4)

zyfsa commented 6 years ago

您好,我发现你release的模型结构不是你论文中最好的模型结构?具体有什么不同啊?麻烦说明一下,就是您放到kitti2015评测的结果用的是哪个模型啊?我发现代码中的dila=1,2 ,not the paper (2,4)

this problem has been solved,thank you

Sarah20187 commented 6 years ago

@JiaRenChang 请问你试过group normalization了吗?请问效果如何呢?4块gpu的要求实在是好高啊。。。

JiaRenChang commented 6 years ago

@zhFuECL 您好,目前我並未試過group normalization,但是降低這個Model的需求是我們正在努力的方向

Sarah20187 commented 6 years ago

@zyfsa 请问你在1块gpu上用Scene Flow训练得到的模型test epe是多少呢?我不晓得用1块或者2块gpu跑的结果该如何和原文作比较?

benzhangwang commented 5 years ago

@zhFuECL 你好,请问你在单块GPU上跑的模型都能达到paper上的结果么? 如果能 batch size 设置多少,要训练多少个epochs? @zyfsa 你在训练时候是不是dila=2,4 比dila=1,2 提高了val accuracy? 谢谢!!

Sarah20187 commented 5 years ago

@benzhangwang bs=3,也就是作者设置的平均到每张显卡的bs大小,其他的保持不变。

benzhangwang commented 5 years ago

@zhFuECL 你设置bs=3, 在scene flow 也只需要训练10 epochs就能达到paper上精度了么,在KITTI 2015上也是300 epochs? 在conv3_x 和 conv4_x 中dila分别设置为2,4时,KITTI 2015上val error达到了paper上的1.83%么?谢谢

Sarah20187 commented 5 years ago

@benzhangwang 是的,我记得没错的话得到1.83%的精度时,dilation=1,2