有关dropout的问题 - Githubissues

huanghoujing / beyond-part-models

PCB of paper: Beyond Part Models: Person Retrieval with Refined Part Pooling, using Pytorch

331 stars 81 forks source link

有关dropout的问题 #18

Closed zhihuikaicheng closed 6 years ago

zhihuikaicheng commented 6 years ago

我是用TensorFlow的，所以我不太清楚pytorch是否内含了dropout。在看你的pcb model的时候我似乎并没有看到dropout？

zhihuikaicheng commented 6 years ago

补充一下，我之所以会问这个问题，是因为我目前遇到了很尴尬的一幕。我把dropout放在h层之后（h层对应原论文的h层），效果就很差。但是把dropout放在g层之前，效果就好了许多（虽然我目前只能复现到86%的rank1.。）对于dropout对整个训练的影响，我的理解是防止过拟合。但为什么会出现这么大的偏差呢？

huanghoujing commented 6 years ago

我没有用到dropout。dropout常用的地方是分类器的输入，所以我觉得在每个h vector后面加应该可以。dropout的大小也会影响性能，导致性能下降也是有可能的。