BellyBeauty / MDSAM

18 stars 2 forks source link

有关mask_decoder代码的问题。 #4

Open TIEHua opened 1 month ago

TIEHua commented 1 month ago

您好,感谢您开源的工作,在mask_decoder部分,我发现一个问题,原始SAM中,hs应该是transformer输出选取,hs = hs[:,1:,:] 而在MDSAM文件中,hs = output_tokens[:,1:,:],直接将输出的output token定义为最开始初始化学习的参数,似乎与原始代码不符合。 具体链接如下: https://github.com/BellyBeauty/MDSAM/blob/e886c696593b8abf3b19baf0d792f8e43a8a1448/model/mask_decoder.py#L107

BellyBeauty commented 1 month ago

您好,这部分是由于我们的疏忽导致的问题,您可以将它改成hs = hs[:,1:,;]。因为这部分并不参与最终模型的输出,而只是中间输出,所以对最终模型的精度不会产生影响。