FangShancheng / ABINet

Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition
Other
420 stars 72 forks source link

奇怪的热图 #81

Closed icecream-Tnak closed 1 year ago

icecream-Tnak commented 1 year ago

感谢您的开源,ABINet让我受益良多! 我把ABINet迁移到了私有数据上,因为文字序列比常用的 max_len = 25 要大,统计之后,我将max_len设置为了40. 文字识别结果具有非常好的性能,可是当我使用 class DumpPrediction 可视化 attn_scores 时,出现了如图所示的奇怪现像(我截取掉了一部分热图,原图太长了)。attn_scores 中的 每一个 attn 可视化得到的“关注区域”是两个,同时左上角会“堆积”一部分注意力,这让我很迷惑。于是我将 max_len 修改回 25,发现热图是正常的。attn_scores中的每一个 attn 都关注到了一个字符区域,但左上角部分还是有少许的注意力“堆积”现像。 微信图片_20221103182608