ssocean / AlphX-Code-For-DAR

粤港澳大湾区(黄埔)国际算法算例大赛-古籍文档图像识别与分析算法比赛 Alphx队源码
36 stars 3 forks source link

询问大佬几个问题? #5

Closed dreamlychina closed 8 months ago

dreamlychina commented 8 months ago

(1)针对古籍的数据集,你们除了实验pannet++,还试过别的网络?? (2)你们没有使用pannet++的识别分支,那为什么不直接使用pannet(我对pannet++不了解,望见谅)?? (3)还有排序模块用unet,这个作用是啥?? 忘大佬抽空解答下,再次表示感谢。

ssocean commented 8 months ago
  1. 我们没有尝试其它模型,但是你可以试试[SOLOv2: Dynamic and Fast Instance Segmentation]这篇工作,或者是看看近几年的SOTA,应该都会有比较不错的结果。
  2. PAN加上识别分支其实就是PAN++,但是在实现上,PAN++的代码更稳定一些。
  3. 因为古籍图像一整页的文本块顺序很难依靠简单的规则确定,但是如果把一整页的文本块分成不同的区域,再对区域里的文本块进行排序就相对容易些。UNET在这里就是对【不同的区域】进行排序的。即先对大区域排序,再对小区域排序,最后组合结果。
dreamlychina commented 8 months ago

感谢大佬百忙之中给予答复。

ssocean commented 8 months ago

客气客气~