RapidAI / RapidStructure

版面分析 | 表格识别 | 文档方向分类
Apache License 2.0
182 stars 14 forks source link

Bug:表格识别结果行列错乱 #21

Closed jiataiping closed 3 months ago

jiataiping commented 4 months ago

系统环境:Win10 22H2 语言:Python 3.10.1 模型文件:en_ppstructure_mobile_v2_SLANet 初步原因分析:表格识别模型TableStructurer类检测到的文本框位置与RapidOCR检测到的文本框位置差别较大,导致TableMatch类执行结果行列错乱。 原始图片: 3 表格引擎检测到的文本框及位置: vis_3

SWHL commented 3 months ago

图中蓝色框是表格识别模型检测到的cell框(注意是cell框,表格识别模型不检测文本框),可以看到最底部的蓝色不是很准。 而RapidOCR的识别结果是很准的。下图中细线框为RapidOCR标注的,结果是比较准的。

only_vis_det

两者匹配,是以cell框为准的,因此存在错位问题。不是代码bug。 目前没有好的办法解决,除了优化微调表格识别模型。