Closed jiataiping closed 3 months ago
系统环境:Win10 22H2 语言:Python 3.10.1 模型文件:en_ppstructure_mobile_v2_SLANet 初步原因分析:表格识别模型TableStructurer类检测到的文本框位置与RapidOCR检测到的文本框位置差别较大,导致TableMatch类执行结果行列错乱。 原始图片: 表格引擎检测到的文本框及位置:
图中蓝色框是表格识别模型检测到的cell框(注意是cell框,表格识别模型不检测文本框),可以看到最底部的蓝色不是很准。 而RapidOCR的识别结果是很准的。下图中细线框为RapidOCR标注的,结果是比较准的。
两者匹配,是以cell框为准的,因此存在错位问题。不是代码bug。 目前没有好的办法解决,除了优化微调表格识别模型。
系统环境:Win10 22H2 语言:Python 3.10.1 模型文件:en_ppstructure_mobile_v2_SLANet 初步原因分析:表格识别模型TableStructurer类检测到的文本框位置与RapidOCR检测到的文本框位置差别较大,导致TableMatch类执行结果行列错乱。 原始图片: 表格引擎检测到的文本框及位置: