RapidAI / RapidLayout

Analysis of Chinese and English layouts 中英文版面分析
Apache License 2.0
130 stars 7 forks source link

版面分析模型doclayout 输入shape是固定的1024x1024问题 #3

Open SWHL opened 2 weeks ago

SWHL commented 2 weeks ago

新建的版面分析模型doclayout 输入shape是固定的1024x1024, 这样会有两个问题: 1、有的图片会因非等比例缩放, 导致结果不准 2、增加计算量 建议, 将onnx模型的输入shape转成dynamic, 图像使用letterBox预处理后送入模型

Originally posted by @jesse01 in https://github.com/RapidAI/RapidOCR/discussions/246#discussioncomment-11139621

SWHL commented 1 week ago

可以参考资料:https://github.com/opendatalab/DocLayout-YOLO/blob/119996a102e383c15a9fb0897ff038215ccfaf22/assets/script.sh#L17