Open Yue-Rain opened 1 month ago
这个是因为pdf当前页存在一个90度旋转的情况,绘制检测框的时候没有根据旋转角度进行位置修正,但是应该不影响当前页面的文本提取。
这个是因为pdf当前页存在一个90度旋转的情况,绘制检测框的时候没有根据旋转角度进行位置修正,但是应该不影响当前页面的文本提取。
那请问有什么办法进行位置修正吗?这样子不知道是否准确
这个是因为pdf当前页存在一个90度旋转的情况,绘制检测框的时候没有根据旋转角度进行位置修正,但是应该不影响当前页面的文本提取。
那请问有什么办法进行位置修正吗?这样子不知道是否准确
可以尝试重新实现一下画框的代码,先将pdf页面根据旋转角度渲染成正常角度的图片,再直接在图片上画框,目前mineru中直接使用了pumupdf的线框绘制逻辑,测试过一些调整方案,但是收益甚微,问题可能出在pymupdf库上,因为旋转的文档并不多,而且可视化只是辅助验证手段,并不影响文本的提取功能,所以目前没有计划针对这个问题进行修复。
Description of the bug | 错误描述
按照教程来跑一个示例,同时将
is_table_recog_enable
设置为True,其他的使用默认参数,layout检测框不对,应该是横向的。How to reproduce the bug | 如何复现
magic-pdf.template.json配置 guicheng_origin.pdf
Operating system | 操作系统
Linux
Python version | Python 版本
3.10
Software version | 软件版本 (magic-pdf --version)
0.8.x
Device mode | 设备模式
cuda