Open ai1361720220000 opened 4 months ago
发现现在的可视化会有一个bug。 我遇到一个场景,我的PDF通过fitz解析出来rotation=90,但是PDF打开看是正的。 通过这个可视化后,发现所有的框都旋转了90度,而且宽高的比例不确定是不是scale正确。
我尝试使用在所有draw_bbox_with_number函数添加rect_coords = fitz.Rect(x0, y0, x1, y1)*page.rotation_matrix还是不行,希望博主有经验可以解决一下或者思路。
运行可视化layout和span
Linux
3.10
0.6.x
cuda
看起来您遇到的情况和这个一致 https://github.com/opendatalab/MinerU/issues/251 这种pdf用强制ocr的方式可以正常解析,但是带角度的坐标变换,目前确实没有现成方案。要之后收集需求后排期修复。
遇到同样的问题
Description of the bug | 错误描述
发现现在的可视化会有一个bug。 我遇到一个场景,我的PDF通过fitz解析出来rotation=90,但是PDF打开看是正的。 通过这个可视化后,发现所有的框都旋转了90度,而且宽高的比例不确定是不是scale正确。
我尝试使用在所有draw_bbox_with_number函数添加rect_coords = fitz.Rect(x0, y0, x1, y1)*page.rotation_matrix还是不行,希望博主有经验可以解决一下或者思路。
How to reproduce the bug | 如何复现
运行可视化layout和span
Operating system | 操作系统
Linux
Python version | Python 版本
3.10
Software version | 软件版本 (magic-pdf --version)
0.6.x
Device mode | 设备模式
cuda