opendatalab / MinerU

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。
https://opendatalab.com/OpenSourceTools?tool=extract
GNU Affero General Public License v3.0
20.11k stars 1.43k forks source link

元数据带旋转角度的PDF的可视化bug #304

Open ai1361720220000 opened 4 months ago

ai1361720220000 commented 4 months ago

Description of the bug | 错误描述

发现现在的可视化会有一个bug。 我遇到一个场景,我的PDF通过fitz解析出来rotation=90,但是PDF打开看是正的。 通过这个可视化后,发现所有的框都旋转了90度,而且宽高的比例不确定是不是scale正确。

我尝试使用在所有draw_bbox_with_number函数添加rect_coords = fitz.Rect(x0, y0, x1, y1)*page.rotation_matrix还是不行,希望博主有经验可以解决一下或者思路。

How to reproduce the bug | 如何复现

运行可视化layout和span

Operating system | 操作系统

Linux

Python version | Python 版本

3.10

Software version | 软件版本 (magic-pdf --version)

0.6.x

Device mode | 设备模式

cuda

myhloli commented 4 months ago

看起来您遇到的情况和这个一致 https://github.com/opendatalab/MinerU/issues/251 这种pdf用强制ocr的方式可以正常解析,但是带角度的坐标变换,目前确实没有现成方案。要之后收集需求后排期修复。

xiabo0816 commented 4 months ago

遇到同样的问题