A one-stop, open-source, high-quality data extraction tool, supports PDF/webpage/e-book extraction.一站式开源高质量数据提取工具,支持PDF/网页/多格式电子书提取。
GNU Affero General Public License v3.0
11.19k
stars
835
forks
source link
表格上出现页眉会被识别为正文 #498
Open
kakaxisisan opened 2 weeks ago
Description of the bug | 错误描述
How to reproduce the bug | 如何复现
详情见论文《基于平衡计分卡的行政单位预算绩效评价优化研究——以H 市税务局为例》.pdf
Operating system | 操作系统
MacOS
Python version | Python 版本
3.10
Software version | 软件版本 (magic-pdf --version)
0.7.x
Device mode | 设备模式
cuda