A one-stop, open-source, high-quality data extraction tool, supports PDF/webpage/e-book extraction.一站式开源高质量数据提取工具,支持PDF/网页/多格式电子书提取。
GNU Affero General Public License v3.0
11.19k
stars
835
forks
source link
引用码处理错误 #483
Open
ytcpub opened 2 weeks ago
Description of the bug | 错误描述
page2.pdf 如图 原文本中的引用"6,14" , '14'丢了
How to reproduce the bug | 如何复现
conda run -n MinerU magic-pdf pdf-command --pdf page2.pdf --inside_model true --model_mode full
Operating system | 操作系统
Linux
Python version | Python 版本
3.10
Software version | 软件版本 (magic-pdf --version)
0.6.x
Device mode | 设备模式
cuda