opendatalab / MinerU

A one-stop, open-source, high-quality data extraction tool, supports PDF/webpage/e-book extraction.一站式开源高质量数据提取工具,支持PDF/网页/多格式电子书提取。
https://opendatalab.com/OpenSourceTools
GNU Affero General Public License v3.0
11.19k stars 835 forks source link

给的例子,注释文件自动忽略,一般情况下,还是希望把注释也识别吧,只是需要有相应的符号区分开来。 #470

Open 602387193c opened 3 weeks ago

602387193c commented 3 weeks ago

我按照步骤测试成功了。有个疑问: 给的例子,注释文件自动忽略,一般情况下,还是希望把注释也识别吧,只是需要有相应的符号区分开来。