A one-stop, open-source, high-quality data extraction tool, supports PDF/webpage/e-book extraction.一站式开源高质量数据提取工具,支持PDF/网页/多格式电子书提取。
GNU Affero General Public License v3.0
13.43k
stars
1.01k
forks
source link
目录解析不换行问题 #720
Open
singeleaf opened 2 weeks ago
1、目录识别为文本后没有换行 2、行尾有多余的字 2.0.12、2.0.13、3.2.10 3、行尾有多余的符号 3.1.2、3.1.5、3.2.10.4、8.1.5
4、不能识别摄氏度符号,显示错误ParseError: KaTeX parse error: Got group of unknown type: 'internal'
4.1.1、5.2.4 5、插入不相关文本 9.5.8
使用的PDF为 建筑给水排水与节水通用规范.pdf