Open hahhforest opened 3 months ago
还遇到过很多种其他的"ParseError: KaTeX parse error:...",想知道可能是什么问题导致的
@hahhforest There are multiple Latex rendering engines available, and you are currently using the KaTeX engine. In fact, there are several other rendering engines as well. We will ensure that the Latex for mathematical formulas is correct. However, we cannot yet guarantee that the output will be uniformly formatted using the same Latex rendering engine syntax.
非常喜欢表格识别这个功能!但是也遇到了同样ketex的问题
+1
Description of the bug | 错误描述
在解析包含行内公式的pdf文档时,渲染解析结果.md时经常出现“ParseError: KaTeX parse error”问题
以下图中的文档为例(完整pdf文件在“复现”中上传)
解析结果:
对于 cm^-1这个格式,出现了下列几种解析结果:
其中‘${\bf592\cm^{-1}}$’这一种解析结果渲染时报错:"ParseError: KaTeX parse error: Undefined control sequence: \cm at position 8: {\bf592\̲c̲m̲^{-1}}"。而使用Mathpix解析时格式统一为'$600 \mathrm{~cm}^{-1}$'
另外分析该文档解析结果还发现出现了未识别到空格的问题
How to reproduce the bug | 如何复现
文件: origin.pdf 软件版本: pip install -e .[full]
Operating system | 操作系统
Linux
Python version | Python 版本
3.10
Software version | 软件版本 (magic-pdf --version)
0.6.x
Device mode | 设备模式
cuda