Closed qwedc001 closed 9 months ago
感觉更像是Tesseract模型本身的问题。
我采用了Tesseract Best模型,其数学模块为2.2兆,整体和Tesseract Fast没有区别(我怀疑他们是相同的数据集)
当equ作为主要识别(如equ+eng)其输出结果多为错误的符号。并且置信率相对来说比较低。
当equ作为次要识别(如eng+equ)时,识别内容准确度提升,但是对于公式的辨识能力大幅下降至趋近于没有。
我测试的内容相对来说比较窄,可能需要进一步测试。
并非插件自身问题,tesseract引擎问题个人无法修复。 won't fix.
感觉更像是Tesseract模型本身的问题。
我采用了Tesseract Best模型,其数学模块为2.2兆,整体和Tesseract Fast没有区别(我怀疑他们是相同的数据集)
当equ作为主要识别(如equ+eng)其输出结果多为错误的符号。并且置信率相对来说比较低。
当equ作为次要识别(如eng+equ)时,识别内容准确度提升,但是对于公式的辨识能力大幅下降至趋近于没有。
我测试的内容相对来说比较窄,可能需要进一步测试。