Green-Wood / CoMER

Official implementation for ECCV 2022 paper "CoMER: Modeling Coverage for Transformer-based Handwritten Mathematical Expression Recognition"
https://arxiv.org/abs/2207.04410
107 stars 21 forks source link

算法可用于文本识别吗 #7

Open xiaoheizi123 opened 1 year ago

xiaoheizi123 commented 1 year ago

该算法是基于图像的公式识别,我就想它是否可以基于图片进行文本识别。

使用了单行的的文本数据3w+,也替换了dictionary.txt(仅包括样本中出现的字符),但是准确率一直为0,这是哪里有问题吗?

kingqiuol commented 1 year ago

该算法是基于图像的公式识别,我就想它是否可以基于图片进行文本识别。

使用了单行的的文本数据3w+,也替换了dictionary.txt(仅包括样本中出现的字符),但是准确率一直为0,这是哪里有问题吗? 可以肯定,优于现有文本行识别方法,如CRNN,至于结果,我觉得还是检测标签格式啥的,其次是推理过程模型加载以及解码过程都需要注意