XH-B / ABM

98 stars 22 forks source link

用这个模型训练印刷体公式,会有比较好的识别效果吗? #11

Closed JaosonMa closed 1 year ago

XH-B commented 1 year ago

嗯嗯 会更好

JaosonMa commented 1 year ago

训练印刷题数据集的数据量,您觉得大概需要什么量级? 我目前有50万左右印刷体公式,针对初高中场景的。

JaosonMa commented 1 year ago

还有个问题,目前这个模式支持公式中的汉字识别吗? 尤其是物理场景 F甲这种。

XH-B commented 1 year ago

中文汉字没有试过,中文汉字建议用OCR模型识别,公式用ABM识别