Ucas-HaoranWei / Vary-toy

Official code implementation of Vary-toy (Small Language Model Meets with Reinforced Vision Vocabulary)
565 stars 41 forks source link

训练数据中的<lb> #33

Open fanshuaiyao opened 2 weeks ago

fanshuaiyao commented 2 weeks ago

请问在训练ocr的时候,训练的数据必须和ocr识别结果是一样的结构吗?(特指换行)比如ocr识别结果如下:

“世界人民 大团结万岁”

是两行,我的构建数据的时候能不能是“世界人民大团结万岁” 一行呢? 这个换行是否为必须,我看原始数据里面有好多符号,难道换行是被要求的吗

Ucas-HaoranWei commented 2 weeks ago

换行不是必须,看你需求

fanshuaiyao commented 2 weeks ago

换行不是必须,看你需求

感谢