chineseocr / trocr-chinese

transformers ocr for chinese
338 stars 53 forks source link

长文本中相同的文字识别错误,但是切割后都可以识别对 #47

Closed fourierer closed 8 months ago

fourierer commented 8 months ago

作者您好,非常感谢您的工作,我这边在做一些书籍内容的识别,文本行的宽度基本上都超过了1000像素,用我自己的数据训练之后发现一个非常诡异的问题。 一个文本行中相同的字会出现不同的识别结果,但切割之后都可以识别正确,比如这个样本中有3个“视网膜”关键字,前面和后面识别错误,但是中间的“视网膜”识别正确,如果把3个“视网膜”手动切割开则都可以识别正确,请问可以如何缓解这种情况呢,是因为当前预处理resize成384*384对长文本不太适用还是说跟上下文关系很大?可以提供一些指导性建议么~非常感谢 25

fourierer commented 8 months ago

作者您好,非常感谢您的工作,我这边在做一些书籍内容的识别,文本行的宽度基本上都超过了1000像素,用我自己的数据训练之后发现一个非常诡异的问题。 一个文本行中相同的字会出现不同的识别结果,但切割之后都可以识别正确,比如这个样本中有3个“视网膜”关键字,前面和后面识别错误,但是中间的“视网膜”识别正确,如果把3个“视网膜”手动切割开则都可以识别正确,请问可以如何缓解这种情况呢,是因为当前预处理resize成384*384对长文本不太适用还是说跟上下文关系很大?可以提供一些指导性建议么~非常感谢 25

已经解决,感谢