为什么多张图片纵向拼接后的文本检测和单张图片的文本检测差别很大

breezedeus / CnSTD

CnSTD: 基于 PyTorch/MXNet 的中文/英文场景文字检测（Scene Text Detection）、数学公式检测（Mathematical Formula Detection, MFD）、篇章分析（Layout Analysis）的Python3 包

https://www.breezedeus.com/article/cnocr

Apache License 2.0

654 stars 101 forks source link

Closed wengad82 closed 1 year ago

wengad82 commented 1 year ago

我有一个PDF转成IMAGE的图片（总3页，转成了3张图片），转换后的3张image用cnstd来分别检测文本，结果可以检测出来所有文本。但是把这3张images纵向拼接后，再用同样的程序进行进行检测文本，只检测出来可怜的一些文本。这会不是什么原因？

breezedeus commented 1 year ago

因为做检测前会对图片做resize，你多图拼完后再resize完可能导致文字小到检测不出来。

wengad82 commented 1 year ago

OK，多谢，我直接把resized_shape 调整成拼接后的尺寸大小，就可以了。