Closed huichen5796 closed 2 years ago
Bei komplexe Tabelle sind aber Probleme zu lösen:
Die Texterkennung auf Bildern nach der Binarisierung und dem Entfernen von Lienen ist zu schlecht. Ich werde versuchen, sie in Gray-image zu erkennen. Erkennung von gray-image: besser aber noch nicht gut
Erkannt nach 6-facher Vergrößerung der Zelle:
header ist besser erkannt aber Nummer schlechter
use cv2.copyMakeBorder(cell_zone, 40, 40, 40, 40, cv2.BORDER_REPLICATE) zu Boundary Copy-Erweiterung, auf diese Weise der Inhalt der Zelle wird in Mitte liegt, nicht zu nah am Rand. Wenn es nur eine Nummer inr Zelle gibt ,kennt es nicht,
sehrrrrrrrrr guuuuut, durch config='--psm 7'
ist die Erkennung wunderbar, danke Holger
bei einfacher Tabelle ist die Normalize fertig: