geimist / synOCR

synOCR turns your Synology DiskStation into a paperless office
https://geimist/synOCR
GNU General Public License v3.0
41 stars 4 forks source link

Sensitivität der OCR Erkennung #13

Closed erd82 closed 1 year ago

erd82 commented 1 year ago

Hi zusammen,

gibt es bei der OCR Erkennung eine Möglichkeit, die Sensitivität bei der Texterkennung zu erhöhen? Ich habe das Problem, dass gerade etwas hellere Texte nur schwer erkannt werden: image

Viele Grüße, erd

geimist commented 1 year ago

Du könntest zwei Dinge testen:

erd82 commented 1 year ago

@geimist, danke für den Tipp! Docker Image eingespielt und probiert. Leider gibt es keine mir ersichtlichen Veränderungen / Verbesserungen. In schwarz/weiß scannen ist glaub bei vielen zu spät, da schon zu viele Dokumente digitalisiert sind.

geimist commented 1 year ago

Vielleicht gibt es Tool, mit denen man den Kontrast verbessern kann. Du kannst ja mal gucken, ob es inzwischen eine Lösung mit OCRmyPDF-Parametern möglich ist. https://github.com/ocrmypdf/OCRmyPDF/issues/550