BerniUtz / WS23-SWKOM

2 stars 0 forks source link

Feat/ocr worker fixes #49

Closed leonardstruck closed 10 months ago

leonardstruck commented 11 months ago

Hab jetzt die Pipeline gefixt und die ganzen absoluten Pfade in den .csproj Dateien mit dynamischen Pfaden ersetzt, sodass die für tesseract notwendigen .dlls / .dylibs / .so 's funktionieren ohne dass wir Zugriff auf @SirPoz's Nutzerverzeichnis haben 🚫

Die Testdaten von Tesseract habe ich jetzt mit committed, sind nur 30MB. Wenn ich jedoch das gesamte Submodule hinzufüge wären es satte 2 GB an Daten die wir letztendlich nicht brauchen.

Außerdem bin ich über ein zwei Sachen gestoßen im Code, spezifisch #2a21cd9 ein paar null-checks, die wir berücksichtigen müssen. Der OCR Service ist ja nur eine Konsolenanwendung und stürzt uns bei unbehandelten Fehlern ab. Jetzt stehen an diesen Stellen Exceptions, die wir aber noch handeln müssen (aber immerhin sieht man die jetzt).