kitodo / kitodo-production

Kitodo.Production is a workflow management tool for mass digitization and is part of the Kitodo Digital Library Suite.
http://www.kitodo.org/software/kitodoproduction/
GNU General Public License v3.0
63 stars 63 forks source link

[ZM] Frei konfigurierbare Datenordner #42

Closed matthias-ronge closed 10 years ago

matthias-ronge commented 10 years ago

Leistungsbeschreibung:

Bereits heute verfügen […] Dienstleister über Verfahren, die […] OLR/OCR […] ermöglichen. […] Goobi.Production [muss] in der Lage sein, diese Daten zu extrahieren und […] aufbereiten zu können.

Beantwortung zu Rückfragen:

Welche Daten soll Goobi aus OLR/OCR-Ergebnissen konkret übernehmen bzw. extrahieren können? […]

Antwort: Zum jetzigen Zeitpunkt ist lediglich erforderlich, vorliegende Volltextdaten im ALTO, TEI sowie ABBYY-FInereader XML Format mit einem Vorgang durch Goobi schleusen zu können. Ein Editieren, Visualisieren etc. ist nicht notwendig.

Grobkonzept:

Wie bereits in vorherigen Kapitel beschrieben können in den Prozessordnern, die Goobi verwaltet, beliebige Unterordner erstellt werden, welche den gesamten Workflow lang zur Verfügung stehen. Etwas anders ist dies bei der Aufbewahrung von OCR-Daten gelöst. Hier besteht, neben dem bekannten „images“ Ordner, im Vorgangsverzeichnis ein ocr Ordner, welcher die Unterverzeichnisse _txt, _wc, _pdf und _alto enthalten kann. Die Verzeichniss sind jedoch im Quelltext „hart verdrahtet“. Nicht alle Verzeichnisse werden im aktuellen Stand beim Export angesprochen/genutzt. Goobi wird dahingehend erweitert, dass beim Anlegen von Prozessen beliebig Unterordner automatisch erstellt werden können, die in goobi_config.properties konfigurierbar sind und auch bei Export berücksichtigt werden. Ein betriebssystemspezifisches Berechtigungsmanagement ist derzeit aufgrund von Beschränkungen der verwendeten Java-Version 6 jedoch nur mit dem Aufruf betriebssystemspezifischen Skriptdateien möglich.

Lösungsvorschlag:

Goobi wird dahingehend erweitert, dass beim Anlegen von Prozessen beliebig Unterordner automatisch erstellt werden können, die in goobi_config.properties konfigurierbar sind und auch bei Export berücksichtigt werden

matthias-ronge commented 10 years ago

Merged as #152