alix-tz / aspyre-gt

A pipeline to transfer ground truth from Transkribus to eScriptorium.
MIT License
7 stars 0 forks source link

Explore PAGE scenario #14

Closed alix-tz closed 3 years ago

alix-tz commented 3 years ago

See what didn't work, what has been fixed since then etc.

alix-tz commented 3 years ago

Version 0.6.7d (19/11)

Test fait le 26/11/2020

Quand on importe un zip PAGE XML téléchargé (en même temps que les photos) depuis Transkribus, on obtient l'erreur suivante :

Parse error in import_src/export_job_1500765_page_light_jpg.zip: Couldn't determine xml schema, xmlns attribute missing on root element., skipping it. (2)

image

alix-tz commented 3 years ago

Oups, on a des tif sur Transkribus et des jpg sur eScriptorium, donc après correction de cela dans les fichiers xml page et le fichier mets.xml on obtient en réalité l'erreur suivante :

image

alix-tz commented 3 years ago

MAIS ! L'import fonctionne bien et les coordonnées des baselines sont plus cohérentes cette fois-ci !

alix-tz commented 3 years ago

Pour mémo, dans la version 0.6.5 d'eScriptorium, l'import par batch (.zip) ne fonctionnait pas, on était obligé d'importer les fichiers un par un.