nfnum / model

Modèle TEI ODD pour le projet Nouvelle France numérique
0 stars 0 forks source link

Faire une sortie générique de Transkribus pour identifier les champ #1

Open emchateau opened 3 years ago

emchateau commented 3 years ago

Le vocabulaire utilisé par Transkribus n’est pas toujours celui de la TEI. Faire une sortie générique en renseignant tous les champs de l’interface par leur nom de manière à pouvoir disposer d’une table de référence de l’encodage TEI des métadonnées Transkribus.

maximegohier commented 3 years ago

La sortie tei ne tient compte que de très peu de champs, dans le teiHeader.

La sortie METS recopie à l'identique les champs des métadonnées générales.

Je joins dans ce dossier les deux formats.

ANOM,_F3,_vol__241,_f__01r-02v.zip

maximegohier commented 3 years ago

En fait, il est plus simple de regarder ce qu'Arturo a extrait comme données au format json. Pour ce faire, consulter ce petit tutoriel cahier Jupyter (python). Je le mets aussi en PDF. C'est beaucoup plus complet.

Transkribus API.ipynb.zip Transkribus_API.pdf

emchateau commented 3 years ago

Salut, en effet il faudrait plutôt faire le mapping depuis ce fichier. Est-ce qu’il n’y a pas un endroit où Transkribus documente son modèle de données ?

Emmanuel Château @emchateau

Message envoyé depuis une tablette

Le 2 févr. 2021 à 17:44, maximegohier notifications@github.com a écrit :

 En fait, il est plus simple de regarder ce qu'Arturo a extrait comme données au format json. Pour ce faire, consulter ce petit tutoriel cahier Jupyter (python). Je le mets aussi en PDF. C'est beaucoup plus complet.

Transkribus API.ipynb.zip Transkribus_API.pdf

— You are receiving this because you were assigned. Reply to this email directly, view it on GitHub, or unsubscribe.

emchateau commented 3 years ago

Visiblement oui https://transkribus.eu/wiki/index.php/REST_Interface

Le fichier communiqué est utile mais plutôt pour faire des requêtes sur l'api