HTR-United / cremma-wikipedia

A collection of ground truth to train HTR models on contemporary French handwritings
Creative Commons Attribution 4.0 International
0 stars 0 forks source link

organisation de la donnée #5

Closed ElsaVK closed 2 years ago

ElsaVK commented 2 years ago

Bonjour,

Je suis entrain de faire mes premiers push mais j'ai un doute quant à la forme finale des données. J'ai regroupé chaque .xml et .png dans un dossier individuel portant le nom du bach en question. Je ne sais plus pourquoi j'ai fait ça, je crois l'avoir vu dans une recommandation quelque part...Est-ce la bonne pratique ou bien je dois me contenter de mettre tous les fichiers en vrac dans le dossier data ?

Merci à vous, Elsa

PonteIneptique commented 2 years ago

Pour l'organisation des données, je suis passé à côté de l'issue...

data/batch-2/données du batch.xml devrait suffire, je mets à jour la structure.

alix-tz commented 2 years ago

Oui, on sait déjà qu'en théorie 1 image = 1 écriture, donc ça me parait pas nécessaire de découper le batch

ElsaVK commented 2 years ago

Ok super merci, je ferme l'issue :)