HTR-United / htr-united

Ground Truth Resources for the HTR of patrimonial documents
https://htr-united.github.io
Creative Commons Zero v1.0 Universal
37 stars 32 forks source link

Il faudrait clarifier la distinction entre "file" et "image" #53

Closed alix-tz closed 2 years ago

alix-tz commented 2 years ago

Je pense que les deux sont confondus, donc rajouter une doc.

Peut-être aussi rajouter dans le formulaire que pour obtenir ces chiffres, il est possible d'utiliser HUMGenerator.

Et pour permettre d'avoir des métriques d'ensemble et constantes sur l'ensemble des dépôts, voir à imposer un des champes (par exemple "page") ?

PonteIneptique commented 2 years ago

Peut-être aussi rajouter dans le formulaire que pour obtenir ces chiffres, il est possible d'utiliser HUMGenerator. Il serait cool d'ailleurs de rendre disponible HUMGenerator en mode app (en uploadant que les fichiers XML), mais c'est une autre histoire.

Un fichier peut facilement comprendre deux pages dans les manuscrits numérisés, c'est la principale différence

alix-tz commented 2 years ago

Je pense que je me suis trompé de mot, parce qu'en effet, on peut avoir 1 fichier = 2 page. Je pense que je voulais dire clarifier ce qui constitue un fichier.

Par exemple, dans un repo avec 3 images, 3 fichiers XML -> on doit indiquer 6 files, ou bien 3?

Si file se réfère seulement aux fichiers XML, quelle serait l'intérêt de renseigner le volume d'image et le volume de fichiers XML ?

PonteIneptique commented 2 years ago

Effectivement: file= XML File :)