Samuel-Scalbert / SOFTware-Viz

http://prod-datadcis-app.inria.fr:8040/
1 stars 1 forks source link

Mention comprenant un tiret de fin de ligne #23

Closed KumR67 closed 4 months ago

KumR67 commented 4 months ago

Dans le PDF : image

Résultat dans SOFT-Viz image

Samuel-Scalbert commented 4 months ago

Tu veux dire le logiciel est ESTOCADA et non ES-TOCADA ?

KumR67 commented 4 months ago

oui

Samuel-Scalbert commented 4 months ago

Alors, la solution est liée avec la désambiguïsation des noms de softwares et la création d'ID pour avoir une version d'autorités des noms de softwares.

Est-ce que tu peux aussi m'envoyer le lien de la page, s'il te plaît, que je regarde en détail ?

KumR67 commented 4 months ago

http://127.0.0.1:5000/doc/hal-02070827/ES-TOCADA

Samuel-Scalbert commented 4 months ago

J'ai mis en place une solution : je vérifie toutes les occurrences d'un logiciel dans un document, puis je compte le nombre d'occurrences pour chaque nom de logiciel. Si je trouve un logiciel qui apparaît avec un "-", je vérifie s'il existe une version sans "-" et, si c'est le cas, je remplace la version avec "-" par celle sans "-" si elle a moins d'occurrences.

Cette approche est nécessaire tant que nous n'avons pas de noms d'autorité pour chaque logiciel.

(il faut reset la db)

Le lien que tu as fourni ne fonctionne plus, et les mentions sont maintenant disponibles à cette adresse :

http://127.0.0.1:5000/doc/hal-02070827/ESTOCADA