Open tfrancart opened 7 years ago
Bonjour,
je relance ce sujet car nous avons du mal à comprendre ce que calcule OnaGUI. Nous travaillons sur 2 thésaurus en SKOS anglais/français avec des pref et des altLabels. Les alignements semblent se faire au niveau des labels et non des concepts. Ce qui nous fait supposer ceci est que le score est 1, quelle que soit la situation, par exemple:
Merci de vos conseils.
Sophie Aubin
Bonjour Sophie
As-tu consulté les pointeurs de documentation des algos dans la page de doc à https://github.com/lmazuel/onagui/wiki ? Le comportement est bien celui que tu décris : les alignements se font au niveau des labels. Ce n'est pas quelque chose qu'on peut modifier via un paramètre. En l'état, c'est lors de la validation de l'alignement, en regardant l'onglet "Lexique" en bas de l'écran que vous pourrez voir si la correspondance s'est faite sur des pref ou des alt.
On pourrait imaginer appliquer une sorte de ratio au score de l'alignement si la correspondance s'est faite sur 2 pref, 1 pref + 1 alt, ou 2 alt.
Bonjour Thomas,
merci pour ta réactivité. Oui, j'ai regardé l'article qui m'a plutôt conforté dans mon hypothèse mais je voulais en être sûre. Je m'attendais vraiment à ce que l'outil travaille au niveau concept. Une modulation du score comme tu le proposes me semblerait effectivement informative et limiterait les risques d'alignements un peu hasardeux mettant en jeu des homonymes. Serait-il envisageable d'y travailler ensemble, avec d'autres personnes ? Selon quelles modalités ?
OnaGUI est fait pour que l'on puisse "relativement facilement" brancher d'autres algorithmes d'alignements. On pourrait donc envisager de développer un autre algo et de l'intégrer dans OnaGUI.
Si vous avez des développeurs Java sous la main, je peux les assister en leur indiquant où faire l'intégration. Sinon ça pourrait faire l'objet d'une petite prestation si vous avez du budget.
On ne connaît pas forcément les subtilités des algos d’alignement. Est-il possible d’indiquer - même sommairement dans une bulle par exemple - les spécificités de chacune des 3 méthodes proposées ?