sifrproject / multilingual_mappings

0 stars 2 forks source link

Génerer des alignements multilingues interportal pour les ontologies de SIFR et NCBO (non traduction l'une de l'autre) #2

Open jonquet opened 7 years ago

jonquet commented 7 years ago

Cela consiste a aligner des ontologies sources du SIFR BioPortal avec des ontologies cibles dans le NCBO BioPortal. Par exemple, MSHFRE et DOID.

Il s'agirait de stocker alors les mappings dans le SIFR BioPortal (comme ceux de ce projet décrits dans http://www.lirmm.fr/~jonquet/publications/documents/Article_WIMS2016_Reconciliation_Annane.pdf )... sans le tag "translation"

Une fois que cela sera fait, nous pourrons le valoriser par le SIFR Annotator tel que décrit dans le cas 1 de: https://github.com/sifrproject/ncbo_annotator/issues/3

Cette tache doit impliquer @twktheainur Konstantin, Zohra et Nacer et @AminaANNANE
Les ontologies a aligner dans le cadre du projet PratikPharma seront définies ici: https://docs.google.com/spreadsheets/d/1JGSJlJGcDB9B_5_FWX67GUpNFYNf_v6ptlpT9Xr1Crs/edit

jonquet commented 7 years ago

@twktheainur Est-ce que tu peux dans un premier temps recenser qu'elles ontologies d'UMLS sont utilisées dans le corpus Quaero quand aucun concept dans une ontologies FR n'etait disponible. Cela nous donnera nos premières cibles chez NCBO NioPortal.

twktheainur commented 7 years ago

@jonquet Il semble que beaucoup des mappings sur les CUI présents dans le bioportal, ne sont pas dans les ontologies téléchargables. En utilisant le endpoint 4 store il y a des CUI de partout en fin de compte

twktheainur commented 7 years ago

@jonquet les résultats sur EMEA montent à: (P/R/F1) 0.0640 0.1526 0.0902

Par contre dans les cas où il y en a plusieurs ça compte faux si c'est pas exact

AminaANNANE commented 7 years ago

Bonjour

Pour MSHFRE et DOID, à mon avis le mieux est d'aligner (MeSH et DOID) ensuite utiliser les mappings multilingues réconciliés dans notre premier travail pour déduire les liens avec l'ontologie française MSHFRE. En effet, généralement l'alignement de deux ontologies de même langue est plus facile que l'alignement de deux ontologies de langues différentes. Pareil pour toutes les ontologies que nous avons traitées.

Amina.

jonquet commented 7 years ago

Pour la liste des ontologies avec lesquelles commencer, on va se baser sur le GDoc du projet PractikPharma: https://docs.google.com/spreadsheets/d/1JGSJlJGcDB9B_5_FWX67GUpNFYNf_v6ptlpT9Xr1Crs/edit#gid=0

Comme sources (fr), je propose de prendre:

Comme cibles (eng), je propose de prendre; SNOMED-CT, DOID, NCIt, OVAE, OGSF, OAE et AERO qui sont les ontologies recensées dans le listing que nous n'avons pas dans le SIFR BioPortal.

Je suggère de séparer cette tache en 2:

Ainsi, j'assigne à @AminaANNANE (on discutera tous ensemble de quand bosser la dessus en 2017)