Bibliome / alvisir

AlvisIR semantic search engine
Apache License 2.0
6 stars 2 forks source link

Problème de requête avec des relations sur des arguments pouvant être plusieurs types d'entités #20

Open EstelleChaix opened 6 years ago

EstelleChaix commented 6 years ago

En Français car déjà difficile à expliquer (alors en anglais) Problème retrouvé sur microbe et seedev :

Pour permettre une interrogation "large" de FlagDB, j'ai fabriqué une entité "GeneOrProtein" , permettant d'interroger toutes les relations trouvées entre Gene et/ou Protein par une relation "universelle" ~loc (on passera sur le choix du nom.)

Du coup, dans mes textes, je tague des entités comme [Protein] , que je retaggue par dessus par [GeneOrProtein] Le problème réside dans l'interrogation de ces relations là :

Quand je fais par exemple : AT2G32950 interact AT3G20770 Je retrouve bien le lien entre les deux.

image

AT2G32950 ~loc AT3G20770 , j'ai une erreur no result

image

Mais, quand je cherche les relations "~loc" qui existent , en faisant des restrictions dessus, j'arrive à trouver cette relation là : {geneandprotein} ~loc {geneandprotein} AT3G20770 AT2G32950 , voir le deuxième hit, et la relation surlignée en violet

image

L'hypothèse c'est qu'il y a un choix qui est fait à un moment donné sur les entités qui peuvent être annotés par plusieurs types d'entités lors de la requête, et que ce choix impacte donc sur les résultats proposés.

En résumé : sur microbio : la requête ""Bacteria exhibits commensal" ne pouvait aboutir, car l'entité "commensal" pouvait être taggé par "Habitat" et "Phénotype", et était tagguée/choisie comme "habitat", et que la relation "Exhibits" n'accepte que des Phénotypes de l'autre côté.

De la même façon, ici pour SeeDev : Les deux protéines sont taggées par [Protein] et [GeneOrPortein] , et il est choisi [Protein] arbitrairement, ce qui fait qu'un requête de type ~loc ne peut aboutir car les arguments de part et d'autre ne sont pas [GeneOrPortein].

Je ne sais pas si ce choix est fait sur la requête, ou sur le texte "doublement annoté"

Là où cela pose plus problème c'est que j'étais en train de "découper" les relations génériques "Interact" en plusieurs types de relations (Binds, Regulation...)

J'espère que c'est par trop brouillon comme présentation du problème.