Open victorjourne opened 3 years ago
:+1:
Sur hugging face, j'ai trouvé une démo de QR avec le modèle etalab
Quelques idées et liens utiles:
Cours sur le Word Embedding: https://lena-voita.github.io/nlp_course/word_embeddings.html
La recherche sémantique réalisée avec sentence-transformers est implémentée sur la branche feat/sentence-transformers_eva.
Dans la version actuelle, le script renvoie les résultats avec le score associé à chaque hit de chaque query.
Ce qu'il reste à faire :
Sentence transformer Appliqué au covid
Un framework à tester : https://deeppavlov.ai
Autre possibilité: modèles 2 étages avec elasticsearch et bert. (piaf) http://github.com/deepset-ai/haystack/ https://github.com/etalab-ia/piaf-ml
Pour la problématique de Question/Reponse, on pourrait utiliser du plongement lexical avec un BERT, et indexer cette reprensentation dans ES en mode dense_vector , comme dans ce notebook.