datalab-mi / ridoc

3 stars 1 forks source link

Sentence transformer #18

Open victorjourne opened 3 years ago

victorjourne commented 3 years ago

Pour la problématique de Question/Reponse, on pourrait utiliser du plongement lexical avec un BERT, et indexer cette reprensentation dans ES en mode dense_vector , comme dans ce notebook.

evayse commented 3 years ago

:+1:

victorjourne commented 3 years ago

Sur hugging face, j'ai trouvé une démo de QR avec le modèle etalab

mpw-user commented 3 years ago

Quelques idées et liens utiles:

Cours sur le Word Embedding: https://lena-voita.github.io/nlp_course/word_embeddings.html

evayse commented 3 years ago

La recherche sémantique réalisée avec sentence-transformers est implémentée sur la branche feat/sentence-transformers_eva.

Dans la version actuelle, le script renvoie les résultats avec le score associé à chaque hit de chaque query.

Ce qu'il reste à faire :

victorjourne commented 3 years ago

Sentence transformer Appliqué au covid

victorjourne commented 3 years ago

Un framework à tester : https://deeppavlov.ai

victorjourne commented 3 years ago

Autre possibilité: modèles 2 étages avec elasticsearch et bert. (piaf) http://github.com/deepset-ai/haystack/ https://github.com/etalab-ia/piaf-ml