Open LamDang opened 3 years ago
@adnaneh @Ryosaeba8 @syrinecheriaa Il faudrait que vous voyez la répartition des tâches dessus. Ensuite ce serait bien de créer des issues pour chaque tâches pour pouvoir discuter des détails et se montrer des ressources.
N'hésitez pas si vous avez des questions.
Je prend : Tronc commun: Pipeline de preprocessing : Segmenter le fichier en phrases , nettoyer les éléments non linguistique (saut à la ligne, etc)
@adnaneh tu peux créer une issue dédiée? comme ça je te pousse qq idées pour te faire gagner du temps
Moi je fonce sur les approches sémantiques pour la détection des phrases pertinentes. je vais aussi créer une issue. Merci @LamDang !
J'ai pu vérifier avec les organisateurs. Sur la plateforme de soumission il y a 4CPU et 13Gb RAM
Another constraint: The algorithm needs to run below 7 min.
@adnaneh @Ryosaeba8 @syrinecheriaa Pour avoir une vision globale je vous propose de regarder https://github.com/deepset-ai/haystack pour en inspirer. Nous n'avons pas assez de temps pour l'intégrer ou créer qq chose de ce niveau mais ça permet de comprendre ce qu'on fait dans l'ensemble
Hello, vous en êtes où sur la partie regex sur les pays? Vous arrivez à avancer?
Hello @LamDang, c'est moi qui suit responsable de cette partie mais j'ai dû préparer ma soutenance que je viens de finir, du coup je vous update la dessus dans l'après-midi normalement si je ne suis pas sur la partie sustainable. Dans le même temps Joël et Syrine travaillent sur la partie sustainable.
Hello,
Je crée cette issue pour lister les tâches techniques à faire pour livrer l'algorithme final. On peut en discuter et faire évoluer cette liste au fur et à mesure:
Tâches génériques
Tâches NLP - @adnaneh
Tronc commun
Détection des phrases pertinentes par question - @Ryosaeba8
Question réponse boolean: - @syrinecheriaa
Question sur les pays: