J'ai vu que les filtres avaient été intégrés !
Ils sont à la racine du projets, et ce n'est pas leur place:
spacy_filters.py devrait être avec les autres scripts dans le package rse_watch.
dans sententizer.py, son import sera alors import rse_watch.spacy_filters as sf et non plus import spacy_filters as sf
Le notebook devrait être dans le dossier rse_watch\notebooks
le cv de mots de la white_list devrait être dans rse_watch également car il fait partie du package :)
Au niveau de l'intégration dans la base de données, ça va dépendre de l'usage qu'on en fait évidemment :)
cf mon msg sur le chat:
A terme ce qui peut être fait c'est intégrer les filtres de date + la proximité avec le mot "engagement" pour ranker les phrases suivant ce dernier critère.
@Hugo-GEE qu'est-ce que tu en penses :) ?
J'ai vu que les filtres avaient été intégrés ! Ils sont à la racine du projets, et ce n'est pas leur place:
import rse_watch.spacy_filters as sf
et non plusimport spacy_filters as sf
Au niveau de l'intégration dans la base de données, ça va dépendre de l'usage qu'on en fait évidemment :) cf mon msg sur le chat: