Open revolunet opened 1 year ago
Top, on pourra voir dans le détail dans la phase de design ce qu'on en fait – intuitivement, je trouve que ça serait intéressant de créer / nommer des clusters pour qu'on se retrouve avec un nombre fini (et pertinent) de topics.
Aucune idée de comment solr fonctionne sous le capot mais j'imagine que ça doit sélectionner les mots clefs en fonction de leur fréquence d'apparition comparée à la rareté du mot (TF-IDF)
Alors en fait non ça ne vient pas de solr, mais les liens pointent vers la recherche solr Le tagging est réalisé par une task qui fait du simple TF/IDF sur les CRs de séance en hémicycle et en commission ici : https://github.com/regardscitoyens/nosdeputes.fr/blob/master/lib/task/tagSeanceTask.class.php C'est stocké dans la base sql dans les tables tag et tagging
Ha ok super merci @RouxRC du coup on peut reproduire côté front sans solr
normalement oui !
Apparemment ces infos proviennent de solr;
je ne suis pas sur qu'on veuille conserver ce fonctionnement pour la nouvelle version ? ca rejoint le sujet NER/NLP cc @FizBack