juba / rainette

R implementation of the Reinert text clustering method
https://juba.github.io/rainette/
53 stars 7 forks source link

Dictionnaire et rainette_plot2() #3

Closed manubonnet closed 4 years ago

manubonnet commented 4 years ago

Bonjour,

Tout d'abord merci beaucoup pour ce package très complet et très efficace.

Merci d'avance pour la réponse,

Cordialement

juba commented 4 years ago

Bonjour,

Pour le dictionnaire, c'est possible de la faire avec R/Quanteda en faisant de la substitution de termes. Je trouverais ça assez dommage cependant, si vous voulez faire de la lemmatisation il y a des packages a priori nettement plus puissants et intéressants comme spacyr ou udpipe.

Pour récupérer les données correspondant au graphique, c'est une très bonne question et il n'y a malheureusement pas de solution simple pour ça actuellement dans rainette. En gros le truc qui marcherait vagument serait quelque chose comme ça :

groups <- cutree_rainette(res, k = 3)
rainette:::keyness_stats(groups, dtm, "chi2", rlang::sym("chi2"), show_negative = TRUE, n_terms = 10)

Autant dire que ça n'est pas pratique. Il faut que je rajoute une fonction plus simple qui permettre de le faire.

juba commented 4 years ago

J'ai rajouté une issue (#4) pour ça du coup.

Merci d'avoir pris le temps de faire ce retour !

manubonnet commented 4 years ago

merci beaucoup pour la réponse rapide! et très efficace