Letractively / phantastic

Automatically exported from code.google.com/p/phantastic
GNU General Public License v3.0
0 stars 0 forks source link

Avoir une liste de mots à ignorer pour le calcul des distances entre les articles #32

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
Pour gagner un peu en temps de calcul, et minimiser les mots sans importance, 
il faut dresser une liste des principaux petits mots pouvant être ignorés, un 
peu comme ce qui existe dans Solr avec les « stop words ».

Ces mots doivent être défini par langue : il faut donc introduire en plus une 
option permettant de spécifier la langue lors du lancement du programme. Ceci 
permettra également de spécifier si une langue est RTL ou LTR aussi…

Original issue reported on code.google.com by petit.mi...@gmail.com on 29 Nov 2012 at 10:04

GoogleCodeExporter commented 9 years ago
This issue was updated by revision r60.

Original comment by petit.mi...@gmail.com on 29 Nov 2012 at 11:19

GoogleCodeExporter commented 9 years ago
Il faut prévoir l’espéranto, le fichier existe mais est vide pour le moment.

Voir également si je peux ajouter d’autres langues facilement.

Original comment by petit.mi...@gmail.com on 29 Nov 2012 at 11:21

GoogleCodeExporter commented 9 years ago
This issue was updated by revision r61.

Original comment by petit.mi...@gmail.com on 1 Dec 2012 at 11:33

GoogleCodeExporter commented 9 years ago

Original comment by petit.mi...@gmail.com on 1 Dec 2012 at 11:34