jorcox / GeoCrawler

Apache License 2.0
3 stars 0 forks source link

¿Cambiar el sistema de extracción de términos? #40

Closed jorcox closed 8 years ago

jorcox commented 8 years ago

No acaba de gustarme el sistema que tengo actualmente con JATE. Quizá debería buscar una alternativa que me agrade más. Algo con Lucene. Se admiten sugerencias.

fjlopez commented 8 years ago

¿Que defines como "agradable"?

jorcox commented 8 years ago

Es que JATE me parece que no tiene soporte para otros idiomas que no sean inglés. Esto es un problema. Además, funciona de manera un poco rara.

jorcox commented 8 years ago

Después del día de ayer mirando cosas y no viendo nada que me gustara he decidido que puedo implementar mi propio sistema. Simplemente trabajara con la frecuencia de las palabras en un documento. El problema de los otros sistemas es que están muy enfocados a colecciones de documentos, no a un único documento. Así que un sistema propio que funcione con unas stopwords y poco más será suficiente. y más útil.

fjlopez commented 8 years ago

Me parece bien.

jorcox commented 8 years ago

DOING

jorcox commented 8 years ago

28ba3f4917c602e4817f21d4186901cded8255af