bireme / SimilarDocs

Engine to look for similar documents stored at a Lucene index
Other
0 stars 0 forks source link

Armazenar o conteúdo do perfil na forma de ngrams ao invés de texto simples #49

Closed heitorbarbieri closed 4 years ago

heitorbarbieri commented 4 years ago

Agiliza na busca de documentos similares e permite que se utilizem mais tokens uma vez que existe um limite de número de ngrams utlizado na pesquisa (ao se armazenar somente ngrams, os dupllicados são eliminados)

heitorbarbieri commented 4 years ago

Implementado no commit 029b9b3