Closed luishgh closed 1 year ago
Nas minhas buscas, ocorreu com certa frequência LSI (Latent Semantic Indexing). Porém me pareceu que é mais complexo do que se espera para este projeto, então não sei se é viável adicioná-lo também.
Edit: Um link para o assunto: https://en.wikipedia.org/wiki/Latent_semantic_analysis
Dei uma lida no artigo e acho que é viável adicionar o LSA/LSI. No caso ele seria uma alternativa ao Modelo de Espaço Vetorial. Podemos ter uma classe base para os modelos de comparação, que é herdada pela classe do Modelo Vetorial e pela classe do LSA/LSI, e outra classe base para os modelos de ponderação, que é herdada pela classe do TF-IDF e pela do BM25. Por fim, instâncias dessas duas classes agiriam em conjunto para fornecer um ranqueamento.
Fica decidido então que vamos utilizar:
Definir quais serão os ranqueamentos que serão suportados. O TF-IDF e o BM25 seriam o mínimo, mas talvez convenha adicionar suporte a algum outro também.