pds2 / 20231-team-1

TP PDS2 2023/1 - Grupo 1
2 stars 2 forks source link

Definir ranqueamentos que serão suportados #2

Closed luishgh closed 1 year ago

luishgh commented 1 year ago

Definir quais serão os ranqueamentos que serão suportados. O TF-IDF e o BM25 seriam o mínimo, mas talvez convenha adicionar suporte a algum outro também.

souza-marcos commented 1 year ago

Nas minhas buscas, ocorreu com certa frequência LSI (Latent Semantic Indexing). Porém me pareceu que é mais complexo do que se espera para este projeto, então não sei se é viável adicioná-lo também.

Edit: Um link para o assunto: https://en.wikipedia.org/wiki/Latent_semantic_analysis

luishgh commented 1 year ago

Dei uma lida no artigo e acho que é viável adicionar o LSA/LSI. No caso ele seria uma alternativa ao Modelo de Espaço Vetorial. Podemos ter uma classe base para os modelos de comparação, que é herdada pela classe do Modelo Vetorial e pela classe do LSA/LSI, e outra classe base para os modelos de ponderação, que é herdada pela classe do TF-IDF e pela do BM25. Por fim, instâncias dessas duas classes agiriam em conjunto para fornecer um ranqueamento.

souza-marcos commented 1 year ago

Fica decidido então que vamos utilizar: