scieloorg / document-store-migracao

Document Store (Kernel) - Migração
BSD 2-Clause "Simplified" License
1 stars 6 forks source link

Adiciona a documentação do comando de similaridade e corrige a comparação entre o valor da similaridade e a "nota de corte". #407

Closed jamilatta closed 3 years ago

jamilatta commented 3 years ago

O que esse PR faz?

Na criação desse PR não havia sido enviado a documentação sobre esse comando e existia um bug na comparação entre a nota de corte e o valor retornado da função que avalia a similaridade.

Onde a revisão poderia começar?

Olhando os commits suspeito que seja suficiente.

Como este poderia ser testado manualmente?

Para realizar o teste é necessário ter um PID que faça a comparação e que esse número seja próximo de um interiro, exemplo 70,1 ou 43,00009, portanto, coloco aqui um PIDs em que o valor da similaridade é próximo de 90.

S0044-59672015000200239

Crie um arquivo com o pid: S0044-59672015000200239, chamado pids.txt

E execute o seguinte comando:

ds_migracao check_similarity --similarity_input pids.txt --similarity_output sim.jsonl --cut_off_mark 90

Verifique que no arquivo sim.jsonl não consta o texto da comparação, pois o texto é considerado similar.

Algum cenário de contexto que queira dar?

N/A

Screenshots

N/A

Quais são tickets relevantes?

370

Referências

N/A