bireme / DCDup

Double Check Duplicated documents
Other
0 stars 1 forks source link

Diferenciar na função de checagem de duplicados se a checagem é com o arquivo de entrada mesmo ou com um índice diferente #30

Closed heitorbarbieri closed 5 years ago

heitorbarbieri commented 5 years ago

Se a checagem é com o próprio arquivo, identificadores (dbid) duplicados referem-se ao mesmo documento e portanto não há duplicação, mas quando se compara com documentos indexados em um índice, duplicação nos identificadores indica duplicação de documentos.

heitorbarbieri commented 5 years ago

Corrigido em a6afa0c