scieloorg / document-store-migracao

Document Store (Kernel) - Migração
BSD 2-Clause "Simplified" License
1 stars 6 forks source link

Falha na identifação de arquivos pdfs, documentos suplementares são identificados como manifestações #360

Closed joffilyfe closed 3 years ago

joffilyfe commented 3 years ago

Descrição do problema

Durante a importação dos documentos nativos, a aplicação está detectando arquivos suplementares como manifestações, este comportamento não é desejado e precisa ser corrigido.

Passos para reproduzir o problema

  1. Realize o empacotamento do documento utilizando o CSV [1];
  2. Realize a importação do documento recém empacotado;
  3. Acesse o documento no kernel;
  4. Verifique o arquivo 0102-3306-abb-0102-33062019abb0286-s.pdf foi incluído como PDF;
  5. Verifique que o arquivo 0102-3306-abb-0102-33062019abb0286-s.pdf é na verdade um asset;

PS: Também é possível observar o resultado migração em https://kernel.scielo.br/documents/TnjhyTGnrnM9JjBsr54DZVj/manifest

Comportamento esperado

Espera-se que ao realizar a importação, os arquivos do tipo suplemento sejam tratados como assets e apenas isto. O programa de importação não deveria classificar este tipo de arquivo como manifestação.

Screenshots ou vídeos

N/A

Anexos

[1] - Documento com problema

Ambiente utilizado

N/A

patymori commented 3 years ago

Lista dos PIDs V3 com problemas: https://gist.github.com/patymori/90079608622179b3fa54d1c2050e3f2a

patymori commented 3 years ago

Feita atualização no Gist acima, que continha documentos que não tinham material suplementar anexado.