scieloorg / oai-pmh

Provedor da dados OAI-PMH para Rede SciELO
BSD 2-Clause "Simplified" License
2 stars 4 forks source link

Implementação de ChunkedResumptionToken impede listagens por conjuntos de periódicos. #25

Open gustavofonseca opened 6 years ago

gustavofonseca commented 6 years ago

O acesso a URL https://oaipmh.scielo.org/br/?verb=ListRecords&metadataPrefix=oai_dc&set=2237-9622 resulta na seguinte consulta ao ArticleMeta: querying ArticleMeta backend using params "collection=scl", "issn=None", "from_date=1998-08-01", "until_date=1998-12-31", "limit=100", "offset=0", "extra_filter={"code_title": "2237-9622"}". Repare nos argumentos from_date e until_date, que aparentemente não possuem qualquer relação com a consulta realizada anteriormente. A passagem destes argumentos é o que causa o bug percebido, que é a não recuperação dos conteúdos de determinados conjuntos (sets), como o do exemplo mencionado.

A existência dos argumentos from_date e until_date se justifica por conta da implementação de paginação implementada pela classe oaipmh.entities.ChunkedResumptionToken, cuja estratégia é de iterar em uma sequência de registros por meio de sucessivas iterações em blocos de sequências menores, baseados em intervalos de datas que podem ser configurados por meio da diretiva OAIPMH_CHUNKEDRESUMPTIONTOKEN_CHUNKSIZE.

Esse ticket é a causa do issue #23.