transparencia-mg / dpckan

MIT License
5 stars 4 forks source link

Melhorar validação de existência de recurso publicado #137

Open gabrielbdornas opened 2 years ago

gabrielbdornas commented 2 years ago

CKAN permite publicar conjuntos com mesmos nomes em organizações diferentes. Sendo assim, a regra atual dpckan para verificar a existência de algum conjunto de dados publicado deverá levar em consideração o nome do dataset e a organização responsável.

Apontamento realizado durante testes com @Andrelamor

fjuniorr commented 2 years ago

Não sei o contexto do apontamento, mas a afirmação

CKAN permite publicar conjuntos com mesmos nomes em organizações diferentes

não é verdade.

O issue https://github.com/dados-mg/issues/issues/52 inclusive discute exatamente esse ponto.

Andrelamor commented 2 years ago

Contexto: durante os testes para realização da oficina com a FHEMIG, foi utilizado o mesmo nome de dataset para duas organizações distintas, mas a operação não foi possível por causa de outro erro concomitante. O outro erro concomitante deveria ter sido checado somente após a existência prévia de dataset homônimo, parece que a iteração ficou na ordem invertida. Então a mensagem de erro não apontou a existência de dataset homônimo na mesma organização.

@fjuniorr a questão aqui é exatamente a mesma do https://github.com/dados-mg/issues/issues/52: como quebrar essa limitação do CKAN, sem maiores complicações como inserir no name o valor {org_name}+[dataset_name}?

@gabrielbdornas em teste realizado agora, sem outros erros concomitantes, a mensagem foi simplesmente:

(venv)
Andre@DESKTOP-R63LP8N MINGW64 ~/Desktop/violencia-contra-mulher (master)
$ dpckan dataset create -H $HOMOLOGA_HOST -k $HOMOLOGA_KEY
Dataset violencia-contra-mulher já publicado acesse https://homologa.cge.mg.gov.
br/dataset/violencia-contra-mulher
Andrelamor commented 2 years ago

em comentário do #52, o portal federal parece nomear os datasets homônimos de uma forma ad-hoc, para impedir essa limitação do CKAN, deixando o title igual:

https://dados.gov.br/dataset?q=orcamento&sort=score+desc%2C+metadata_modified+desc https://dados.gov.br/dataset/orcamento https://dados.gov.br/dataset/orcamento2 https://dados.gov.br/dataset/ifes-orcamento https://dados.gov.br/dataset/orcamento-ufmg

@fjuniorr parece que vai ficar difícil fugir da alternativa {sigla-órgão}+[nome-dataset} para evitar as duplicidades