Andrelamor / projeto_pesquisa_experiencia_usuario_pdt

Documentos relacionados ao projeto \"Pesquisa de Experiência do Usuário no Portal da Transparência
0 stars 1 forks source link

Hipóteses para erros de validação de datapackages não tabulares #1

Open Andrelamor opened 2 years ago

Andrelamor commented 2 years ago

Este apanhado não será necessariamente aderente às convenções, visa registrar temporariamente os erros encontrados e as hipóteses para os mesmos.

Inicialmente, o datapackage tinha somente um arquivo tabular, então isso ficou discriminado no datapackage.json. Somente o arquivo csv tinha schema e dialect, enquanto os demais foram marcados com profile: data-resource.

Na validação via datapackage creator (que não lê o schema nem o dialect), a mensagem de erro foi:

Data package is invalid!

Descriptor validation error: Data does not match any schemas from "oneOf" at "" in descriptor and at "/oneOf" in profile

Já no goodtables:

Data Package "https://raw.githubusercontent.com/Andrelamor/projeto_pesquisa_experiencia_usuario_pdt/60262e64af9831f3dbb5d8b419c02f2c6b3c6b08/datapackage.json" has a loading error "Not resolved Remote URI "schema.json" for resource.schema"

Hipóteses:

  1. ao taggear um único recurso como tabular no profile, todos os demais são lidos como tal (mesmo tendo sido informado no datapackage que são meros data-resource?

  2. ao adicionar um schema externo em um único recurso, dentre vários recursos de um datapackage, a validação pressupõe que todos os demais também deveriam ter um schema associado?

Andrelamor commented 2 years ago

Após modificações nas propriedades format e encoding dos arquivos excel, percebe-se que o goodtables continua interpretando esses arquivos como tabulares, mesmo tendo sido atribuído data-resource como valor para a propriedade format. Exemplo:

    {
      "name": "planejamento-teste-usabilidade",
      "path":"plano_trabalho/planejamento-teste-usabilidade.xlsx",
      "profile": "data-resource",
      "encoding": "windows-1252",
      "format": "xlsx"
    },

Exemplo de resultado de validação. Agora resta saber como informar que os demais arquivos não-tabulares não possuem schema, pois a segunda hipótese do comentário anterior parece ter se confirmado