basedosdados / mais

⚙️ Código de manutenção do datalake (metadados e pacotes de acesso) | 📖 Docs: https://basedosdados.github.io/mais/
https://info.basedosdados.org/links
MIT License
392 stars 88 forks source link

[dados] Estruturar ontologia e organização para queries #1211

Open rdahis opened 2 years ago

rdahis commented 2 years ago

Desafio

Ter um sistema de gestão de consultas/views/tabelas nativas que escale para uso interno e para projetos com clientes. Tem que ser fácil buscar, entender, editar, aplicar no Metabase, etc.

Solução ideal

Uma busca no site, com metadados e ligações ao BigQuery. Criaríamos uma aba "análises" com uma busca própria.

Metadados relevantes: organização, nível da observação, cobertura espacial, cobertura temporal, colunas, etc.

Solução provisória

Estabelecer (1) estrutura de pastas (datasets/tables), (2) ontologia de nomeação, (3) manual de estilo para escrita de queries.

Exemplos

Ontologia SMTR: https://github.com/RJ-SMTR/maestro/wiki/Ontologia-de-nomea%C3%A7%C3%A3o-Datasets-e-Tabelas

rdahis commented 2 years ago

Acumulando minha primeira versão pra BD aqui: https://github.com/basedosdados/.github/wiki/An%C3%A1lises

rdahis commented 2 years ago

Encaminhamentos da reunião com @d116626 e @fernandascovino:

rdahis commented 2 years ago

Pontos para o futuro:

rdahis commented 2 years ago

Pra ler sobre opções de mono-repo ou não do dbt: https://discourse.getdbt.com/t/how-to-configure-your-dbt-repository-one-or-many/2121