Esse é um template para um pacote DBT a ser importado no repositório principal, que irá gerar um servidor RPC para execução dos projetos.
GKE_PROJECT
: identificador do projeto no GCP.GKE_CLUSTER_NAME
: nome do cluster no GKE.GKE_CLUSTER_ZONE
: zona do cluster no GKE.GKE_SA_KEY
: credenciais para uma conta de serviço com pleno acesso ao GKE, GCR e GCS. Preencher com o resultado de cat sua-credencial.json | base64
.dbt_project.yml
para o nome do seu projeto. Aproveite esse momento para ler, com calma, os comentários desse arquivo de configuração.profiles.yml
e se atente aos comentários, eles indicam os campos que devem ser alterados.credentials-dev
e credentials-prod
usando a flag --from-file
.main
, uma instância atualizada do servidor RPC do DBT será criada em seu cluster, no devido namespace.Caso seja um dataset-id
já existente, acesse models/<dataset-id>
e pule para o passo 5.
Caso seja um novo dataset-id
, crie um novo diretório models/<dataset-id>
.
No arquivo dbt_project.yml
registre o dataset-id
junto aos já existentes, conforme exemplo abaixo:
models:
emd:
dataset-id:
+materialized: view # Materialization type (view, table or incremental)
+schema: dataset-id # Overrides the default schema (defaults to what is set on profiles.yml)
models/<dataset-id>
, crie um arquivo schema.yml
para preencher metadados de suas tabelas. Exemplo abaixo:version: 2
models:
- name: my_first_dbt_model
description: "A starter dbt model"
columns:
- name: id
description: "The primary key for this table"
models/<dataset-id>
.