BrunoSupriano / SystemTransportDeltaLake

Pipeline de Dados de um sistema de transportes
MIT License
3 stars 1 forks source link

Issue #4: Desenvolver transformações utilizando Apache Spark (João Pedro) #6

Closed BrunoSupriano closed 3 months ago

BrunoSupriano commented 3 months ago

Tarefas:

Implementar notebooks no Databricks para transformar os dados da camada Bronze.

Realizar limpezas, filtros, agregações e outras operações de processamento utilizando Apache Spark.

Mover dados transformados para as camadas Silver e Gold, assegurando a qualidade e a integridade dos dados.

jpdarabas commented 3 months ago

Bronze:

Silver:

Gold:

jpdarabas commented 3 months ago

Camadas finalizadas.

Um resumo atualizado das transformações realizadas por cada camada:

Bronze:

Silver:

Gold: