Case Tecnico Base - v2.0 Dadosfera
Bem-vindo ao caso de estudo técnico para Dadosfera versão 2.0. Este projeto tem como objetivo demonstrar as capacidades da Dadosfera, uma plataforma de dados, utilizando-a para explorar, integrar e transformar um conjunto de dados do mundo real. Usaremos o banco de dados Microsoft AdventureWorks para este estudo de caso. Este arquivo README serve como um guia para o projeto, delineando as tarefas concluídas e fornecendo links para recursos relevantes. Acompanhe-nos enquanto mergulhamos no mundo dos dados com a Dadosfera.
Item 0 - Sobre Agilidade e Planejamento
Concepção e Planejamento
![Principais atividades deste Case Técnico](https://github.com/cglima/CASSIANA_BARRETO_DDF_TECH_032024/raw/main/prints/atividades-case.png)
Item 1 - Sobre a Base de Dados
- [x] Pesquisar uma base de dados para fazer o case end-to-end
Escolhi a base de dados Microsoft AdventureWorks - DataBase
Documentação do banco de dados Microsoft AdventureWorks
Item 2 - Sobre a Dadosfera - Integrar
- [x] Carregar a base de dados para a Plataforma Dadosfera
- [ ] Bonus: Carregue seus dados numa base transacional SQL, importe para a Dadosfera e aplique uma microtransformação
Item 3 - Sobre a Dadosfera - Explorar
![Mais detalhes de uma tabela](https://github.com/cglima/CASSIANA_BARRETO_DDF_TECH_032024/raw/main/prints/detalhes_catalogo.png)
- [x] Organizar os dados seguindo as definições comuns de um Data Lake
![Datalake da base AdventureWorks](https://github.com/cglima/CASSIANA_BARRETO_DDF_TECH_032024/raw/main/prints/datalake.png)
Item 4 - Sobre Data Quality
Item 5 - Sobre o uso de GenAI e LLMs - Processar
- [ ] Gerar features em cima de dados desestruturados com ajuda da IA
- [ ] Bonus: Usar Video ou Audio como exemplo deste item do case
Item 6 - Sobre Modelagem de Dados
- [x] Criar uma modelagem seguindo os princípios de Kimball, Data Vault ou outro - Link para a resposta
- [x] Explicar e justificar o modelo criado com 2 visões finais dos dados - Link para a resposta
- [ ] Bonus: desenhe o diagrama representando as camadas finais do DW proposto
Item 7 - Sobre Análise de Dados - Analisar
- [x] Criar uma Coleção com o formato -
- [x] Criar um dashboard que mostre uma análise das categorias e uma análise de série-temporal
- [x] Salvar a Query SQL utilizada Link para as queries SQL Dashboard
- [x] Salvar o print do resultado da query no documento markdown deste teste
- [x] Criar, pelo menos, 5 visualizações/questões em cima dos dados, utilizando 5 tipos de visualizações diferentes
Link para o meu Metabase
Item 8 - Sobre Pipelines
- [ ] Criar um pipeline para processar os dados anteriores
- [ ] Catalogar esse pipeline desenvolvido na Dadosfera
Item 9 - Sobre Data Apps
- [ ] Criar um Data App utilizando Streamlit para explorar os dados anteriores
Item 10 - Apresentação do Case
- [x] Fazer a apresentação do Case
- [x] Gravar a apresentação do Case
- [x] Carregar o vídeo da apresentação do case no Youtube
- [x] Apresentar o case para o CEO e CTO da Dadosfera
O vídeo da apresentação do case está disponível no https://www.youtube.com/watch?v=4NDhbnZ5abE