Neste workshop, vamos construir juntos uma pipeline completa de dados desde o zero!
O que você vai aprender:
1) Criar um Data Lakehouse na AWS RDS com arquitetura medalhão (bronze, silver, gold).
2) Processar grandes volumes de dados (1 milhão de registros) utilizando o DuckDB como intermediário.
3) Implementar transformações de dados eficientes com o dbt-core.
4) Desenvolver um dashboard interativo com o Taipy para visualização e análise dos dados.
5) Simular um sistema de CRM, recebendo diariamente arquivos com dados de clientes e pedidos.
Tecnologias que serão abordadas:
- Python
- SQL
- AWS RDS
- DuckDB
- dbt-core
- Taipy 📊
Destaques deste tutorial:
Não esqueça de se inscrever no canal, deixar seu like e ativar as notificações para ficar por dentro de mais conteúdos como este!
19 сен 2024