Skip to content

seriallink/datamaster

Repository files navigation

Data Master Case – Serverless Data Lake on AWS

go-data-master.png

Projeto de arquitetura serverless e orientada a eventos para data lakes na AWS — escalável, de baixo custo e pronta para produção. Desenvolvido para o programa Data Master da F1rst/Santander.


Objetivo

Este projeto tem como objetivo construir uma solução completa de engenharia de dados baseada em nuvem, utilizando arquitetura serverless, modular e orientada a eventos. A proposta simula um domínio real de dados e entrega uma estrutura preparada para:

  • Ingestão de dados nos modos streaming e batch
  • Processamento em múltiplas camadas: raw, bronze, silver, gold
  • Organização e catalogação automatizada com Glue e Iceberg
  • Transformações otimizadas com Lambda, ECS e EMR Serverless
  • Orquestração de pipelines com Step Functions e EventBridge
  • Governança de dados com Lake Formation, controle de acesso e mascaramento automático de PII com Comprehend
  • Visualização por meio de dashboards analíticos e operacionais com Grafana
  • Execução end-to-end totalmente automatizada, da ingestão até os dashboards

Documentação

A documentação completa está disponível na pasta docs/

About

Arquitetura de data lake low-cost, serverless e orientada a eventos na AWS – Desenvolvido para o programa Data Master da F1rst/Santander.

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages