DataRadar — Setup Completo

1. Variáveis de Ambiente

Copie o template e preencha:

cp .env.example .env

Variável	Descrição	Obrigatória
`AWS_ACCESS_KEY_ID`	Chave de acesso AWS	Só para S3
`AWS_SECRET_ACCESS_KEY`	Secret key AWS	Só para S3
`AWS_DEFAULT_REGION`	Região AWS	Só para S3
`DEVRADAR_S3_BUCKET`	Nome do bucket S3	Só para S3

2. Airflow (Docker)

cd airflow
docker compose up -d

Acesse: http://localhost:8080
Login: admin / admin
DAGs disponíveis:
- devradar_reddit_ingestion_local — trigger manual, parametrizável
- devradar_reddit_scheduled — execução horária automática

3. API + Dashboard

cd app
pip install -r requirements.txt
uvicorn main:app --reload --port 8000

API: http://localhost:8000/api/health
Dashboard: http://localhost:8000

Sem variáveis DATABRICKS_*, o endpoint de pipeline usa fallback em memória a partir do Bronze local; com elas, a API consulta o SQL Warehouse. Os notebooks PySpark rodam no Databricks, não via uvicorn — ver databricks/README.md.

4. Testes

pip install pytest ruff
pytest tests/ -v

5. Lint

ruff check .

6. Utilitários

# Trigger manual da DAG
python scripts/trigger_dag.py dataengineering python rust

# Teste de upload S3 (requer variáveis de ambiente configuradas)
python scripts/test_s3_upload.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

DataRadar — Setup Completo

1. Variáveis de Ambiente

2. Airflow (Docker)

3. API + Dashboard

4. Testes

5. Lint

6. Utilitários

FilesExpand file tree

setup.md

Latest commit

History

setup.md

File metadata and controls

DataRadar — Setup Completo

1. Variáveis de Ambiente

2. Airflow (Docker)

3. API + Dashboard

4. Testes

5. Lint

6. Utilitários