Data Analyst avec 2 ans d'expérience en entreprise (UBAF — Groupe Crédit Agricole), spécialisée dans la visualisation de données, l'automatisation et la modélisation prédictive. Double formation Finance & Data Management — je comprends les enjeux métier avant de les modéliser.
Langages Python · SQL · R · VBA · PySpark (notions)
Data & ML Pandas · Scikit-learn · HuggingFace Transformers · PyTorch (fine-tuning) · spaCy · NLP · ETL · Feature Engineering · K-Means · SHAP · SMOTE
Visualisation Power BI · Looker Studio · Excel Avancé · Power Query · Folium
Collecte de données Selenium · BeautifulSoup · API REST · OpenData Paris
Gouvernance & Compliance Data Governance · Data Quality · RGPD · KYC/AML · LCB-FT
Outils Git · WandB · pytest · Streamlit
| Projet | Stack | Description |
|---|---|---|
| Sentiment Analysis NLP — Amazon Reviews | Python · spaCy · Scikit-learn · HuggingFace · PyTorch · Power BI | Pipeline NLP end-to-end sur 100k avis — F1-macro 0.826 (LR baseline) vs DistilBERT fine-tuné |
| Predictive Maintenance — ML Industriel | Python · Scikit-learn · SMOTE · WandB | Prédiction de défaillance industrielle — Recall 99.70%, F1 87.31% sur 259k enregistrements |
| Marketing ML — Segmentation & Scoring | Python · K-Means · SHAP · Streamlit | Segmentation client K-Means + scoring campagne (AUC 88%) + recommandation exécutive SHAP |
| Data Collection — Scraping & API | Selenium · Folium · API REST | Scraping Doctolib (470+ médecins) + monitoring Vélib temps réel |
- Microsoft Power BI Data Analyst Associate — PL-300 (passage prévu mai 2026)
- AWS Certified AI Practitioner — AIF-C01 (passage prévu mai 2026)
Disponible en CDI à partir d'octobre 2026 — ouverte à tous secteurs.