Skip to content
View meldub94's full-sized avatar

Block or report meldub94

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
meldub94/README.md

Mariame El Dub — Data Analyst & Data Scientist Junior

Data Analyst avec 2 ans d'expérience en entreprise (UBAF — Groupe Crédit Agricole), spécialisée dans la visualisation de données, l'automatisation et la modélisation prédictive. Double formation Finance & Data Management — je comprends les enjeux métier avant de les modéliser.


Stack

Langages Python · SQL · R · VBA · PySpark (notions)

Data & ML Pandas · Scikit-learn · HuggingFace Transformers · PyTorch (fine-tuning) · spaCy · NLP · ETL · Feature Engineering · K-Means · SHAP · SMOTE

Visualisation Power BI · Looker Studio · Excel Avancé · Power Query · Folium

Collecte de données Selenium · BeautifulSoup · API REST · OpenData Paris

Gouvernance & Compliance Data Governance · Data Quality · RGPD · KYC/AML · LCB-FT

Outils Git · WandB · pytest · Streamlit


Projets

Projet Stack Description
Sentiment Analysis NLP — Amazon Reviews Python · spaCy · Scikit-learn · HuggingFace · PyTorch · Power BI Pipeline NLP end-to-end sur 100k avis — F1-macro 0.826 (LR baseline) vs DistilBERT fine-tuné
Predictive Maintenance — ML Industriel Python · Scikit-learn · SMOTE · WandB Prédiction de défaillance industrielle — Recall 99.70%, F1 87.31% sur 259k enregistrements
Marketing ML — Segmentation & Scoring Python · K-Means · SHAP · Streamlit Segmentation client K-Means + scoring campagne (AUC 88%) + recommandation exécutive SHAP
Data Collection — Scraping & API Selenium · Folium · API REST Scraping Doctolib (470+ médecins) + monitoring Vélib temps réel

Certifications en cours

  • Microsoft Power BI Data Analyst Associate — PL-300 (passage prévu mai 2026)
  • AWS Certified AI Practitioner — AIF-C01 (passage prévu mai 2026)

Me contacter

LinkedIn Email


Disponible en CDI à partir d'octobre 2026 — ouverte à tous secteurs.

Popular repositories Loading

  1. predictive-maintenance-project predictive-maintenance-project Public

    Projet ML - Prédiction de défaillance industrielle

    Python 1

  2. data-collection-projects data-collection-projects Public

    Web scraping & API monitoring — Selenium · Folium · OpenData Paris

    Jupyter Notebook 1

  3. Advanced-Marketing-Analytics-Decision-Intelligence Advanced-Marketing-Analytics-Decision-Intelligence Public

    ML end-to-end : segmentation client, scoring de campagne et optimisation ROI

    Jupyter Notebook

  4. meldub94 meldub94 Public

  5. amazon-nlp-sentiment amazon-nlp-sentiment Public

    Projet NLP end-to-end : classification de sentiment sur 100k avis Amazon — TF-IDF, XGBoost, DistilBERT fine-tuning, Power BI

    Jupyter Notebook