Deux projets de collecte et visualisation de données réelles : scraping de médecins sur Doctolib et monitoring en temps réel des stations Vélib à Paris.
Extraction automatisée de médecins sur Doctolib via Selenium avec gestion de la pagination dynamique, anti-détection bot et export CSV.
Pneumologues à Paris
- 22 pages de résultats parcourues automatiquement
- ~470 médecins extraits (nom, spécialité, adresse, secteur)
- Export :
medecins_pneumologues_paris.csv
Pédiatres en Île-de-France
- Scraping multi-villes sur toute l'Île-de-France
- Visualisation : histogramme du nombre de pédiatres par ville
- Export :
pediatres_idf.csv
Stack : Python · Selenium · BeautifulSoup · Pandas · Matplotlib
Système complet de monitoring des stations Vélib en temps réel via l'API OpenData Paris.
Modules :
| Fichier | Description |
|---|---|
velib_api.py |
Appel API OpenData Paris — récupère toutes les stations en temps réel |
velib_carte.py |
Carte interactive Folium — stations colorées selon disponibilité |
velib_evolution.py |
Monitoring top 10 stations — collecte toutes les 2 min + graphique |
velib_surveillance.py |
Système d'alerte — détecte et surveille une station vide |
Stack : Python · Requests · Folium · Matplotlib · API REST
data-collection-projects/
├── doctolib-scraping/
│ ├── pneumologues_paris.ipynb # Scraper pneumologues Paris
│ ├── pediatres_idf.ipynb # Scraper pédiatres Île-de-France
│ ├── medecins_pneumologues_paris.csv
│ ├── pediatres_idf.csv
│ └── histogramme_pediatres_idf.png
├── velib-monitoring/
│ ├── velib_api.py
│ ├── velib_carte.py
│ ├── velib_evolution.py
│ ├── velib_surveillance.py
│ └── velib_stations.csv
└── requirements.txt
git clone https://github.com/meldub94/data-collection-projects.git
cd data-collection-projects
pip install -r requirements.txtPour le scraping Doctolib :
# Lancer le notebook
jupyter notebook doctolib-scraping/pneumologues_paris.ipynbPour la carte Vélib :
cd velib-monitoring
python velib_carte.py
# Ouvre velib_carte.html dans ton navigateurPour le monitoring en temps réel :
python velib_evolution.py
# Ctrl+C pour arrêter et afficher le graphiqueChaque station est représentée par un cercle proportionnel à sa capacité.
- 🟢 Vert : vélos disponibles
- 🔴 Rouge : station vide
Répartition du nombre de pédiatres par ville en Île-de-France.
Python · Selenium · BeautifulSoup · Folium · Pandas
Matplotlib · Requests · API REST · OpenData Paris
Projets réalisés dans le cadre du MSc Data Management — Aivancity Paris-Cachan (2025-2026)