1️⃣ Préparation des données
Collecter les données historiques d’athlètes : VMA, volume hebdomadaire, temps marathon
Nettoyer les données : valeurs manquantes, outliers, incohérences
Vérifier la distribution des variables et identifier corrélations initiales
2️⃣ Analyse exploratoire (EDA)
Visualiser la relation entre VMA et temps marathon
Visualiser la relation entre volume hebdomadaire et temps marathon
Créer des graphiques combinés (scatter plots + regression line)
3️⃣ Préparation des features
Normaliser ou standardiser les variables (optionnel)
Créer éventuellement des features dérivées : ex. produit VMA × volume
Séparer les données en train/test (ex. 80/20)
5️⃣ Validation du modèle
Vérifier la distribution des résidus
Tester la robustesse avec cross-validation
Identifier les prédictions aberrantes et comprendre pourquoi