Ce projet consiste à nettoyer, transformer et analyser le dataset Netflix en utilisant Microsoft SQL Server.
L’objectif est de construire une table analytique fiable à partir de données brutes et de répondre à des questions métiers concrètes à l’aide de requêtes SQL.
- Microsoft SQL Server
- SQL Server Management Studio (SSMS)
- SQL (T-SQL)
Le dataset contient des informations sur les films et séries disponibles sur Netflix, notamment :
- Identifiant du contenu
- Type (Film / Série TV)
- Titre
- Réalisateur
- Casting
- Pays de production
- Date d’ajout sur Netflix
- Année de sortie
- Classification (Rating)
- Durée
- Genre
- Description
- Création d’une base dédiée :
netflix_db
- Importation des données sources dans une table de staging
- Conservation des données sans transformation
- Gestion des valeurs manquantes
- Conversion et normalisation des dates
- Transformation de la durée (valeur + unité)
- Standardisation des colonnes textuelles
- Suppression des enregistrements incohérents
- Schéma optimisé pour l’analyse
- Données propres et cohérentes
- Prête pour les requêtes analytiques
- Comptage des valeurs nulles
- Vérification de la cohérence des données
- Validation du nombre total de lignes
Réponses à des questions analytiques clés :
- Répartition Films vs Séries TV
- Classification la plus fréquente par type de contenu
- Contenus par année de sortie
- Pays produisant le plus de contenus
- Films les plus longs
- Contenus ajoutés récemment
- Analyse par réalisateur et acteurs
- Genres les plus représentés
- Classification du contenu selon les mots-clés sensibles
- Les films représentent la majorité du catalogue Netflix
- Les États-Unis et l’Inde sont les principaux pays producteurs
- La majorité des séries comptent moins de 5 saisons
- Les genres Drama et International Movies sont les plus fréquents
netflix-sql-data-analysis/
│
├── data/
│ └── dataset.csv
│
├── sql/
│ ├── 01_database_staging_final_table.sql
│ ├── 03_data_cleaning.sql
│ └── 05_analysis_queries.sql
│
└── README.md
- Mettre en pratique un workflow professionnel d’analyse de données
- Appliquer les bonnes pratiques SQL (staging, nettoyage, audit)
- Produire des analyses exploitables pour la prise de décision
Kodjo Georges AKAKPO
Data Analyst | SQL | Power BI | Python
📫 N’hésitez pas à me contacter pour toute question ou collaboration.