Ce projet présente une implémentation de l'algorithme ID3 et C4.3 pour la construction d'arbres de décision, ainsi que son application sur deux ensembles de données différents : le jeu de données sur le golf et le jeu de données sur les cultures de soja.
- Code source: Le code source est écrit en Python et est disponible dans le fichier
decision.ipynb. Ce notebook Jupyter contient l'implémentation de l'algorithme ID3, l'algorithme C4.3, la construction de l'arbre de décision, la construction de la matrice de confusion. - Données: Les données d'apprentissage et de prédiction pour chaque jeu de données sont stockées dans le dossier
données. Vous y trouverez les fichiers CSV nécessaires pour exécuter le code. - Environnement virtuel: Les bibliothèques à installer dans l'environnement virtuel sont expliquées dans le fichier
requirements.txt. Vous devez créer un environnement virtuel à l'aide de ce fichier pour exécuter le code.
-
Cloner le dépôt:
git clone https://github.com/votre-utilisateur/Decision_Tree.git
-
Créer et activer l'environnement virtuel:
python -m venv venv cd venv/Scripts ./activate -
Suivre les instructions dans le notebook pour exécuter le code et visualiser les résultats.
Après l'exécution du code, vous obtiendrez les arbres de décision construits pour chaque jeu de données, ainsi que les matrices de confusion pour l'évaluation de la performance de l'algorithme sur les données d'apprentissage.
This project presents an implementation of the ID3 and C4.3 algorithms for constructing decision trees, as well as their application on two different datasets: the golf dataset and the soybean dataset.
- Source Code: The source code is written in Python and is available in the
decision.ipynbfile. This Jupyter notebook contains the implementation of the ID3 algorithm, the C4.3 algorithm, the construction of the decision tree, and the creation of the confusion matrix. - Data: The training and prediction data for each dataset are stored in the
datafolder. You will find the necessary CSV files to run the code there. - Virtual Environment: The libraries to be installed in the virtual environment are explained in the
requirements.txtfile. You need to create a virtual environment using this file to run the code.
-
Clone the repository:
git clone https://github.com/your-username/Decision_Tree.git
-
Create and activate the virtual environment:
python -m venv venv cd venv/Scripts ./activate -
Follow the instructions in the notebook to run the code and visualize the results.
After running the code, you will obtain the decision trees built for each dataset, as well as the confusion matrices to evaluate the algorithm's performance on the training data.