CodeAlpha Disease Prediction

🩺 As part of my CodeAlpha Machine Learning Internship, I developed a model to predict the likelihood of diseases based on patient data using classification algorithms.

📊 Project Highlights:

Predicts heart disease risk using patient health metrics.
Applied Random Forest Classifier for high accuracy.
Evaluated model with Confusion Matrix, Classification Report, ROC-AUC Score.
Visualized feature importance to interpret predictions disease risk from medical data
Used models: Logistic Regression, Random Forest, SVM
Evaluated with accuracy, precision, recall, and F1-score

🗂 Dataset:

File: heart.csv (included in repository)
Description: Contains patient health records with attributes such as age, sex, blood pressure, cholesterol levels, and more.
Target Variable: HeartDisease (1 = Disease Present, 0 = No Disease)

🧠 Methodology

Data Exploration
- Checked for missing values and data types.
- Visualized class distribution of target variable.
Data Preprocessing
- One-hot encoding for categorical variables.
- Train-test split (80% training, 20% testing).
Model Training
- Algorithm: Random Forest Classifier
- Evaluated with Accuracy, Precision, Recall, F1-score, and ROC-AUC.
Feature Importance
- Identified top predictors for heart disease risk.

🛠 Technologies:

Python
Scikit-learn
Pandas, NumPy
Matplotlib, Seaborn

📈 Results

ROC-AUC Score: 0.94
Top Features: ST_Slope_Up, MaxHR, Oldpeak, Cholesterol, Age, RestingBP, etc.

📷 Visual Outputs

Target Class Distribution

Model Performance

Confusion Matrix & Classification Report

Accuracy: 88%
Precision (Class 1): 0.90
Recall (Class 1): 0.89

Top 10 Important Features

Project completed for the CodeAlpha Machine Learning Internship

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.gitattributes		.gitattributes
Disease_Prediction_CodeAlpha.ipynb		Disease_Prediction_CodeAlpha.ipynb
README.md		README.md
class_distribution.png		class_distribution.png
feature_importance.png		feature_importance.png
heart.csv		heart.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CodeAlpha Disease Prediction

📊 Project Highlights:

🗂 Dataset:

🧠 Methodology

🛠 Technologies:

📈 Results

📷 Visual Outputs

Target Class Distribution

Model Performance

Top 10 Important Features

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

yo-rk/CodeAlpha_DiseasePrediction

Folders and files

Latest commit

History

Repository files navigation

CodeAlpha Disease Prediction

📊 Project Highlights:

🗂 Dataset:

🧠 Methodology

🛠 Technologies:

📈 Results

📷 Visual Outputs

Target Class Distribution

Model Performance

Top 10 Important Features

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages