Skip to content

Youssef-srf/CFTR-variant-classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🧬 Analyse Bio-informatique du Gène CFTR & IA (Infertilité Masculine CBAVD)

Python Streamlit Status

📌 Contexte du Projet

Ce projet académique (Master IA - Faculté des Sciences Ben M'sik) vise à analyser les mutations du gène CFTR responsables de l'infertilité masculine connue sous le nom de CBAVD (Congenital Bilateral Absence of the Vas Deferens).

Il combine deux approches :

  1. Bio-informatique classique : Alignement de séquences (Needleman-Wunsch / Smith-Waterman) pour identifier les mutations (F508del, etc.).
  2. Intelligence Artificielle : Modèles de Machine Learning (Random Forest) pour prédire la pathogénicité des variants génétiques.

🚀 Fonctionnalités

🧬 Module Bio-informatique

  • Extraction et analyse des séquences FASTA (NCBI).
  • Alignement Global (Needleman-Wunsch) et Local (Smith-Waterman).
  • Visualisation des matrices de scores et des identités de séquences.

🧠 Module Intelligence Artificielle

  • Classification : Prédiction Pathogène / Bénin / Incertain.
  • Modèle : Random Forest entraîné sur ClinVar (Accuracy: ~67%, F1-Score: ~64%).
  • Gestion des déséquilibres : Utilisation de SMOTETomek.

💻 Interface Utilisateur (Web App)

Une application Streamlit interactive permettant de :

  1. Uploader un fichier de variants.
  2. Lancer l'analyse IA en temps réel.
  3. Visualiser les statistiques et la concordance ClinVar.

📂 Structure du Projet

PROJET_BIO-INFORMATIQUE/
│
├── src/
│   ├── bioinformatics/       # Scripts d'alignement et séquences FASTA
│   └── prediction_app/       # Application Streamlit et modèles ML (.pkl)
│
├── report/                   # Rapport final LaTeX et PDF
│   ├── main.pdf              # <--- Lire le rapport complet ici
│   └── images/               # Captures d'écran et figures
│
├── data/                     # Jeux de données (ClinVar, exemples)
└── requirements.txt          # Dépendances Python

🛠️ Installation et Lancement

1. Cloner le projet

git clone https://github.com/votre-username/projet-cftr-bioinfo.git
cd projet-cftr-bioinfo

2. Installer les dépendances

pip install -r requirements.txt

3. Lancer l'application

streamlit run src/prediction_app/app.py

👥 Auteurs

Master d'Excellence en Intelligence Artificielle (2025-2026)

  • Youssef SARRAF
  • Yassine FARIH
  • Adnane DAHBI

Encadré par : Prof. Ichrak BENAMRI


Faculté des Sciences Ben M'sik - Université Hassan II de Casablanca

About

Pipeline bio‑informatique + IA pour l’analyse des variants du gène CFTR liés au CBAVD : alignements (Needleman‑Wunsch / Smith‑Waterman), classification Pathogène/Bénin/Incertain via Random Forest (ClinVar) avec gestion du déséquilibre (SMOTETomek), et web app Streamlit pour uploader des variants et visualiser les résultats.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors