Projet de Data Science & Machine Learning (2025)
Ce projet propose une analyse complète d’un jeu de données biomédical synthétique, inspiré des problématiques de recherche en oncologie (biomarqueurs, volume tumoral, évolution sous radiothérapie).
L’objectif est de prédire la rechute dans les 12 mois à partir de données biologiques et cliniques.
Ce type de pipeline est couramment utilisé en recherche biomédicale et en IA appliquée à la santé.
biolab_project/
├── data/
│ └── biolab_dataset.csv
├── notebooks/
│ └── 01_exploration_biolab.ipynb
└── src/
└── biolab/
├── config.py
├── data.py
├── features.py
├── models.py
├── train.py
├── utils.py
└── models/
└── best_model.joblib
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txtpython -m biolab.train- distributions biologiques
- heatmap
- PCA
- comparaison de modèles
Python, pandas, numpy, scikit-learn, matplotlib, seaborn, joblib
Ines Amirat — Master 2 Génie Logiciel