📑 Plan de Cours

Raffiner la Donnée Brute

Découverte des formats de données structurées et non structurées.
Nettoyage : détection et correction des valeurs aberrantes (outliers) et manquantes (NaN).
Analyse statistique : détection des corrélations et problème de la multicolinéarité.
Réduction de dimension par Analyse en Composantes Principales (PCA).
Activité : Lab pratique de traitement et de préparation de données hétérogènes.

Outils Classiques de Machine Learning

Régression linéaire (simple & multiple, Lasso).
Régression logistique et application pour le scoring.
Algorithmes de classification : Arbres de décision et Random Forest.
Algorithmes avancés : Gradient Boosting et Support Vector Machines (SVM).
Activité : Défi de modélisation et comparaison de modèles prédictifs.

Segmenter et Diagnostiquer

Algorithmes de clustering : Classification hiérarchique et K-Means.
Stratégies d’évaluation : Train / Test / Validation set.
Validation croisée (cross-validation) et techniques de bootstrap.
Métriques de diagnostic : Matrice de confusion, Courbes ROC et Lift.
Activité : Segmentation de clients et diagnostic des forces/faiblesses des modèles.

Forger les Réseaux de Neurones

Historique et genèse du Deep Learning.
Architecture du Perceptron Multicouche (PMC) : couches d’entrée, cachées et de sortie.
Processus d’apprentissage : descente de gradient et algorithme de rétropropagation (backpropagation).
Réglages du réseau : fonctions d’activation (ReLU, Sigmoid, Softmax) et fonctions de coût (MSE, Cross-Entropy).
Activité : Implémentation complète d’un réseau de neurones multicouche from scratch en Python.

Lancer la Forge

Cycle de vie d’un modèle et principes fondamentaux de mise en production (APIs, serving).
Travail collaboratif en équipe sur un projet d’entraînement de bout en bout (ML/DL).
Soutenances et présentations orales des résultats et démos.
Activité : Hackathon final avec pitch projet.

🎓 Modalités d’Évaluation

Évaluation	Type	Poids	Format
Note 1 : Travaux Pratiques	Validation de compétences de code	30%	Notebook Jupyter (`.ipynb`)
Note 2 : QCM Théorique	Évaluation des concepts théoriques	20%	Questionnaire en ligne
Note 3 : Projet Final	Projet de modélisation en équipe	50%	Dépôt GitHub + README + Soutenance

Exigences de Rendu

Transparence & IA : Section obligatoire dans le README détaillant l’usage et la critique des outils d’IA générative.
Preuves d’exécution : Notebooks entièrement exécutés avec sorties et logs lisibles.
Sécurité : Zéro tolérance pour les clés d’API ou identifiants committés en clair (pénalité directe de -5 points).

--- number-sections: false --- # 📑 Plan de Cours {.unnumbered} ## Raffiner la Donnée Brute - Découverte des formats de données structurées et non structurées. - Nettoyage : détection et correction des valeurs aberrantes (*outliers*) et manquantes (*NaN*). - Analyse statistique : détection des corrélations et problème de la multicolinéarité. - Réduction de dimension par Analyse en Composantes Principales (PCA). - **Activité :** Lab pratique de traitement et de préparation de données hétérogènes. ## Outils Classiques de Machine Learning - Régression linéaire (simple & multiple, Lasso). - Régression logistique et application pour le scoring. - Algorithmes de classification : Arbres de décision et Random Forest. - Algorithmes avancés : Gradient Boosting et Support Vector Machines (SVM). - **Activité :** Défi de modélisation et comparaison de modèles prédictifs. ## Segmenter et Diagnostiquer - Algorithmes de clustering : Classification hiérarchique et K-Means. - Stratégies d'évaluation : Train / Test / Validation set. - Validation croisée (*cross-validation*) et techniques de bootstrap. - Métriques de diagnostic : Matrice de confusion, Courbes ROC et Lift. - **Activité :** Segmentation de clients et diagnostic des forces/faiblesses des modèles. ## Forger les Réseaux de Neurones - Historique et genèse du Deep Learning. - Architecture du Perceptron Multicouche (PMC) : couches d'entrée, cachées et de sortie. - Processus d'apprentissage : descente de gradient et algorithme de rétropropagation (*backpropagation*). - Réglages du réseau : fonctions d'activation (ReLU, Sigmoid, Softmax) et fonctions de coût (MSE, Cross-Entropy). - **Activité :** Implémentation complète d'un réseau de neurones multicouche *from scratch* en Python. ## Lancer la Forge - Cycle de vie d'un modèle et principes fondamentaux de mise en production (APIs, serving). - Travail collaboratif en équipe sur un projet d'entraînement de bout en bout (ML/DL). - Soutenances et présentations orales des résultats et démos. - **Activité :** Hackathon final avec pitch projet. # 🎓 Modalités d'Évaluation | Évaluation | Type | Poids | Format | | :----------------------------- | :--------------------------------- | :---- | :--------------------------------- | | **Note 1 : Travaux Pratiques** | Validation de compétences de code | 30% | Notebook Jupyter (`.ipynb`) | | **Note 2 : QCM Théorique** | Évaluation des concepts théoriques | 20% | Questionnaire en ligne | | **Note 3 : Projet Final** | Projet de modélisation en équipe | 50% | Dépôt GitHub + README + Soutenance | ## Exigences de Rendu - **Transparence & IA :** Section obligatoire dans le README détaillant l'usage et la critique des outils d'IA générative. - **Preuves d'exécution :** Notebooks entièrement exécutés avec sorties et logs lisibles. - **Sécurité :** Zéro tolérance pour les clés d'API ou identifiants committés en clair (pénalité directe de -5 points).