Le module Apprentissage Statistique I s’inscrit dans la continuité du cours Analyse de Données, et vise à donner une introduction au domaine de l’apprentissage statistique.
Après une introduction générale au domaine de de l’apprentissage statistique, nous évoquerons différents concepts et méthodes clés de l’apprentissage non-supervisé et étudierons en détail les algorithmes du clustering hiérarchique, des nuées dynamiques (k-means) et de clustering par modèles de mélange de gaussiennes. Nous aborderons ensuite le cadre de l’apprentissage supervisé au travers de l’algorithme des k plus proches voisins, des modèles probabilistes de classification (LDA, QDA et régression logistique) et terminerons par une introduction aux modèles pénalisés.
Les séances pratiques seront réalisées sous R:
- Cours 1 : introduction générale au domaine de l’apprentissage statistique
- Cours 2 : apprentissage non-supervisé : concepts & méthodes clés
- Cours 3 : clustering hiérarchique et mesures de similarité / disimilarité
- Cours 4 : k-means & mélanges de Gaussiennes pour le clustering
- cours (+TP - devoir maison)
- Cours 5 : apprentissage supervisé : concepts clés & algorithme des k-ppv
- Cours 6 : modèles probabilistes de classification
- Cours 7 : Lasso et modèles pénalisés
N’hésitez pas à me contacter pour obtenir la correction des TPs.