Apprentissage Statistique I

Le module Apprentissage Statistique I s’inscrit dans la continuité du cours Analyse de Données, et vise à donner une introduction au domaine de l’apprentissage statistique.

Après une introduction générale au domaine de de l’apprentissage statistique, nous évoquerons différents concepts et méthodes clés de l’apprentissage non-supervisé et étudierons en détail les algorithmes du clustering hiérarchique, des nuées dynamiques (k-means) et de clustering par modèles de mélange de gaussiennes. Nous aborderons ensuite le cadre de l’apprentissage supervisé au travers de l’algorithme des k plus proches voisins, des modèles probabilistes de classification (LDA, QDA et régression logistique) et terminerons par une introduction aux modèles pénalisés.

Les séances pratiques seront réalisées sous R:

Cours 1 : introduction générale au domaine de l’apprentissage statistique
- cours + TP (régressions polynomiales et ACP)
Cours 2 : apprentissage non-supervisé : concepts & méthodes clés
- cours
Cours 3 : clustering hiérarchique et mesures de similarité / disimilarité
- cours + TP (MDS, clustering hierarchique et one-class SVM)
Cours 4 : k-means & mélanges de Gaussiennes pour le clustering
- cours (+TP - devoir maison)
Cours 5 : apprentissage supervisé : concepts clés & algorithme des k-ppv
- cours + TP (courbes ROC et k-ppv)
Cours 6 : modèles probabilistes de classification
- cours + TP (LDA/QDA et régression logistique)
Cours 7 : Lasso et modèles pénalisés
- cours + TP (lasso/ridge/elasticnet et le package glmnet)

N’hésitez pas à me contacter pour obtenir la correction des TPs.