Le module Apprentissage Statistique I s’inscrit dans la continuité du cours Analyse de Données, et vise à donner une introduction au domaine de l’apprentissage statistique.

Après une introduction générale au domaine de de l’apprentissage statistique, nous évoquerons différents concepts et méthodes clés de l’apprentissage non-supervisé et étudierons en détail les algorithmes du clustering hiérarchique, des nuées dynamiques (k-means) et de clustering par modèles de mélange de gaussiennes. Nous aborderons ensuite le cadre de l’apprentissage supervisé au travers de l’algorithme des k plus proches voisins, des modèles probabilistes de classification (LDA, QDA et régression logistique) et terminerons par une introduction aux modèles pénalisés.

Les séances pratiques seront réalisées sous R:

  • Cours 1 : introduction générale au domaine de l’apprentissage statistique
    • cours + TP (régressions polynomiales et ACP)
  • Cours 2 : apprentissage non-supervisé : concepts & méthodes clés
  • Cours 3 : clustering hiérarchique et mesures de similarité / disimilarité
    • cours + TP (MDS, clustering hierarchique et one-class SVM)
  • Cours 4 : k-means & mélanges de Gaussiennes pour le clustering
    • cours (+TP - devoir maison)
  • Cours 5 : apprentissage supervisé : concepts clés & algorithme des k-ppv
    • cours + TP (courbes ROC et k-ppv)
  • Cours 6 : modèles probabilistes de classification
    • cours + TP (LDA/QDA et régression logistique)
  • Cours 7 : Lasso et modèles pénalisés

N’hésitez pas à me contacter pour obtenir la correction des TPs.