Le module Apprentissage Statistique II est un cours d’introduction à l’apprentissage supervisé par la pratique, dans un environnement python. Il s’inscrit dans la continuité du cours Apprentissage Statistique 1 et vise à rendre les étudiants autonomes pour mettre en oeuvre différents algorithmes d’apprentissage supervisé dans les environnements scikit-learn et keras / tensorflow.

Après avoir évoqué les fondements théoriques de l’apprentissage supervisé et la démarche générale à suivre pour déployer ce type d’algorithmes dans l’environnement scikit-learn, nous étudierons quelques algorithmes clés tels que les arbres de décisions, les forêts aléatoires, les machines à vecteur de support (SVM) et les méthodes pénalisées au sens large. Nous aborderons ensuite le cadre des méthodes dites de « deep learning » basées sur le formalisme des réseaux de neurones, en étudiant différentes architectures telles que les perceptrons multi-couches, les réseaux à convolution et les réseaux récurrents, que nous mettrons en oeuvre dans un environnement keras / tensorflow.

  • Cours 1 & 2: fondements théoriques et pratiques de l’apprentissage supervisé
    • Introduction à l’apprentissage supervisé - cours + TP
    • Mise en oeuvre avec scikit-learn - cours + TP
  • Cours 3 à 5: algorithmes clés
    • Arbres et forêts aléatoires - cours + TP
    • Machines à vecteurs de support (SVMs) - cours + TP
    • Lasso et méthodes pénalisées - cours + TP (en R, avec le package glmnet)
  • Cours 6 à 8: réseaux de neurones et “deep-learning”
    • Introduction au deep-learning - architectures - cours + TP
    • Introduction au deep-learning - apprentissage - cours + TP
    • Deep-learning et séquences génnomiques - cours + TP

N’hésitez pas à me contacter pour obtenir la correction des TPs.