Machine Learning et Applications

Pierre Alquier (PA), Jean-Yves Audibert (JYA), Guillaume Lecué (GL)

Objectifs du cours

L'apprentissage (« machine learning » en anglais) a pour objectif l’optimisation, le contrôle et la modélisation de systèmes complexes à partir d’exemples. Son essor récent (début des années 80) est dû à sa réussite dans le traitement des données scientifiques (bioinformatique, astronomie, physique des particules, ...), l'ingénierie (optimisation de procédés industriels, robotique, systèmes complexes, ...), et les services (systèmes d'information, assurance, finance, web sémantique, ...).

Formellement, l'apprentissage recouvre plusieurs objets d'études mathématiques, statistiques et algorithmiques, parmi lesquels
• Théories de l'apprentissage (surapprentissage et généralisation, complexité des modèles et des échantillons, régularisation)
• Représentation et structuration des espaces de recherche (analyse fonctionnelle, noyaux)
• Recherche de solutions (problèmes combinatoires et optimisation convexe)
• Validation (sélection de modèles, estimation robuste des performances, validation croisée)

Ce cours vise à faire découvrir l'apprentissage à travers ses applications et les concepts mentionnés ci-dessus. Ce module permettra aux étudiants de mieux extraire et utiliser l'information présente dans les bases de données qu'ils rencontreront inévitablement dans leur vie professionnelle. A son issue, les étudiants seront capables d'identifier les problèmes de prédiction relevant de l'apprentissage statistique et de mettre en œuvre les algorithmes présentés en cours.

Séances

04/03 - 08h30 - 12h00: cours (JYA)
  • Exemples de problèmes d'apprentissage supervisé
  • prédicteurs cibles
  • liens entre la classification binaire et la régression aux moindres carrés
  • consistance universelle
  • feuille d'exos 1, corrigé
    11/03 - 08h30 - 12h00: cours (JYA)
  • Méthodes par moyennage local
  • Théorème de Stone
  • k-plus proches voisins
  • validation croisée
  • estimateur de Nadaraya-Watson
  • Algorithmes par partition
  • feuille d'exos 2, corrigé
    18/03 - 08h30 - 12h00: cours (JYA)
  • Méthodes par minimisation du risque empirique
  • Réseaux de neurones
  • Arbres de décision
  • Convexification en classification binaire
  • 25/03 - 08h30 - 12h00: cours (GL)
  • Les inégalités de concentration (Hoeffding, Bernstein, McDiarmid, borne de l'union)
  • Les différentes mesures de complexités (entropie,nombre de Rademacher,dimension de Vapnik-Cervonenkis)
  • 01/04 - 08h30 - 12h00: cours + TD (JYA)
  • Méthodes par moyennage local (sujet, corrigé)
  • 15/04 - 08h30 - 12h00: cours (GL)
  • Méthodes d'aggrégation
  • 29/04 - 08h30 - 12h00: cours (PA)
  • Méthodes favorisant la parcimonie
  • 06/05 - 08h30 - 12h00: cours (GL)
  • Méthodes par pénalisation, Support Vector Machines
  • 20/05 - 08h30 - 12h00: cours (JYA)
  • Apprentissage en ligne et bandits à plusieurs bras (1/2)
  • feuille d'exos 3, corrigé
    27/05 - 08h30 - 12h00: cours + TD (JYA)
  • Apprentissage en ligne et bandits à plusieurs bras (2/2) (sujet,code)
  • feuille d'exos 4, corrigé
    03/06 - 08h30 - 12h00: cours (PA)
  • Ranking (courbe ROC, AUC, précision/rappel)
  • 10/06 - 08h30 - 12h00: cours + TD (PA)
    17/06 - 09h00 - 12h00: Examen (JYA) Corrigé de l'examen

    Modalités d'évaluation

  • 70% examen final
  • 30% TDs (compte-rendus par binôme à rendre à la fin des TDs) et exercices rendus (sur l'ensemble du cours, il faut rendre les solutions d'au moins 3 feuilles d'exercices)
  • Bibliographie

    Le livre de référence le plus simple est

    L. Devroye, L. Gyorfi et G. Lugosi, A Probabilistic Theory of Pattern
    Recognition, Springer-Verlag,
    1996.

    Le cours s'appuie beaucoup sur

    L. Gyorfi, M. Kohler, A. Krzyzak et H. Walk, A Distribution-Free Theory of
    Nonparametric Regression,
    Springer, 2004

    et

    S. Boucheron, O. Bousquet et G. Lugosi, Theory of classification: some
    recent advances,
    ESAIM Probability & Statistics, 9, 323-375, 2005.
    http://www.econ.upf.es/~lugosi/esaimsurvey.pdf

    Un livre classique du domaine est

    V. Vapnik, The nature of statistical learning theory, 2nd ed.,
    Springer-Verlag, 1995.