Cours M2 CHPS - Data et apprentissage                                                             

Introduction à la science des données et au machine learning


***Enseignants
Nicolas VAYATIS
Argyris KALOGERATOS

***Contacts
<prenom.nom/-at-/ens-paris-saclay.fr>
Secrétariat du cours : <secretariat-der-maths/-at-/
ens-paris-saclay.fr>

***Syllabus et déroulé des séances
Les phénomènes physiques, biologiques, sociaux sont désormais digitalisés de manière systématique et continue dans des formats alphanumériques. Le domaine du calcul scientifique et de la simulation numérique est également consommateur et producteur de données alphanumériques. Le chercheur ou l’ingénieur, qu’il soit concepteur ou utilisateur de systèmes d’aide à la décision, se trouve confronté au champ de la science des données et son expertise se trouve mise au défi. Ainsi, la montée en compétences en science des données de tous les scientifiques et techniciens dans tout secteur d’activité humaine est désormais un des enjeux majeurs de l’économie de l’innovation et de la connaissance. Le cours constitue une introduction à la science des données qui a pour but d’initier les étudiants aux principes de base de la modélisation mathématique et statistique, et de la mise en œuvre algorithmique de chaînes de traitement des données pour l’aide à la décision. Au-delà de compétences et savoir-faire techniques, le cours questionnera également la capacité d’évaluation des modèles et le sens critique des étudiants sur un domaine de la connaissance encore en quête de maturité.


Date Horaire Salle Intervenants Session Thèmes Supports
Lundi 16 septembre
9:30-12:30 1Z25 N. Vayatis Cours #1 Introduction du cours
Principaux concepts. Motivations.
Slides
Lundi 16 septembre 14:00-17:00 2E30 A. Kalogeratos TD/TP #1
Pipeline du traitement de données
Outils et environnements logiciels

Lundi 23 septembre 9:00-12:00 1Z25 N. Vayatis Cours #2 Méthodes supervisées linéaires
Partie I
Slides
Lundi 23 septembre 13:30-16:30 2E30 A. Kalogeratos TD/TP #2
Modèles linéaires en régression.
Estimation des paramètres. Protocoles d'évaluation.

Lundi 30 septembre 9:30-12:30 1Z25 N. Vayatis Cours #3
Méthodes supervisées linéaires
Partie II
Slides
LDA tutorial
FDA tutorial
Lundi 30 septembre 13:30-16:30 2E30 A. Kalogeratos TD/TP #3
Mise en œuvre des techniques de classification.
Choix des hyperparamètres. Sensibilité et robustesse.

Lundi 7 octobre 9:30-12:30 1Z25 N. Vayatis Cours #4 Méthodes d'apprentissage non supervisées.
Réduction de dimension. Méthodes de clustering.
Slides
Lundi 7 octobre 13:30-16:30 2E30 A. Kalogeratos TD/TP #4 Apprentissage non supervisé.
Aspects algorithmiques et évaluation de la performance.

Lundi 21 octobre 9:30-12:30 1Z25 N. Vayatis Cours #5 Méthodes supervisées non-linéaires
Partie I
Slides
Lundi 21 octobre 13:30-16:30 2E30 A. Kalogeratos TD/TP #5
Application des méthodes d'ensemble
Choix des hyperparamètres. Sensibilité et robustesse.

Lundi 4 novembre 9:30-12:30 1Z25 N. Vayatis Cours #6 Méthodes supervisées non-linéaires
Partie II
Slides
Lundi 4 novembre 13:30-16:30 2E30 A. Kalogeratos TD/TP #6 Finalisation des rendus de contrôle continu


Jeudi 14 novembre
13:30-15:30
1E18
Examen
(sans documents)



***Ouvrages de reférence
Charu C. Aggarwal (2020). Linear Algebra and Optimization for Machine Learning. Springer.
Marc Peter Deisenroth, A. Aldo Faisal, and Cheng Soon Ong (2020). Mathematics for Machine Learning. Cambridge University Press. PDF (infos: <https://mml-book.github.io/>)

***Déroulement des séances
La participation en présentiel aux séances de cours et TD/TP est obligatoire. 
Les salles peuvent être amenées à changer. Merci de consulter ce site avant de rejoindre les cours.

***Evaluation
La note finale est calculée à partir des deux éléments d’évaluation suivants :

L'absence au contrôle continu est éliminatoire et il n'y a pas de rattrapage en cas d'échec.

Sujets d'examens : 2023 - 2022 - 2021