Cours M2 CHPS - Data et apprentissage                                                               Année 2023/2024

Introduction à la science des données et au machine learning


***Enseignants
Nicolas VAYATIS
Argyris KALOGERATOS

***Contacts
<prenom.nom/-at-/ens-paris-saclay.fr>
Secrétariat du cours : <secretariat-der-maths/-at-/
ens-paris-saclay.fr>

***Syllabus et déroulé des séances 2023-2024
Les phénomènes physiques, biologiques, sociaux sont désormais digitalisés de manière systématique et continue dans des formats alphanumériques. Le domaine du calcul scientifique et de la simulation numérique est également consommateur et producteur de données alphanumériques. Le chercheur ou l’ingénieur, qu’il soit concepteur ou utilisateur de systèmes d’aide à la décision, se trouve confronté au champ de la science des données et son expertise se trouve mise au défi. Ainsi, la montée en compétences en science des données de tous les scientifiques et techniciens dans tout secteur d’activité humaine est désormais un des enjeux majeurs de l’économie de l’innovation et de la connaissance. Le cours constitue une introduction à la science des données qui a pour but d’initier les étudiants aux principes de base de la modélisation mathématique et statistique, et de la mise en œuvre algorithmique de chaînes de traitement des données pour l’aide à la décision. Au-delà de compétences et savoir-faire techniques, le cours questionnera également la capacité d’évaluation des modèles et le sens critique des étudiants sur un domaine de la connaissance encore en quête de maturité.


Date Horaire Salle Intervenants Session Thèmes Supports
Lundi 18 septembre
9:30-12:30 1Z34 N. Vayatis Cours #1 Introduction du cours
Principaux concepts. Motivations.
Slides
Lundi 18 septembre 13:30-16:30 2E30 A. Kalogeratos TD/TP #1
Pipeline du traitement de données
Outils et environnements logiciels

Lundi 25 septembre 9:30-12:30 1Z34 N. Vayatis Cours #2 Méthodes supervisées linéaires
Partie I
Slides
Lundi 25 septembre 13:30-16:30 2E30 A. Kalogeratos TD/TP #2
Modèles linéaires en régression.
Estimation des paramètres. Protocoles d'évaluation.

Lundi 2 octobre 9:30-12:30 1Z34 N. Vayatis Cours #3
Méthodes supervisées linéaires
Partie II
Slides
LDA tutorial
FDA tutorial
Lundi 2 octobre 13:30-16:30 2E30 A. Kalogeratos TD/TP #3
Mise en œuvre des techniques de classification.
Choix des hyperparamètres. Sensibilité et robustesse.

Lundi 9 octobre 9:30-12:30 1Z34 N. Vayatis Cours #4 Méthodes d'apprentissage non supervisées.
Réduction de dimension. Méthodes de clustering.
Slides
Lundi 9 octobre 13:30-16:30 2E30 A. Kalogeratos TD/TP #4 Apprentissage non supervisé.
Aspects algorithmiques et évaluation de la performance.

Lundi 16 octobre 9:30-12:30 1Z34 N. Vayatis Cours #5 Méthodes supervisées non-linéaires
Partie I
Slides
Lundi 16 octobre 13:30-16:30 2E30 A. Kalogeratos TD/TP #5
Application des méthodes d'ensemble
Choix des hyperparamètres. Sensibilité et robustesse.

Lundi 23 octobre 9:30-12:30 1Z34 N. Vayatis Cours #6 Méthodes supervisées non-linéaires
Partie II
Slides
Lundi 23 octobre 13:30-16:30 2E30 A. Kalogeratos TD/TP #6 Finalisation des rendus de contrôle continu


Lundi 13 Novembre
10:30-12:30
1I82
Examen
(sans documents)



***Ouvrages de reférence
Charu C. Aggarwal (2020). Linear Algebra and Optimization for Machine Learning. Springer.
Marc Peter Deisenroth, A. Aldo Faisal, and Cheng Soon Ong (2020). Mathematics for Machine Learning. Cambridge University Press. PDF (infos: <https://mml-book.github.io/>)

***Déroulement des séances
La participation en présentiel aux séances de cours et TD/TP est obligatoire. 
Les salles peuvent être amenées à changer. Merci de consulter ce site avant de rejoindre les cours.

***Evaluation
La note finale est calculée à partir des deux éléments d’évaluation suivants :

L'absence au contrôle continu est éliminatoire et il n'y a pas de rattrapage en cas d'échec.

Sujets d'examens : 2022 - 2021