Se familiariser avec les techniques courantes de planification en intelligence artificielle et approfondir certaines d'entre elles.
Modèles couramment utilisés pour représenter les actions, les capteurs et les buts des agents intelligents afin de planifier des tâches, des comportements ou des trajectoires; algorithmes utilisés pour résoudre ces modèles; exemples d'applications.
Date | Sujets | Lectures | |
---|---|---|---|
Sem 1 5 - 6 Jan |
Introduction [PDF] | 1:1, 3:1, 4:1 | |
Présentation du plan de cours [PDF] | |||
Architecture d’un agent qui agit, apprend et planifie [PDF] |
1: 8:6 | ||
Rappel : Planification avec des processus de décision de Markov : Programmation dynamique avec
value iteration et avec policy iteration; Programmation dynamique asynchrone; Generalised Policy Iteration.
[PDF] |
1: 3, 4.1-4.6 | ||
Sem 2 12-13 Jan |
Rappel : Prédiction - Approches Monte-Carlo pour estimer la valeur des états et pour estimer
la valeur de paires états-actions (fonction Q); Approche par différence temporelle pour estimer
la valeur des états et pour estimer la valeur de paires états-actions (fonction Q);
[PDF] [PPT] |
1: 5.1-5.2 1 : 6.1-6.2 1 : 6.4 |
|
Rappel : Apprentissage parrenforcement par différence temporelle; Q-Learning; SARSA; Approximation de fonction [PDF] [PPT] | 1: 6.3 | ||
Sem 3 19-20 Jan |
Apprentissage profond par renforcement –Deep Q-Learning [PDF] [PPT] | 1: 9.7 | |
Énoncé Devoir 1 Date de remise:Jeudi 26 janvier à minuit Notebook |
|||
Sem 4 26-27 Jan |
Apprentissage par renforcement profond –Deep Policy Gradient: Reinforce et Actor-Critic [PDF] [PPT] | 1: 13.1 1 : 13.3-13.5 |
|
Apprentissage par démonstration: Imitation learning; Inverse Reinforcement Learning [PDF] [PPT] |
2 | ||
Énoncé Devoir 2 Date de remise : Jeudi 2 février à minuit Notebook |
|||
Sem 5 2-3 Fev |
Planification avec la recherche heuristique dans un espace d’états –Monte-Carlo Tree Search [PDF] [PPT] |
1:8.1 1: 8.8-8.11 |
|
Énoncé du Projet
Tutoriel ROS(installation) | Énoncé du Projet [PDF] | Choix du sujet [PDF] |
|||
Sem 6 9-10 Fev |
Planification de trajectoires avec évitement d’obstacles : Représentations géométriques et transformations ; Espace de configurations ; Détection de collisions ; Approches par décomposition exacte ; Approches par échantillonnage; Algorithme de planification avec des contraintes différentielles [PDF] [PPT] | 3 : 3-5 3 : 6.2-6.3 3 :5 13 :14 |
|
Sem 7 16-17 Fev |
Validation des sujets des projets en classe : discussion avec le prof pour valider les choix du projet. Les étudiants peuvent assister à la validation des sujets, poser des questions et faire des commentaires. | ||
Sem 8 23-24 Fev |
Examens périodiques (avec levée de cours) | ||
Sem 9 2-3 Mar |
Relâche des activités pédagogiques | ||
Sem 10 9-10 Mar |
Planification déterministe déterministe avec la recherche heuristique dans l’espace d’états et un modèle d’actions symbolique : Langage PDDL pour modéliser des actions ; | 4:2.2-2.1 5 |
|
Évaluationdu projet –Étape 1 Date de remise : Mercredi 8 mars à minuit |
|||
Sem 11 16-17 Mar |
Extraction automatique d’heuristiques à partir d’un modèle symbolique d’actions | 4:2.7 4 : 7 |
|
Planification déterministe avec la recherche heuristique dans l’espace d’états, un modèle d’actions symbolique et le contrôle de la recherche : raisonnement temporel; [HTN PDF] [HTN PPT] [LTL PDF] [LTL PPT] | |||
Sem 12 23-24 Mar |
Planification déterministe déterministe avec la recherche heuristique dans l’espace d’états, un modèle d’actions symbolique et le contrôle de la recherche: raisonnement hiéarchique; | 4:8 | |
Énoncé du devoir 3 Date de remise : Jeudi 30 mars à minuit |
|||
Sem 13 30-31 Mar |
Reconnaissance de buts, de plan, d’intention: énoncé du problème et aperçu des approches | 6 | |
Planification distribuée: énoncé du problème et aperçu des approches [PDF] [PPT] | 7 | ||
Évaluationdu projet –Étape 2 Date de remise : Mercredi 29 mars à minuit |
|||
Sem 14 6-8 Avr |
Pas de coursjeudi : temps pour travail sur le projet et préparer les présentations | ||
Vendredi Saint : Congé universitaire | |||
Sem 15 13-14 Avr |
Évaluationdu projet –Étape 3 Date de remise: Mercredi 12 avril à minuit |
||
Évaluation du sujet avancé Date de remise : Mercredi 12 avril à minuit |
|||
Examens de fin de trimestre |