Autonomisation de modèles pour Autonomisation de modèles pour
les simulations participatives les simulations participatives
Pierre De Loor
Pierre De Loor
LISyC-EA3883
LISyC-EA3883
deloor@enib.fr
deloor@enib.fr
Simulation participative Simulation participative
L’homme dans la boucle L’homme dans la boucle
– Faire l’expérience de la simulation Faire l’expérience de la simulation – Se construire une signification Se construire une signification
utilisateur modèle
signification
Simulation participative Simulation participative
L’homme dans la boucle L’homme dans la boucle
– Faire l’expérience de la simulation Faire l’expérience de la simulation – Se construire une signification Se construire une signification
– Se subsituer Se subsituer
Autonomie Autonomie
modèle modèle
La réalité nous résiste car elle est autonome [Tisseau01]
La réalité nous résiste car elle est autonome [Tisseau01]
Allers et retours de la 3
èmeà la 1
èrepersonne
Analytique - Phénoménologique Analytique - Phénoménologique
entrées
fonctions Sans interaction :
sorties
causalités Avec interactions :
interactions
Simulation analytique Simulation phénoménologique
3
èmepersonne 1
èrepersonne
Analogies Analogies
Calcul de trajectoires Calcul de trajectoires [Meyer 2002]
[Meyer 2002]
Résolution analytique Résolution analytique [Lucas 1883]
[Lucas 1883]
EAO EAO [Dessalles 1990]
[Dessalles 1990]
Agents autonomes situés Agents autonomes situés [Drogoul 2000]
[Drogoul 2000]
Contraintes dynamiques Contraintes dynamiques [Verfaillie 2005]
[Verfaillie 2005]
EVF EVF
[Querrec 2002]
[Querrec 2002]
Résolution de problèmes Simulation comportementale
Apprentissage
Analogies Analogies
Sciences cognitives Sciences cognitives
Evaluation d’IHM Evaluation d’IHM
Cognitivisme Cognitivisme Philosophie analytique Philosophie analytique [Pylyshyn 1984]
[Pylyshyn 1984]
Enactionnisme Enactionnisme Phénoménologie Phénoménologie [Varela 1993]
[Varela 1993]
Méthodes analytiques Méthodes analytiques [Card 1983]
[Card 1983] Approche écologique Approche écologique [Morineau 2002]
[Morineau 2002]
Résistance versus crédibilité Résistance versus crédibilité
comportements aléatoires
comportements crédibles comportement sans autonomie
utilisateur ou modèle
sens ? non
sens
Représentation des perceptions …
Représentation des perceptions : autonomie Représentation des perceptions : autonomie
versus richesse comportementale versus richesse comportementale
Pragmatisme Pragmatisme
Aides conceptuelles Aides conceptuelles
Abstractions Abstractions Métaphores Métaphores
Apprentissages Apprentissages richesse comportementale
Autonomie/environnement
Plan Plan
Prolégomène Prolégomène
Une abstraction : l’intention Une abstraction : l’intention
Une métaphore : le stress Une métaphore : le stress
Un apprentissage Un apprentissage
La simulation d’interactions situées La simulation d’interactions situées
Perspectives
Perspectives
Une abstraction pour les agents Une abstraction pour les agents
situés : l’intention situés : l’intention
Objectif Objectif
« « exploiter la notion d’intention pour autonomiser et prototyper des agents situés en Réalité exploiter la notion d’intention pour autonomiser et prototyper des agents situés en Réalité Virtuelle
Virtuelle » »
Cadre : intention dans l’action
Cadre : intention dans l’action [Berthoz 1997] [Berthoz 1997]
Apport : intention réactive Apport : intention réactive
– Anticipation (réactive) de l’effet des actions Anticipation (réactive) de l’effet des actions
– Désynchronisation entre perception et prise de décision Désynchronisation entre perception et prise de décision
Agents situés [Gareau 1997, Drogoul 2000, Querrec 2002]
Agents situés [Gareau 1997, Drogoul 2000, Querrec 2002]
Réactifs [Brooks 1990, Maës 1990]
Réactifs [Brooks 1990, Maës 1990]
Délibératifs [Fikes 1971, Tate 1977, Firby 1987, Georgeff 1989, Délibératifs [Fikes 1971, Tate 1977, Firby 1987, Georgeff 1989, Wooldridge 2000]
Wooldridge 2000]
Hybrides [Schmidt 2000, Sloman 2002, Acquisti 2003]
Hybrides [Schmidt 2000, Sloman 2002, Acquisti 2003]
Modèle hybride : Choix délibératif d’intentions
Sélection réactive d’action
Les actions des agents Les actions des agents
intentionnels intentionnels
savoir-faire savoir
action
Tendances qualitatives sur propriétés internes Construction
d’une extériorité Anticipation
Désynchronisation Intention
dans l’action
Exemples d’intentions : augmenter ma vitesse, diminuer mon altitude environnement
Perception
propriétés
tendances, propriétés, forces
génération délibérative
propriétés
La sélection d’action des agents La sélection d’action des agents
intentionnels intentionnels
règles comportementales
modification
perception sélection
réactive d’une action
Anticipation
Désynchronisation
méthode (savoir-faire)
tendances, propriétés (savoir)
ac tio n
Architecture Architecture
SWI-Prolog
C++
propriétés
consultations asynchrones flux d’informations
inférences
intentions
Thread
intentions intentions
propriétés ?
décision actions
perceptions
Choix ?
Intentions ?
activité
ARéVi activité
ARéVi
activité
ARéVi
Bilan sur les agents intentionnels Bilan sur les agents intentionnels
Architecture et Architecture et
outil de outil de
prototypage prototypage
Prolog/ARéVi/C++
Prolog/ARéVi/C++
Caméra virtuelle Caméra virtuelle
autonome autonome
Animats Animats
Autonomie/
environnement Richesse comportementale
Abstraction pour l’autonomie
– Représentation des perceptions
tendances sur propriétés
– Substitution
désynchronisation
modification de l’anticipation en-ligne
Une métaphore pour la résolution Une métaphore pour la résolution distribuée de problèmes : le stress distribuée de problèmes : le stress
Objectif Objectif
« Exploiter la notion de stress pour simuler la résolution de problèmes
« Exploiter la notion de stress pour simuler la résolution de problèmes collectifs dynamiques »
collectifs dynamiques »
Cadre Cadre
– recuit simulé, déplacement, éco-résolution, satisfaction/altruisme recuit simulé, déplacement, éco-résolution, satisfaction/altruisme
Apports Apports
– Heuristique de résolution adaptative Heuristique de résolution adaptative – Aide à la collaboration Aide à la collaboration
méta-heuristiques [Holland 1992, Kirkparick 1998, Blum 2003 ] méta-heuristiques [Holland 1992, Kirkparick 1998, Blum 2003 ] CSP [Verfaillie 2005,] CSP [Verfaillie 2005,]
Agents [Drogoul 1991, Guedira 1994, Gleizes 1999, Agents [Drogoul 1991, Guedira 1994, Gleizes 1999, Simonin 2003] Simonin 2003]
Les agents stressés Les agents stressés
requêtes refus
stress
Buts personnels Buts collectifs
annulation
propositions
propositions
gêneur
perception
L’heuristique de la crise en L’heuristique de la crise en
cascade cascade
temps
annulation
Bilan sur les agents stressés Bilan sur les agents stressés
– Groupe ASA du GDR Groupe ASA du GDR I3 I3
– A l’origine du logiciel A l’origine du logiciel de calcul des EDT de de calcul des EDT de l’enib
l’enib
– Création d’une Création d’une startup
startup
Richesse comportementale
Autonomie/
environnement
Application à la résolution d’emplois du temps
Application à la résolution d’emplois du temps Métaphore pour l’autonomie
– Représentation des perceptions
stress messages
– Substitution
échanges asynchrones
modification des contraintes en-ligne
Objectif Objectif
« Élaborer un tuteur, s’adaptant à des couples « apprenant-
« Élaborer un tuteur, s’adaptant à des couples « apprenant- formateur » »
formateur » »
Cadre : Cadre :
– Environnements virtuels de formation [Querrec 2002] Environnements virtuels de formation [Querrec 2002]
– Apprentissage artificiel par renforcement [Sutton 1988] Apprentissage artificiel par renforcement [Sutton 1988]
Apports : Apports :
– Situation pédagogique Situation pédagogique
– Structuration d’un système de classeurs Structuration d’un système de classeurs
Un apprentissage : le tuteur Un apprentissage : le tuteur
adaptatif adaptatif
Tuteur artificiel [Balacheff 1998, Rickel 1999, Tchounikine 2004]
Tuteur artificiel [Balacheff 1998, Rickel 1999, Tchounikine 2004]
Apprentissage artificiel [Mitchell 1997, Cornuejol 2001]
Apprentissage artificiel [Mitchell 1997, Cornuejol 2001]
Environnement virtuel de formation Environnement virtuel de formation
Environnement Virtuel de Formation (V.E.T)
Réalité Virtuelle Tuteur artificiel (I.T.S)
Élève (apprenant)
analyse
intervention pédagogique
interactions
L’utilisateur de la boucle
est le formateur
Adaptation de l’ITS Adaptation de l’ITS
formateur Réalité
Virtuelle
propositions décision
Générateur d’assistance pédagogique Tuteur artificiel
domaine interface
erreur apprenant
Situation Pédagogique
Abstraction Métaphore renforcement
Apprentissage
Apprentissage
perception
Adaptation des systèmes de Adaptation des systèmes de
classeurs classeurs
État de l’
environnement
environnement
Liste de règles Algorithmes génétiques
appariement sélection
action rétribution
renforcement
Choix formateur
Décisions pédagogiques Hiérarchie de règles :
-Démarches -Attitudes -Techniques
Orientations pédagogiques
Association de règles
Concepts pédagogiques
Situation pédagogique
Réalité Virtuelle
Bilan sur le tuteur adaptatif Bilan sur le tuteur adaptatif
– Application Application d’échelle d’échelle
industrielle industrielle
– Collaboration Collaboration avec l’équipe avec l’équipe SARA du CERV SARA du CERV
Richesse comportementale
Autonomie/
environnement
Apprentissage pour l’autonomie
– Représentation des perceptions
Situation pédagogique
– Substitution
Adaptation en-ligne
Une synthèse : la simulation Une synthèse : la simulation
participative d’interactions participative d’interactions
Objectif Objectif
« Simuler le comportement d’un utilisateur de système interactif pour évaluer
« Simuler le comportement d’un utilisateur de système interactif pour évaluer son utilisabilité»
son utilisabilité»
Cadre : Cadre :
– Approche globale « écologique » [Morineau 2002] Approche globale « écologique » [Morineau 2002]
– « Faillible Machine » [Reason 1990] « Faillible Machine » [Reason 1990]
Apports : Apports :
– Intégration de trois modèles Intégration de trois modèles
– Modèle d’utilisateur : erreurs et confusions Modèle d’utilisateur : erreurs et confusions
Analytique : [Card 1983, Kieras 1994, John 2002]
Analytique : [Card 1983, Kieras 1994, John 2002]
Simulation : [Newell 1990, Anderson 1993, Kieras 1997]
Simulation : [Newell 1990, Anderson 1993, Kieras 1997]
action sortie
perception
Environnement
Dynamique Perturbation modale
Utilisateur
Sensitif Cognitif
Système multimodal
Fonctions Interactions
Scénario
Approche globale Approche globale
perturbations sensorielles
perturbations sensorielles fonctionnalités d’usage fonctionnalités d’usage
Abstractions
Modèle de l’utilisateur Modèle de l’utilisateur
Scénario
Environnement
Modalités possibles
Contexte personnel
Actions/rendez-vous but
Modalités d’action Modalités de sortie
interruption
Système multimodal
Modèle
Connexionniste de perception
Modèle Cognitiviste
de décision
Abstraction
Apprentissage
Bilan sur la simulation participative Bilan sur la simulation participative
d’interaction d’interaction
Outil SIHMM Outil SIHMM
Collaborations Collaborations
France-Télécom France-Télécom
Equipe SARA du Equipe SARA du
CERV CERV Richesse comportementale
Autonomie/
environnement
Utilisateur virtuel autonome
– Représentation des perceptions
Contexte personnel
Interactions avec le système
– Substitution
Modification en-ligne du modèle
connexionniste
Réflexion Réflexion
Autonomie/
environnement richesse comportementale
tuteur adaptatif
utilisateur virtuel
agents stressés
agents intentionnels
Modèle de l’environnement Construction d’une extériorité réactif
cognitif
Contexte
Enaction
Exploitation de la notion de Exploitation de la notion de
contexte contexte
Conditions significatives faisant qu’une situation est Conditions significatives faisant qu’une situation est
identifiable
identifiable [Pomerol 2001] [Pomerol 2001]
Offrir un point de vue particulier de l’environnement Offrir un point de vue particulier de l’environnement
la « propre représentation » du modèle la « propre représentation » du modèle Situations dynamiques collaboratives Situations dynamiques collaboratives
Explications Explications
Thèse de Romain Bénard
Thèse de Romain Bénard [Benard 2007] [Benard 2007]
Collaboration équipe SARA : Thèse de Cyril Bossard
Collaboration équipe SARA : Thèse de Cyril Bossard
Déformation
L’Enaction : un paradigme pour L’Enaction : un paradigme pour
l’autonomisation l’autonomisation
Autonomie sans représentation Autonomie sans représentation Métaphore conceptuelle
Métaphore conceptuelle
Autopoièse
Environnement
Histoire
Cognition [Varela 1989]
Interaction
Couplage
L’énaction : un paradigme pour L’énaction : un paradigme pour
l’autonomisation l’autonomisation
Questions ouvertes Questions ouvertes
? Autopoièse artificielle ou couplage Autopoièse artificielle ou couplage
? Domaine phénoménal Domaine phénoménal
? Domaine cognitif Domaine cognitif
? Statut de l’utilisateur Statut de l’utilisateur
– Expérimentations Expérimentations
– Positionnement théorique Positionnement théorique
– Thèse de Kristen Manac’h Thèse de Kristen Manac’h [Manac’h 2009] [Manac’h 2009]
Deux courants importants Deux courants importants
L’autonomisation grâce aux L’autonomisation grâce aux
systèmes de classeurs : héritage de systèmes de classeurs : héritage de
l’apprentissage artificiel l’apprentissage artificiel
L’Approche dynamique de la L’Approche dynamique de la
cognition : héritage de la biologie
cognition : héritage de la biologie
Introduction aux systèmes de Introduction aux systèmes de
classeurs classeurs
Un exemple d’apprentissage Un exemple d’apprentissage
artificiel
artificiel
Une définition Une définition
Un programme apprend une tache (T) Un programme apprend une tache (T)
à partir d ’expériences (E) si les à partir d ’expériences (E) si les performances (P) pour effectuer T performances (P) pour effectuer T
s ’améliorent avec E. (Mitchell97)
s ’améliorent avec E. (Mitchell97)
Une courbe Une courbe
Nb expériences
Performance
Un exemple Un exemple
+
- +
+
-
Une reconnaissance Une reconnaissance
+
-
+
Une généralisation Une généralisation
+
- +
+
-
?
? ?
Les cadres carrés sont positifs ?
Un problème Un problème
+
- +
+
- +
-
Non : les cadres carrés ne sont pas tous positifs
+
Une autre courbe : Une autre courbe :
généralisation/reconnaissance généralisation/reconnaissance
Nb expériences
Performance reconnaissance
(d’un unique échantillon)
généralisation
(un autre échantillon sert de test)
Des apprentissages artificiels Des apprentissages artificiels
Mise en œuvre de techniques pour améliorer la Mise en œuvre de techniques pour améliorer la
reconnaissance et/ou la généralisation reconnaissance et/ou la généralisation
Diffèrent en fonction de plusieurs critères : Diffèrent en fonction de plusieurs critères :
– Nature des concepts à apprendre (symboles discrets, Nature des concepts à apprendre (symboles discrets, valeurs continues, bruit)
valeurs continues, bruit)
va influencer la nature du modèle appris va influencer la nature du modèle appris
– Accès des entrées (paquet d’exemples, flux, correction Accès des entrées (paquet d’exemples, flux, correction d’hypothèses, interaction)
d’hypothèses, interaction)
va influencer le protocole d’apprentissage
va influencer le protocole d’apprentissage
Métaphores / Algorithmes Métaphores / Algorithmes
Inspirés des Sciences Cognitives et de la Inspirés des Sciences Cognitives et de la
psychologie psychologie
Apprentissage par renforcement Apprentissage par renforcement
Induction et abduction logique, floue … Induction et abduction logique, floue … Réseaux de neurones artificiels
Réseaux de neurones artificiels
Inspirés de la biologie Inspirés de la biologie
Évolution simulée Évolution simulée
Approche dynamique Approche dynamique
Inspiré des probabilités Inspiré des probabilités
Réseaux baysiens Réseaux baysiens
Mixages de techniques
Mixages de techniques
Familles d’accès Familles d’accès
Supervisé : liste d’exemples analysés d’un Supervisé : liste d’exemples analysés d’un coup coup
Non supervisé : exemples donnés Non supervisé : exemples donnés
progressivement, classification faite en progressivement, classification faite en
ligne ligne
Renforcé : pas d’exemple, juste des Renforcé : pas d’exemple, juste des
récompenses et/ou des punitions
récompenses et/ou des punitions
Perception-Décision-Action- Perception-Décision-Action-
Apprentissage Apprentissage
environnement
P.D.A
apprentissage
e s
• Apprentissage d’un triplet P.D.A
• Les métaphores psychologiques et des
sciences cognitives sont prépondérantes
Problème de l’agent situé Problème de l’agent situé
Localité de la perception Localité de la perception
Dynamisme de l’environnement Dynamisme de l’environnement
Or, il nous faut une représentation de Or, il nous faut une représentation de
l’environnement
l’environnement
Historique Historique
Conditionnement pavlovien Conditionnement pavlovien
stimulus neutre
stimulus inconditionnel
association
Historique Historique
Skinner : conditionnement opérant Skinner : conditionnement opérant
– Actions de l’animal Actions de l’animal
Contingence
à 2 termes
Contingence
à 3 termes
Historique Historique
Tolman et Honzic Tolman et Honzic
1
2
3 B
A
Pas d’obstruction : apprend 1
Puis : bloc A : utilise 2 Ou
bloc B :
utilise 3 sans passer par 2
Système de classeurs Système de classeurs
1010 01
capteurs
environnement
#010:01 28
#0##:11 12 101#:01 42
#0#0:11 11 01#1:10 12 10#1:00 25 AG
M (Match set)
#010:01 28
#0##:11 12 101#:01 42
#0#0:11 11
#010:01 28 101#:01 42
A (Action set)
A
renforcement interne
effecteurs
rétribution éventuelle
roulette
état action
récompense attendue
5/12/2006
5/12/2006 Autonomisation de modèles P. De LoorAutonomisation de modèles P. De Loor 5050
Renforcement des ZCS : Algorithm Renforcement des ZCS : Algorithm
« Bucket Brigade »
« Bucket Brigade »
#010:01 28 101#:01 42 A
A -1
rétribution éventuelle
#010:01 25.2 101#:01 37.8
A
sceau B
2.8+4.2=7
##10:11 5 11##:11 8
#11#:11 9
A -1 ##10:11 5.7 11##:11 9
#11#:11 10
Prélèvement d ’un pourcentage br (taxe) (exemple 10%) taux d ’apprentissage
#010:01 27.2 101#:01 39.8
A
renforcement interne taux de remise
environnement
ZCS ZCS
– privilégie les règles rapportant plus privilégie les règles rapportant plus
– élimine les autres élimine les autres (oubli = surprise = « covering » = pif) (oubli = surprise = « covering » = pif)
– quelle que soit leur « précision » quelle que soit leur « précision »
– n ’apprend que des environnements n ’apprend que des environnements markovien
markovien
Perception états
Environnement non markovien : Environnement non markovien :
renforcer l ’historique : ZCSM renforcer l ’historique : ZCSM
Codage d ’une règle Codage d ’une règle
#0101, 01# : 10, #1#
identification capteurs
identification état interne
action
modification état interne
Système de classeur « intelligent »
=>Système de classeur pour la sélection d’action
Système de classeur « intelligent »
Système de classeur « intelligent »
=>Système de classeur pour la sélection d’action [Robert02]
Système de classeur « intelligent »
Système de classeur « intelligent »
=>Système de classeur pour la sélection d’action [Sanza00]
NeVis(Networked Virtual Soccer)
Condition->montrer
Active Exposive
Niveau 1 : Démarches pédagogiques
Réaliser Montrer
Niveau 2 : Attitudes pédagogiques
Simplification Modification
Niveau 3 : Techniques pédagogiques
Choix du formateur : Changer-Texture x
Condition->réaliser Condition->réaliser
Condition->montrer Condition->réaliser Condition->réaliser
Condition->Modification Condition->Simplification Condition->Simplification
Condition->Simplification Condition->Modification
Condition->Rendre-Transparent y Condition->Rendre-Transparent y Condition->Changer-Texture x Condition->Rendre-Transparent y
appariement
Condition->Rendre-Transparent z
Situation pédagogique
Assistance
Rendre-Transparent y : poids = 1+4+4=91 1
1+1+1 1
1 1+3