Autonomisation de modèles pour Autonomisation de modèles pour les simulations participatives les simulations participatives

(1)

Autonomisation de modèles pour Autonomisation de modèles pour

les simulations participatives les simulations participatives

Pierre De Loor

LISyC-EA3883

deloor@enib.fr

(2)

Simulation participative Simulation participative

L’homme dans la boucle L’homme dans la boucle

– Faire l’expérience de la simulation Faire l’expérience de la simulation – Se construire une signification Se construire une signification

utilisateur modèle

signification

(3)

Simulation participative Simulation participative

L’homme dans la boucle L’homme dans la boucle

– Faire l’expérience de la simulation Faire l’expérience de la simulation – Se construire une signification Se construire une signification

– Se subsituer Se subsituer

Autonomie Autonomie

modèle modèle

La réalité nous résiste car elle est autonome [Tisseau01]

Allers et retours de la 3

^ème

à la 1

^ère

personne

(4)

Analytique - Phénoménologique Analytique - Phénoménologique

entrées

fonctions Sans interaction :

sorties

causalités Avec interactions :

interactions

Simulation analytique Simulation phénoménologique

3

^ème

personne 1

^ère

personne

(5)

Analogies Analogies

Calcul de trajectoires Calcul de trajectoires [Meyer 2002]

[Meyer 2002]

Résolution analytique Résolution analytique [Lucas 1883]

[Lucas 1883]

EAO EAO [Dessalles 1990]

[Dessalles 1990]

Agents autonomes situés Agents autonomes situés [Drogoul 2000]

[Drogoul 2000]

Contraintes dynamiques Contraintes dynamiques [Verfaillie 2005]

[Verfaillie 2005]

EVF EVF

[Querrec 2002]

Résolution de problèmes Simulation comportementale

Apprentissage

(6)

Analogies Analogies

Sciences cognitives Sciences cognitives

Evaluation d’IHM Evaluation d’IHM

Cognitivisme Cognitivisme Philosophie analytique Philosophie analytique [Pylyshyn 1984]

[Pylyshyn 1984]

Enactionnisme Enactionnisme Phénoménologie Phénoménologie [Varela 1993]

[Varela 1993]

Méthodes analytiques Méthodes analytiques [Card 1983]

[Card 1983] Approche écologique Approche écologique [Morineau 2002]

[Morineau 2002]

(7)

Résistance versus crédibilité Résistance versus crédibilité

comportements aléatoires

comportements crédibles comportement sans autonomie

utilisateur ou modèle

sens ? non

sens

Représentation des perceptions …

(8)

Représentation des perceptions : autonomie Représentation des perceptions : autonomie

versus richesse comportementale versus richesse comportementale

Pragmatisme Pragmatisme

Aides conceptuelles Aides conceptuelles

Abstractions Abstractions Métaphores Métaphores

Apprentissages Apprentissages richesse comportementale

Autonomie/environnement

(9)

Plan Plan

Prolégomène Prolégomène

Une abstraction : l’intention Une abstraction : l’intention

Une métaphore : le stress Une métaphore : le stress

Un apprentissage Un apprentissage

La simulation d’interactions situées La simulation d’interactions situées

Perspectives

(10)

Une abstraction pour les agents Une abstraction pour les agents

situés : l’intention situés : l’intention

Objectif Objectif

« « exploiter la notion d’intention pour autonomiser et prototyper des agents situés en Réalité exploiter la notion d’intention pour autonomiser et prototyper des agents situés en Réalité Virtuelle

Virtuelle » »

Cadre : intention dans l’action

Cadre : intention dans l’action [Berthoz 1997] [Berthoz 1997]

Apport : intention réactive Apport : intention réactive

– Anticipation (réactive) de l’effet des actions Anticipation (réactive) de l’effet des actions

– Désynchronisation entre perception et prise de décision Désynchronisation entre perception et prise de décision

Agents situés [Gareau 1997, Drogoul 2000, Querrec 2002]

Réactifs [Brooks 1990, Maës 1990]

Délibératifs [Fikes 1971, Tate 1977, Firby 1987, Georgeff 1989, Délibératifs [Fikes 1971, Tate 1977, Firby 1987, Georgeff 1989, Wooldridge 2000]

Wooldridge 2000]

Hybrides [Schmidt 2000, Sloman 2002, Acquisti 2003]

(11)

Modèle hybride : Choix délibératif d’intentions

Sélection réactive d’action

Les actions des agents Les actions des agents

intentionnels intentionnels

savoir-faire savoir

action

Tendances qualitatives sur propriétés internes Construction

d’une extériorité Anticipation

Désynchronisation Intention

dans l’action

Exemples d’intentions : augmenter ma vitesse, diminuer mon altitude environnement

Perception

propriétés

(12)

tendances, propriétés, forces

génération délibérative

propriétés

La sélection d’action des agents La sélection d’action des agents

intentionnels intentionnels

règles comportementales

modification

perception sélection

réactive d’une action

Anticipation

Désynchronisation

méthode (savoir-faire)

tendances, propriétés (savoir)

ac tio n

(13)

Architecture Architecture

SWI-Prolog

C++

propriétés

consultations asynchrones flux d’informations

inférences

intentions

Thread

intentions intentions

propriétés ?

décision actions

perceptions

Choix ?

Intentions ?

activité

ARéVi activité

ARéVi

activité

ARéVi

(14)

Bilan sur les agents intentionnels Bilan sur les agents intentionnels

Architecture et Architecture et

outil de outil de

prototypage prototypage

Prolog/ARéVi/C++

Caméra virtuelle Caméra virtuelle

autonome autonome

Animats Animats

Autonomie/

environnement Richesse comportementale

Abstraction pour l’autonomie

– Représentation des perceptions

tendances sur propriétés

– Substitution

désynchronisation

modification de l’anticipation en-ligne

(15)

Une métaphore pour la résolution Une métaphore pour la résolution distribuée de problèmes : le stress distribuée de problèmes : le stress

Objectif Objectif

« Exploiter la notion de stress pour simuler la résolution de problèmes

« Exploiter la notion de stress pour simuler la résolution de problèmes collectifs dynamiques »

collectifs dynamiques »

Cadre Cadre

– recuit simulé, déplacement, éco-résolution, satisfaction/altruisme recuit simulé, déplacement, éco-résolution, satisfaction/altruisme

Apports Apports

– Heuristique de résolution adaptative Heuristique de résolution adaptative – Aide à la collaboration Aide à la collaboration

méta-heuristiques [Holland 1992, Kirkparick 1998, Blum 2003 ] méta-heuristiques [Holland 1992, Kirkparick 1998, Blum 2003 ] CSP [Verfaillie 2005,] CSP [Verfaillie 2005,]

Agents [Drogoul 1991, Guedira 1994, Gleizes 1999, Agents [Drogoul 1991, Guedira 1994, Gleizes 1999, Simonin 2003] Simonin 2003]

(16)

Les agents stressés Les agents stressés

requêtes refus

stress

Buts personnels Buts collectifs

annulation

propositions

gêneur

perception

(17)

L’heuristique de la crise en L’heuristique de la crise en

cascade cascade

temps

annulation

(18)

Bilan sur les agents stressés Bilan sur les agents stressés

– Groupe ASA du GDR Groupe ASA du GDR I3 I3

– A l’origine du logiciel A l’origine du logiciel de calcul des EDT de de calcul des EDT de l’enib

l’enib

– Création d’une Création d’une startup

startup

Richesse comportementale

Autonomie/

environnement

Application à la résolution d’emplois du temps

Application à la résolution d’emplois du temps Métaphore pour l’autonomie

– Représentation des perceptions

stress messages

– Substitution

échanges asynchrones

modification des contraintes en-ligne

(19)

Objectif Objectif

« Élaborer un tuteur, s’adaptant à des couples « apprenant-

« Élaborer un tuteur, s’adaptant à des couples « apprenant- formateur » »

formateur » »

Cadre : Cadre :

– Environnements virtuels de formation [Querrec 2002] Environnements virtuels de formation [Querrec 2002]

– Apprentissage artificiel par renforcement [Sutton 1988] Apprentissage artificiel par renforcement [Sutton 1988]

Apports : Apports :

– Situation pédagogique Situation pédagogique

– Structuration d’un système de classeurs Structuration d’un système de classeurs

Un apprentissage : le tuteur Un apprentissage : le tuteur

adaptatif adaptatif

Tuteur artificiel [Balacheff 1998, Rickel 1999, Tchounikine 2004]

Apprentissage artificiel [Mitchell 1997, Cornuejol 2001]

(20)

Environnement virtuel de formation Environnement virtuel de formation

Environnement Virtuel de Formation (V.E.T)

Réalité Virtuelle Tuteur artificiel (I.T.S)

Élève (apprenant)

analyse

intervention pédagogique

interactions

L’utilisateur de la boucle

est le formateur

(21)

Adaptation de l’ITS Adaptation de l’ITS

formateur Réalité

Virtuelle

propositions décision

Générateur d’assistance pédagogique Tuteur artificiel

domaine interface

erreur apprenant

Situation Pédagogique

Abstraction Métaphore renforcement

Apprentissage

perception

(22)

Adaptation des systèmes de Adaptation des systèmes de

classeurs classeurs

État de l’

environnement

Liste de règles Algorithmes génétiques

appariement sélection

action rétribution

renforcement

Choix formateur

Décisions pédagogiques Hiérarchie de règles :

-Démarches -Attitudes -Techniques

Orientations pédagogiques

Association de règles

Concepts pédagogiques

Situation pédagogique

Réalité Virtuelle

(23)

Bilan sur le tuteur adaptatif Bilan sur le tuteur adaptatif

– Application Application d’échelle d’échelle

industrielle industrielle

– Collaboration Collaboration avec l’équipe avec l’équipe SARA du CERV SARA du CERV

Richesse comportementale

Autonomie/

environnement

Apprentissage pour l’autonomie

– Représentation des perceptions

Situation pédagogique

– Substitution

Adaptation en-ligne

(24)

Une synthèse : la simulation Une synthèse : la simulation

participative d’interactions participative d’interactions

Objectif Objectif

« Simuler le comportement d’un utilisateur de système interactif pour évaluer

« Simuler le comportement d’un utilisateur de système interactif pour évaluer son utilisabilité»

son utilisabilité»

Cadre : Cadre :

– Approche globale « écologique » [Morineau 2002] Approche globale « écologique » [Morineau 2002]

– « Faillible Machine » [Reason 1990] « Faillible Machine » [Reason 1990]

Apports : Apports :

– Intégration de trois modèles Intégration de trois modèles

– Modèle d’utilisateur : erreurs et confusions Modèle d’utilisateur : erreurs et confusions

Analytique : [Card 1983, Kieras 1994, John 2002]

Simulation : [Newell 1990, Anderson 1993, Kieras 1997]

(25)

action sortie

perception

Environnement

Dynamique Perturbation modale

Utilisateur

Sensitif Cognitif

Système multimodal

Fonctions Interactions

Scénario

Approche globale Approche globale

perturbations sensorielles

perturbations sensorielles fonctionnalités d’usage fonctionnalités d’usage

Abstractions

(26)

Modèle de l’utilisateur Modèle de l’utilisateur

Scénario

Environnement

Modalités possibles

Contexte personnel

Actions/rendez-vous but

Modalités d’action Modalités de sortie

interruption

Système multimodal

Modèle

Connexionniste de perception

Modèle Cognitiviste

de décision

Abstraction

Apprentissage

(27)

Bilan sur la simulation participative Bilan sur la simulation participative

d’interaction d’interaction

Outil SIHMM Outil SIHMM

Collaborations Collaborations

France-Télécom France-Télécom

Equipe SARA du Equipe SARA du

CERV CERV Richesse comportementale

Autonomie/

environnement

Utilisateur virtuel autonome

– Représentation des perceptions

Contexte personnel

Interactions avec le système

– Substitution

Modification en-ligne du modèle

connexionniste

(28)

Réflexion Réflexion

Autonomie/

environnement richesse comportementale

tuteur adaptatif

utilisateur virtuel

agents stressés

agents intentionnels

Modèle de l’environnement Construction d’une extériorité réactif

cognitif

Contexte

Enaction

(29)

Exploitation de la notion de Exploitation de la notion de

contexte contexte

Conditions significatives faisant qu’une situation est Conditions significatives faisant qu’une situation est

identifiable

identifiable [Pomerol 2001] [Pomerol 2001]

Offrir un point de vue particulier de l’environnement Offrir un point de vue particulier de l’environnement

la « propre représentation » du modèle la « propre représentation » du modèle Situations dynamiques collaboratives Situations dynamiques collaboratives

Explications Explications

Thèse de Romain Bénard

Thèse de Romain Bénard [Benard 2007] [Benard 2007]

Collaboration équipe SARA : Thèse de Cyril Bossard

(30)

Déformation

L’Enaction : un paradigme pour L’Enaction : un paradigme pour

l’autonomisation l’autonomisation

Autonomie sans représentation Autonomie sans représentation Métaphore conceptuelle

Métaphore conceptuelle

Autopoièse

Environnement

Histoire

Cognition [Varela 1989]

Interaction

Couplage

(31)

L’énaction : un paradigme pour L’énaction : un paradigme pour

l’autonomisation l’autonomisation

Questions ouvertes Questions ouvertes

? Autopoièse artificielle ou couplage Autopoièse artificielle ou couplage

? Domaine phénoménal Domaine phénoménal

? Domaine cognitif Domaine cognitif

? Statut de l’utilisateur Statut de l’utilisateur

– Expérimentations Expérimentations

– Positionnement théorique Positionnement théorique

– Thèse de Kristen Manac’h Thèse de Kristen Manac’h [Manac’h 2009] [Manac’h 2009]

(32)

Deux courants importants Deux courants importants

L’autonomisation grâce aux L’autonomisation grâce aux

systèmes de classeurs : héritage de systèmes de classeurs : héritage de

l’apprentissage artificiel l’apprentissage artificiel

L’Approche dynamique de la L’Approche dynamique de la

cognition : héritage de la biologie

(33)

Introduction aux systèmes de Introduction aux systèmes de

classeurs classeurs

Un exemple d’apprentissage Un exemple d’apprentissage

artificiel

(34)

Une définition Une définition

Un programme apprend une tache (T) Un programme apprend une tache (T)

à partir d ’expériences (E) si les à partir d ’expériences (E) si les performances (P) pour effectuer T performances (P) pour effectuer T

s ’améliorent avec E. (Mitchell97)

(35)

Une courbe Une courbe

Nb expériences

Performance

(36)

Un exemple Un exemple

+

- +

+

-

(37)

Une reconnaissance Une reconnaissance

+

-

+

(38)

Une généralisation Une généralisation

+

- +

+

-

?

? ?

Les cadres carrés sont positifs ?

(39)

Un problème Un problème

+

- +

+

- +

-

Non : les cadres carrés ne sont pas tous positifs

+

(40)

Une autre courbe : Une autre courbe :

généralisation/reconnaissance généralisation/reconnaissance

Nb expériences

Performance reconnaissance

(d’un unique échantillon)

généralisation

(un autre échantillon sert de test)

(41)

Des apprentissages artificiels Des apprentissages artificiels

Mise en œuvre de techniques pour améliorer la Mise en œuvre de techniques pour améliorer la

reconnaissance et/ou la généralisation reconnaissance et/ou la généralisation

Diffèrent en fonction de plusieurs critères : Diffèrent en fonction de plusieurs critères :

– Nature des concepts à apprendre (symboles discrets, Nature des concepts à apprendre (symboles discrets, valeurs continues, bruit)

valeurs continues, bruit)

va influencer la nature du modèle appris va influencer la nature du modèle appris

– Accès des entrées (paquet d’exemples, flux, correction Accès des entrées (paquet d’exemples, flux, correction d’hypothèses, interaction)

d’hypothèses, interaction)

va influencer le protocole d’apprentissage

(42)

Métaphores / Algorithmes Métaphores / Algorithmes

Inspirés des Sciences Cognitives et de la Inspirés des Sciences Cognitives et de la

psychologie psychologie

Apprentissage par renforcement Apprentissage par renforcement

Induction et abduction logique, floue … Induction et abduction logique, floue … Réseaux de neurones artificiels

Réseaux de neurones artificiels

Inspirés de la biologie Inspirés de la biologie

Évolution simulée Évolution simulée

Approche dynamique Approche dynamique

Inspiré des probabilités Inspiré des probabilités

Réseaux baysiens Réseaux baysiens

Mixages de techniques

(43)

Familles d’accès Familles d’accès

Supervisé : liste d’exemples analysés d’un Supervisé : liste d’exemples analysés d’un coup coup

Non supervisé : exemples donnés Non supervisé : exemples donnés

progressivement, classification faite en progressivement, classification faite en

ligne ligne

Renforcé : pas d’exemple, juste des Renforcé : pas d’exemple, juste des

récompenses et/ou des punitions

(44)

Perception-Décision-Action- Perception-Décision-Action-

Apprentissage Apprentissage

environnement

P.D.A

apprentissage

e s

• Apprentissage d’un triplet P.D.A

• Les métaphores psychologiques et des

sciences cognitives sont prépondérantes

(45)

Problème de l’agent situé Problème de l’agent situé

Localité de la perception Localité de la perception

Dynamisme de l’environnement Dynamisme de l’environnement

Or, il nous faut une représentation de Or, il nous faut une représentation de

l’environnement

(46)

Historique Historique

Conditionnement pavlovien Conditionnement pavlovien

stimulus neutre

stimulus inconditionnel

association

(47)

Historique Historique

Skinner : conditionnement opérant Skinner : conditionnement opérant

– Actions de l’animal Actions de l’animal

Contingence

à 2 termes

Contingence

à 3 termes

(48)

Historique Historique

Tolman et Honzic Tolman et Honzic

1

2 3 B

A

Pas d’obstruction : apprend 1

Puis : bloc A : utilise 2 Ou

bloc B :

utilise 3 sans passer par 2

(49)

Système de classeurs Système de classeurs

1010 01

capteurs

environnement

#010:01 28

#0##:11 12 101#:01 42

#0#0:11 11 01#1:10 12 10#1:00 25 AG

M (Match set)

#010:01 28

#0##:11 12 101#:01 42

#0#0:11 11

#010:01 28 101#:01 42

A (Action set)

A

renforcement interne

effecteurs

rétribution éventuelle

roulette

état action

récompense attendue

(50)

5/12/2006

5/12/2006 Autonomisation de modèles P. De LoorAutonomisation de modèles P. De Loor 5050

Renforcement des ZCS : Algorithm Renforcement des ZCS : Algorithm

« Bucket Brigade »

#010:01 28 101#:01 42 A

A _-1

rétribution éventuelle

#010:01 25.2 101#:01 37.8

A

sceau B

2.8+4.2=7

##10:11 5 11##:11 8

#11#:11 9

A _-1 ##10:11 5.7 11##:11 9

#11#:11 10

Prélèvement d ’un pourcentage br (taxe) (exemple 10%) taux d ’apprentissage

#010:01 27.2 101#:01 39.8

A

renforcement interne taux de remise

environnement

(51)

ZCS ZCS

– privilégie les règles rapportant plus privilégie les règles rapportant plus

– élimine les autres élimine les autres (oubli = surprise = « covering » = pif) (oubli = surprise = « covering » = pif)

– quelle que soit leur « précision » quelle que soit leur « précision »

– n ’apprend que des environnements n ’apprend que des environnements markovien

markovien

Perception états

(52)

Environnement non markovien : Environnement non markovien :

renforcer l ’historique : ZCSM renforcer l ’historique : ZCSM

Codage d ’une règle Codage d ’une règle

#0101, 01# : 10, #1#

identification capteurs

identification état interne

action

modification état interne

(53)

Système de classeur « intelligent »

=>Système de classeur pour la sélection d’action

(54)

Système de classeur « intelligent »

(55)

Système de classeur « intelligent »

=>Système de classeur pour la sélection d’action [Robert02]

(56)

Système de classeur « intelligent »

(57)

Système de classeur « intelligent »

=>Système de classeur pour la sélection d’action [Sanza00]

NeVis(Networked Virtual Soccer)

(58)

Condition->montrer

Active Exposive

Niveau 1 : Démarches pédagogiques

Réaliser Montrer

Niveau 2 : Attitudes pédagogiques

Simplification Modification

Niveau 3 : Techniques pédagogiques

Choix du formateur : Changer-Texture x

Condition->réaliser Condition->réaliser

Condition->montrer Condition->réaliser Condition->réaliser

Condition->Modification Condition->Simplification Condition->Simplification

Condition->Simplification Condition->Modification

Condition->Rendre-Transparent y Condition->Rendre-Transparent y Condition->Changer-Texture x Condition->Rendre-Transparent y

appariement

Condition->Rendre-Transparent z

Situation pédagogique

Assistance

Rendre-Transparent y : poids = 1+4+4=9

1 1

1+1+1 1

1 1+3

(59)

Introduction à l’approche Introduction à l’approche dynamique de la cognition dynamique de la cognition

L’héritage de la biologie

(60)

Questions sur les représentations Questions sur les représentations

en psychologie en psychologie

Les représentations sont-elles modales ou Les représentations sont-elles modales ou

amodales amodales

– Certaines expériences montrent qu’il existe des Certaines expériences montrent qu’il existe des

représentations modales analogiques (rotation mentale, représentations modales analogiques (rotation mentale,

repère topologique) repère topologique)

– Certains chercheurs en sciences cognitives pensent Certains chercheurs en sciences cognitives pensent qu’elles ne sont pas fondamentales contrairement aux qu’elles ne sont pas fondamentales contrairement aux

représentations amodales (Pylyshyn) représentations amodales (Pylyshyn)

– Les neurosciences montreraient que certaines zones du Les neurosciences montreraient que certaines zones du cerveau servent à la fois pour la perception visuelle et cerveau servent à la fois pour la perception visuelle et

pour l’imagination (représentation mentale) pour l’imagination (représentation mentale)

L’intentionnalité … comment ça marche ?

(61)

Rappel Rappel

Modèle de l’environnement Construction d’une extériorité

(pas de modèle de l’environnement)

Autonomie

(62)

Cognitivisme Cognitivisme

Métaphore : Ordinateur Métaphore : Ordinateur

– Représentations, symboles, calcul Représentations, symboles, calcul

Écueil technique : formalisation, exhaustivité, Écueil technique : formalisation, exhaustivité,

« frame problem », dynamicité

Écueil conceptuel : absence de sens, chambre Écueil conceptuel : absence de sens, chambre

chinoise, séparation conscience/intentionnalité, chinoise, séparation conscience/intentionnalité,

rôle des interactions sensori-motrices, aspects rôle des interactions sensori-motrices, aspects

parallèles et adaptatifs du cerveau…

(63)

Connexionnisme Connexionnisme

Métaphore : cerveau Métaphore : cerveau

– Représentations émergentes Représentations émergentes

Écueil technique : recherche de la configuration Écueil technique : recherche de la configuration

du réseau, aspects dynamiques du réseau, aspects dynamiques

Écueil conceptuel : entrées/sorties pré-données, Écueil conceptuel : entrées/sorties pré-données,

absence de sens, absence de l’histoire et de absence de sens, absence de l’histoire et de

l’évolution du système

(64)

Enactionnisme (approche Enactionnisme (approche

dynamique) dynamique)

Métaphore : Vivant Métaphore : Vivant

– Approche dynamique de la constitution des connaissances Approche dynamique de la constitution des connaissances – « la cognition est l’histoire du couplage structurel entre un « la cognition est l’histoire du couplage structurel entre un

système autopoiétique et son environnement » système autopoiétique et son environnement »

– Inscription corporelle de la connaissance par le biais de Inscription corporelle de la connaissance par le biais de l’histoire du couplage entre l’organisme et son

l’histoire du couplage entre l’organisme et son environnement

environnement

– Absence de représentation Absence de représentation – Autopoièse Autopoièse

– Couplage structurel Couplage structurel – Clôture opérationnelle Clôture opérationnelle

Recherche de modèles et d’exemples en court…

Semble difficile, défis techniques et conceptuels

(65)

La construction d’un « monde La construction d’un « monde

propre » propre »

L’Umwelt de von [Uexküll 1909] (éthologiste) L’Umwelt de von [Uexküll 1909] (éthologiste)

– Chaque organisme se construit des significations à partir Chaque organisme se construit des significations à partir de ses interactions avec l’environnement. Son monde de ses interactions avec l’environnement. Son monde

interne traduit ses impressions sensorielles en effets interne traduit ses impressions sensorielles en effets

Qu’est ce que cela fait d’être une chauve-souris Qu’est ce que cela fait d’être une chauve-souris

[Nagel 1974]

– Ce n’est pas parce que l’on aura découpé, analysé le Ce n’est pas parce que l’on aura découpé, analysé le cerveau d’une chauve souris que l’on saura ce que cela cerveau d’une chauve souris que l’on saura ce que cela

fait d’être une chauve-souris fait d’être une chauve-souris

De la vie à la cognition [Varela 1993]

– Par sa constitution, la cellule se déplace vers les Par sa constitution, la cellule se déplace vers les glucides : début de la cognition

glucides : début de la cognition

(66)

Exemples Exemples

« Passive walking »

« Passive walking » : l’inscription

: l’inscription corporelle

corporelle

(67)

Systèmes autopoiétiques Systèmes autopoiétiques

Un système autopoiétique se produit « lui-même » Un système autopoiétique se produit « lui-même »

Il n’est pas l’ensemble de ses éléments (qui Il n’est pas l’ensemble de ses éléments (qui

disparaissent sans cesse), mais une organisation disparaissent sans cesse), mais une organisation

viable viable

Pour lui, l’environnement n’est pas une entrée mais Pour lui, l’environnement n’est pas une entrée mais

une perturbation de l’organisation une perturbation de l’organisation

A l’interieur de l’organisme, il n’est pas possible de A l’interieur de l’organisme, il n’est pas possible de

« savoir » si une perturbation vient de

l’environnement ou de la structure de l’organisme l’environnement ou de la structure de l’organisme

elle-même.

(68)

Couplage structurel Couplage structurel

L’environnement et l’organisme sont co- L’environnement et l’organisme sont co-

dépendant (la fleur et l’abeille) dépendant (la fleur et l’abeille)

La pression de l’environnement provoque La pression de l’environnement provoque

des changements de l’organisation de des changements de l’organisation de

l’organisme et donc de l’environnement l’organisme et donc de l’environnement

Si ce couplage permet de préserver Si ce couplage permet de préserver

l’autopoièse de l’organisme, il est viable

(69)

Clôture opérationnelle Clôture opérationnelle

Généralisation de l’autopoièse à d’autres domaines Généralisation de l’autopoièse à d’autres domaines

que la biologie que la biologie

Un système est opérationnellement clos s’il forme Un système est opérationnellement clos s’il forme

une organisation de processus dépendant une organisation de processus dépendant

récursivement les uns des autres pour se régénérer et récursivement les uns des autres pour se régénérer et

s’il peut être identifié comme une unité s’il peut être identifié comme une unité

reconnaissable reconnaissable

Thèse de la clôture : tout système autonome est Thèse de la clôture : tout système autonome est

opérationnellement clos opérationnellement clos

Exploitation pour l’autonomisation des modèles ?

(70)

Domaines Domaines

Domaine cognitif : Domaine cognitif :

– Ensemble des perturbations que peut subir Ensemble des perturbations que peut subir l’organisme sans perdre son autopoièse

l’organisme sans perdre son autopoièse

Domaine phénoménal : Domaine phénoménal :

– Domaine où peut exister une transformation Domaine où peut exister une transformation – Domaine physico-chimique Domaine physico-chimique

– L’autopoièse engendre un domaine L’autopoièse engendre un domaine

phénoménale différent de celui-ci au sein phénoménale différent de celui-ci au sein

duquel elle opère. (physico-chimique vers vie)

(71)

L’automate de Tesselation [Stewart L’automate de Tesselation [Stewart

& Bourgine 2002]

Un système autopoiétique minimal Un système autopoiétique minimal

– La membrane est constituée d’éléments C qui se La membrane est constituée d’éléments C qui se désagrègent en D

désagrègent en D

– Un élément B en contact avec un élément C peut Un élément B en contact avec un élément C peut s’y attacher s’il a la place et se transformer en C s’y attacher s’il a la place et se transformer en C (bouche les trous)

(bouche les trous)

– Un élément B est créé à partir de deux éléments Un élément B est créé à partir de deux éléments A à proximité d’un C (catalyseur)

A à proximité d’un C (catalyseur)

– La membrane est perméable aux A pas aux B La membrane est perméable aux A pas aux B – L’environnement est composé de A en libre L’environnement est composé de A en libre

circulation

(72)

L’automate de Tesselation L’automate de Tesselation

C C CC C C

C C C

C C C C C

C C C C C A

A

A A

A

A A+A->B

A B B

C C

C C CC C

C C C C C

C C C C B

C B

D

(73)

Jeu de la vie et autopoièse Jeu de la vie et autopoièse

[Randall D. Beer]

Une case ‘morte’ avec exactement Une case ‘morte’ avec exactement

trois voisins ‘vivants’ devient vivante trois voisins ‘vivants’ devient vivante

Elle reste vivante tant qu’elle Elle reste vivante tant qu’elle

possède 2 ou 3 voisins possède 2 ou 3 voisins

Sinon elle meurt Sinon elle meurt

Le cas du « glisseur»

(74)

Jeu de la vie et autopoièse Jeu de la vie et autopoièse

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 2 2 1 1 0 0 0 0 0 0 0 0 1 1 3 3 5 5 3 3 2 2 0 0 0 0 0 0 0 0 1 1 1 1 3 3 2 2 2 2 0 0 0 0 0 0 0 0 1 1 2 2 3 3 2 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 1 1 2 2 1 1 0 0 0 0 0 0 0 0 0 0

1 1 1 1 2 2 1 1 1 1 0 0 0 0 0 0 0 0

1 1 2 2 4 4 2 2 2 2 0 0 0 0 0 0 0 0

1 1 2 2 5 5 3 3 2 2 0 0 0 0 0 0 0 0

1 1 2 2 2 2 3 3 1 1 0 0 0 0 0 0 0 0

0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

(75)

Jeu de la vie et autopoièse Jeu de la vie et autopoièse

glisseur

(76)

Autopoièse et jeu de la vie Autopoièse et jeu de la vie

Le glider est une configuration spatiale maintenue Le glider est une configuration spatiale maintenue

et régénérée par le jeu des interactions et régénérée par le jeu des interactions

Est-ce autopoiétique ? Est-ce autopoiétique ?

– Les états des cellules sont-ils des composants Les états des cellules sont-ils des composants

– Le changement d’état d’une cellule est-il une production ? Le changement d’état d’une cellule est-il une production ? – Y a-t-il une frontière ? Y a-t-il une frontière ?

D’un certain point de vue oui D’un certain point de vue oui

– La frontière est l’ensemble des cellules mortes entourant La frontière est l’ensemble des cellules mortes entourant le glider

le glider

– Elles sont nécessaires à la production du glider, et le glider Elles sont nécessaires à la production du glider, et le glider est nécessaire à leur production

est nécessaire à leur production

– Et les perturbations, on peut en mettre ? Qu’est-ce qu’un Et les perturbations, on peut en mettre ? Qu’est-ce qu’un glider mort ?

glider mort ?

(77)

Glisseur et perturbations

(78)

Questions de Domaines Questions de Domaines

Avec le Glider nous retrouvons quelques Avec le Glider nous retrouvons quelques

caractéristiques des systèmes autopoiétiques caractéristiques des systèmes autopoiétiques

Le domaine phénoménal du jeu de la vie Le domaine phénoménal du jeu de la vie

(comparaisons symboliques) engendre un (comparaisons symboliques) engendre un

domaine phénoménal pour l’observateur : le domaine phénoménal pour l’observateur : le

glider glider

Mais il manque beaucoup d’outils : Mais il manque beaucoup d’outils :

– Pour définir le domaine cognitif. Pour définir le domaine cognitif.

– Pour introduire l’histoire et l’évolution. Pour introduire l’histoire et l’évolution.

– Pour définir la notion de couplage avec Pour définir la notion de couplage avec l’environnement.

l’environnement.

(79)

Question sur L’autopoièse Question sur L’autopoièse

Obtenir un couplage structurel nécessite-il Obtenir un couplage structurel nécessite-il

un mécanisme autopoiètique un mécanisme autopoiètique

Peut-on réifier la notion d’autopoièse ? Peut-on réifier la notion d’autopoièse ?

Pour un système artificiel Pour un système artificiel

– qu’est-ce qu’un composant du système ? qu’est-ce qu’un composant du système ? – qu’est ce que sa structure ? qu’est ce que sa structure ?

– qu’est-ce qu’une perturbation ? qu’est-ce qu’une perturbation ?

– qu’est-ce que devient la notion de « génération qu’est-ce que devient la notion de « génération d’un composant »

d’un composant »

(80)

Vers les réseaux de neurones Vers les réseaux de neurones

réccurents réccurents

Connexionnisme

Connexionnisme Approche Approche dynamique dynamique causalité

causalité Causalité linéaire : systèmes Causalité linéaire : systèmes entrées/sortie

entrées/sortie Causalité circulaire : Causalité circulaire : systèmes récurrents systèmes récurrents

Rapport au Rapport au monde

monde

Séparé, objectif.

Représentable en patterns Représentable en patterns d’activations

d’activations

Engagé, subjectif.

Présentable par les Présentable par les actions

actions

comportement comportement s s

émergence d’une succession émergence d’une succession d’états discrets

d’états discrets Flots d’états continus. Flots d’états continus.

Bifurcations non Bifurcations non linéaires

linéaires

Lien Lien

cerveau/corps cerveau/corps

Séparable. Les connaissances Séparable. Les connaissances émergent d’une interaction émergent d’une interaction entre le corps et le monde entre le corps et le monde

Inséparable. Co- Inséparable. Co- construction des construction des

connaissances par le corps connaissances par le corps et le monde dans un

et le monde dans un historique d’interactions historique d’interactions réciproques

réciproques

(81)

Réseaux récurrents à temps Réseaux récurrents à temps

continu continu

Le réseau entretien une dynamique :

N i

avec I

y w

y

y _i _i ^N _ji _j _j _i

i ^     ^ (  ^ )  ,  1 ...



(82)

Réseau récurent à temps continu Réseau récurent à temps continu

Un réseau non perturbé peut osciller Un réseau non perturbé peut osciller

Une perturbation modifie les oscillations Une perturbation modifie les oscillations

Chaque type d’oscillation devient une sorte Chaque type d’oscillation devient une sorte de mémoire, une « représentation » interne de mémoire, une « représentation » interne de l’environnement

de l’environnement

Elle peut en retour perturber l’environnement

(83)

Exemple de dynamique d’un Exemple de dynamique d’un réseau récurent (ici Hopfield) réseau récurent (ici Hopfield)

Niveau moyen d’activation des neurones en fonction d’un paramètre g propre à

(84)

Expériences de Randall D. Beer Expériences de Randall D. Beer

7 capteurs de distance 2 effecteurs en opposition 7 neurones de perception

Projetés sur 6 neurones totalement interconnectés 2 neurones moteurs

71 paramètres ajustés par AG

Dans les exemples, certains passages sont trop Étroits

La fonction de fitness

- valorise les individus qui évitent les passages trop étrois

- valorise ceux qui passe le plus au milieu quand

cela est possible

(85)

Trajectoires obtenues Trajectoires obtenues

Évitements Passages

(86)

Perception de soi Perception de soi

La main est perçue (la balle aussi) Pour les distinguer, il faut faire osciller le bras

7 capteurs de distance (avec neurones) 2 capteurs angulaires (position du bras) 6 neurones interconnectés

AG : 74 paramètres

(87)

Résultats Résultats

trajectoires performances

(88)

Mémoire (à court terme) Mémoire (à court terme)

Lorsqu’il se déplace, il est aveugle La balle tombe verticalement ou avec une pente

9 neurones de perception

4 neurones entièrement inter-connectés 2 neurones moteurs entièrement inter- connectés

AG : 56 parametres

(89)

Trajectoires pour une balle tombant Trajectoires pour une balle tombant verticalement de différentes positions verticalement de différentes positions

trajectoires performances

(lorsque l’objet est au centre

Il est perçu trop tard pour

obtenir une bonne précision)

(90)

Trajectoires obtenues pour Trajectoires obtenues pour

des balles à trajectoires obliques des balles à trajectoires obliques

Une pénalité Une pénalité supplémentaire supplémentaire s’il bouge trop tôt s’il bouge trop tôt

Le déplacement Le déplacement ne s’effectue ne s’effectue qu’après que la qu’après que la balle ne quitte le balle ne quitte le capteur, sa

capteur, sa

vitesse est ainsi vitesse est ainsi

« saisie » par le

« saisie » par le système

système à vitesse constante

à différentes vitesses

à vitesse constante

(91)

Attention selective : 2 cibles à 2 Attention selective : 2 cibles à 2

vitesses

(92)

Exemple : les animats Exemple : les animats

Psychologie

Ethologie Biologie

Animat :

Animal simulé ou robot réel adaptatif

Robotique

Intelligence artificielle

Vie artificielle

Se réclament de « Brooks » « le monde est sa propre représentation Pas de cognitivisme

Surtout du connexionnisme

(93)

Exemples Exemples

Hexapode connexionniste Hexapode connexionniste

AR

AR

Po P

AV

AV

C

(94)

Exemples Exemples

Hexapode ~dynamique Hexapode ~dynamique

– Réseaux de neurones continus (dy/dt) Réseaux de neurones continus (dy/dt) (valeurs générées par AG)

(valeurs générées par AG) – récurrence récurrence



(95)

Exemples Exemples

Comparaison : Comparaison :

– L’hexapode connexionniste voit les causalités L’hexapode connexionniste voit les causalités entrées/sorties clairement définies

entrées/sorties clairement définies

– La récurrence des réseaux de l’hexapode La récurrence des réseaux de l’hexapode dynamique empêche une telle causalité dynamique empêche une telle causalité

« définitive »

– Une fois l’hexapode dynamique calculé, les Une fois l’hexapode dynamique calculé, les expériences montrent qu’il s’adapte à des expériences montrent qu’il s’adapte à des

modifications (longueur des pattes) grâce à sa modifications (longueur des pattes) grâce à sa dynamique interne.

dynamique interne.

(96)

Exemples Exemples

Un robot situé « à la Brooks » Un robot situé « à la Brooks »

Carte

Détection d’amers

Navigation réflexe

MG

La carte est élaborée par apprentissage à l’aide d’un compas et utilisée pour définir les chemins

MG : mur à gauche MD : mur à droite

C

MD

MG

(97)

Exemples Exemples

Approche ~dynamique [Tani 1996]

S(t) M(t) C(t-1) S(t+1) M(t+1)

Réseau récurent continu

Prédictions donc erreur de prédiction

5 modules en compétition Apprentissage :

Celui qui génère la plus faible erreur de prédiction peut ajuster ses poids 4 modules émergent et se spécialisent dans la reconnaissance

des portes/tournants/coins/murs droits

(98)

Exemples Exemples

Comparaison Comparaison

– Les amères sont prédéfinis dans les robots « à la Brooks » Les amères sont prédéfinis dans les robots « à la Brooks » la carte apprise correspond à un environnement précis

la carte apprise correspond à un environnement précis – La reconnaissance des amères La reconnaissance des amères émerge émerge dans l’approche dans l’approche

dynamique dynamique

– Les récurrences des unités de contextes jouent un rôle de Les récurrences des unités de contextes jouent un rôle de mémoire

mémoire

– Un module n’est pas utilisé, ce qui permet de penser que Un module n’est pas utilisé, ce qui permet de penser que le système pourra s’adapter à des environnements plus le système pourra s’adapter à des environnements plus complexes

complexes

(99)

Exemples Exemples

Sélection d’action libre flux

Sélection d’action libre flux « à la P. « à la P.

Maës ou Matari » Maës ou Matari »

Chercher à manger Se reposer

Manger S’approcher Approche Mémorisé en

cours Explorer

Manger Fruit Manger proie N NE E SE S SO O NO Niveaux intermédiaires

sélection Capteur

proie Capteur

fruit

(100)

Exemples Exemples

+/- +/-

Batterie eau

Batterie nourriture capteurs

boisson trappe

nourriture

roue

Réserves

Calcul des poids des arcs

par AG (fitness=temps de survie) Les niveaux de batteries

Modifient les valeurs des fonctions de transfert. Cette modification est elle-même calculée par AG

[Seth 1998]

(101)

Exemples Exemples

Comparaison Comparaison

– Les comportements de l’approche ~dynamique Les comportements de l’approche ~dynamique ne passent pas par une discrétisation explicite ne passent pas par une discrétisation explicite comme les comportements « à la Matari »

comme les comportements « à la Matari » – L’approche ~dynamique exhibe des L’approche ~dynamique exhibe des

comportements adaptatifs cohérents. L’analyse comportements adaptatifs cohérents. L’analyse des liaisons ne permet pas de reconnaître

des liaisons ne permet pas de reconnaître

l’équivalent d’une architecture de type libre flux l’équivalent d’une architecture de type libre flux car :

car :

Il n’y a pas de mécanisme d’arbitration explicite Il n’y a pas de mécanisme d’arbitration explicite

Les liens sensor-moteur activent le comportement à Les liens sensor-moteur activent le comportement à

l’aide d’une récurrence reflétée ici par le niveaux des l’aide d’une récurrence reflétée ici par le niveaux des

batteries qui résulte de

batteries qui résulte de l’historique des actions passée l’historique des actions passée

(102)

Conclusions Conclusions

L’approche dynamique débute L’approche dynamique débute

Il reste à élaborer formellement les Il reste à élaborer formellement les

distinction autopoièse/cognition dynamique distinction autopoièse/cognition dynamique

La fonction de fitness des AG est un non- La fonction de fitness des AG est un non-

sens pour les puristes sens pour les puristes

Il manque une évaluation de l’autonomie Il manque une évaluation de l’autonomie

obtenue obtenue

Le couplage structurel n’est pas abordé Le couplage structurel n’est pas abordé

L’évolution non plus

(103)

Travaux sur la résolution de Travaux sur la résolution de

problèmes problèmes

« Soft Computing » [Blum 2003]

– Algorithmes génétiques [Holland 1992] Algorithmes génétiques [Holland 1992]

– Recuit simulé [Kirkparick 1998] Recuit simulé [Kirkparick 1998]

Problèmes de satisfaction de contraintes (CSP) Problèmes de satisfaction de contraintes (CSP)

[Narenda 2002]

– Heuristiques : Propagation, Mémorisation, Déplacement Heuristiques : Propagation, Mémorisation, Déplacement – CSP Dynamiques [Verfaillie 2005] CSP Dynamiques [Verfaillie 2005]

Systèmes Multi-Agents (SMA) [Ferber 1995]

– Recuit simulé distribué [Guedira 1994] Recuit simulé distribué [Guedira 1994]

– Éco-résolution [Drogoul 1991] Éco-résolution [Drogoul 1991]

– Modèle satisfaction/altruisme [Simonin 2003] Modèle satisfaction/altruisme [Simonin 2003]

– Analyse de situations coopératives [Gleizes 1999] Analyse de situations coopératives [Gleizes 1999]

(104)

Remarques d’Annie Luciani Remarques d’Annie Luciani

Remarque 1 Remarque 1

– Simulation phénoménologique : Simulation phénoménologique :

rapport entre observable et observée. Qu’elles soient rapport entre observable et observée. Qu’elles soient phénoménologique ou analytique… Or je dis que cela phénoménologique ou analytique… Or je dis que cela n’est vrai que pour l’analytique, où est la différence ? n’est vrai que pour l’analytique, où est la différence ?

Remarque 2 Remarque 2

– Enaction Enaction

Quelles propriétés des modèles pour l’énaction ? Quelles propriétés des modèles pour l’énaction ?

Pas d’aspects technologiques dans la définition de Pas d’aspects technologiques dans la définition de

Varela Varela

Usage de la machine dans l’élaboration d’une théorie Usage de la machine dans l’élaboration d’une théorie

de la relation de l’homme au monde incluant la de la relation de l’homme au monde incluant la

technologie

(105)

Travaux sur les agents situés Travaux sur les agents situés

Diversité : des nuages à l’homme Diversité : des nuages à l’homme

[Gareau 1997, Drogoul 2000, Schmidt 2000, Querrec 2002]

Les architectures : Les architectures :

– Réactives Réactives [Brooks 1990, Maës 1990] [Brooks 1990, Maës 1990]

– Délibératives Délibératives [Fikes 1971, Tate 1977, Firby 1987 [Fikes 1971, Tate 1977, Firby 1987 Georgeff 1989, Wooldridge 2000]

Georgeff 1989, Wooldridge 2000]

– Hybrides Hybrides [Sloman 2002, Schmidt 2000, [Sloman 2002, Schmidt 2000, Acquisti 2003]