• Aucun résultat trouvé

Propriétés du modèle et coordination généralisée

3.1.2 Activité bornée

Si l’on suppose que l’activité induite par l’environnement sur le champ d’activité est bornée dans l’intervalle [0; M ], et que l’activité initiale en tout point du champ d’activité est égale-ment comprise dans ce même intervalle (a fortiori si elle est nulle), l’activité restera bornée dans [0; M ] quelle que soit la configuration de l’espace en termes d’interactions et d’anticipations. Cette propriété ne garantit en aucun cas la convergence de l’activité, mais prouve que le sys-tème ne voit pas son activité diverger vers l’infini et son comportement devenir instable. Une preuve de convergence globale n’aurait d’ailleurs aucun intérêt puisque qu’on s’intéresse à la dynamique du champ d’activité.

Les interactions ne faisant que diffuser l’activité provenant de l’environnement, on a trivia-lement : ∀t ∈N, ∀I ∈ I, aI(t) ∈ [0; M ] où aI(t) est l’activité de l’interaction I à l’instant discret

t.

La preuve pour les anticipations peut se faire par récurrence sur t. On veut montrer la propriété : ∀t, ∀A ∈ A, aA(t) ∈ [0; M ].

• Pour t = 0, on a supposé que le champ satisfaisant initialement la condition, donc ∀A ∈ A, aA(0) ∈ [0; M ].

• Soit t ∈ N tel que ∀A ∈ A, aA(t) ∈ [0; M ]. Montrons que ∀A ∈ A, aA(t + 1) ∈ [0; M ] : ∀(A, I) ∈ A × I :

pM(I, srcA)(t + 1) = aI(t + 1)simM(I, src) d’après l’équation2.3

0 ≤ pM(I, srcA) ≤ aI(t + 1) car simM sigmoïde ⇒ (1) pM(I, srcA) ∈ [0; M ] car ∀t, ∀I, aI(t) ∈ [0; M ]

∀A ∈ A :

asrcA(t + 1) = max

I∈I pM(I, srcA) d’après l’équation2.7

⇒ (2) asrcA(t + 1) ∈ [0; M ] d’après (1)

∀(A, A0) ∈ A2 :

pm(srcA0, dstA)(t + 1) = asrc

A0(t)simm(srcA0, dstA) d’après l’équation2.2

0 ≤ pm(srcA0, dstA) ≤ asrc

A0(t) car simm sigmoïde

⇒ (3) pm(srcA0, dstA) ∈ [0; M ] hypothèse de récurrence

∀A ∈ A :

adstA(t + 1) = max

A0∈Apm(srcA0, dstA) d’après l’équation2.8

⇒ (4) adstA(t + 1) ∈ [0; M ] d’après (3)

∀A ∈ A :

aA(t + 1) = (1 − α)asrc(t + 1) + αadst(t + 1) d’après l’équation2.9

(1 − α) × 0 + α × 0 ≤ aA(t + 1) ≤ (1 − α)M + αM d’après (2) et (4) ⇒ aA(t + 1) ∈ [0; M ]

3.2 Coordination

Les processus interactifs décrits de manière théorique depuis le début de ce manuscrit ré-sultent de la dynamique de l’activité des interactions et des anticipations. Chaque interaction peut être conçue comme une situation possible sur la trajectoire de la dynamique de l’agent. Une séquence d’anticipations peut ainsi déterminer une trajectoire orientée (figure 3.2). Cette trajectoire est le produit de la coordination des anticipations, permise par les propagations d’ac-tivités au sein de l’espace d’interaction.

potentialités

trajectoire unique espace d'interaction

(a) (b)

environnement réel

Figure 3.2 – (a) Dans l’espace des interactions, les anticipations déterminent une infinité de trajectoires possibles. Elles sont imaginées mais éventuellement irréalisables physiquement. (b) Seules les interactions avec l’environnement réduiront l’ensemble des possibles à une trajectoire unique.

3.2.1 Attracteurs

Toutes les anticipations du modèle étant simultanément actives, elles jouent toutes continû-ment le rôle d’attracteurs. La raison en est simple :

1. Chaque anticipation propage son activité aux anticipations qui la précèdent.

2. Chaque anticipation influe d’autant plus sur les actions de l’agent que son activité est élevée.

Donc plus une anticipation sera active, plus les anticipations qui la précèdent le seront, avec une atténuation spatiale suivant la topologie et la mesure de similarité de l’espace d’interaction. Les anticipations proches assimilant des situations similaires, elles auront un effet important sur les interactions avec l’environnement. Elles constituent ainsi des attracteurs locaux pour la dynamique de l’agent.

Néanmoins le système ne converge jamais vers des attracteurs statiques. L’activité des anti-cipations étant partiellement issue des interactions avec l’environnement, chaque sensation influe sur le paysage dynamique de l’activité. La zone de plus forte activité correspond ainsi générale-ment à la situation présente. Pour faire un parallèle avec la perception humaine, qu’est-ce qui rend la lecture de cette thèse plus réelle qu’une autre pensée ? Si on adhère aux idées développées dans ce manuscrit, ce n’est pas la nature même des processus mis en jeu, mais le simple fait que chaque interaction avec l’environnement, même le fait de détourner les yeux de la page, confirme des anticipations liées à la lecture de celle-ci. Des pensées peuvent momentanément prendre le dessus et entretenir leur propre activité, mais s’effacent rapidement et laissent place à d’autres pensées ou interactions en contact plus direct avec la réalité.

x

¢ Champ d'activité résultant

max a 2 x 1 x 1 I a 2 I a activité X

Figure 3.3 – Lorsque deux attracteurs locaux (activité diffusée en pointillés) sont combinées dans le champ d’activité global via la propagation par les anticipations (simplifiée par une addition ici), la zone autour de l’interaction d’activité a1 demeure la plus attractive (maximum global de la courbe continue). L’effet faible mais non négligeable de l’autre source d’activité attire néanmoins à lui le maximum d’activité (x1 < xmax < x2). Cette légère déviation locale (∆x), influençant les actions et répétée à chaque cycle sensori-moteur, conduit irrémédiablement de la situation x1 très présente à x2 plus faiblement activée.

La dynamique du système formé par les anticipations n’en est pas pour autant réactive. Même si l’activité se concentre autour des sensations présentes, l’activité interne propagée affecte le champ d’activité (ne serait-ce qu’un peu, voir figure3.3). Détail primordial sur lequel je n’ai pas encore insisté, la réduction des actions s’opère sur la conséquence des anticipations. Bien que la source des anticipations assimile la situation présente, les actions sont toujours tournées vers le futur, favorisant la transition vers les conséquences et l’enchaînement des anticipations. Le système est ainsi engagé dans une activité permanente, toute situation rencontrée augmentant le degré d’activité d’anticipations différentes et engendrant de nouvelles actions.

La tendance est ainsi à la convergence des attracteurs en un point unique (ceux-ci étant influencés par les actions et les changements de l’environnement). Cet "état" n’est malgré tout jamais atteint. Il faut rappeler à ce niveau qu’on s’intéresse en principe à des systèmes loin de l’équilibre thermodynamique. L’existence et stabilité d’un tel état signifierait qu’une situation satisferait simultanément tous nos intérêts, envies, désirs et besoins. Pire que ça, il devrait satisfaire toutes nos anticipations...

La notion de système dynamique loin de l’équilibre thermodynamique pour des systèmes mathématiques ou informatiques n’a pas été formellement introduite jusqu’à présent. Mon point de vue, loin d’être partagé par la communauté scientifique, est que n’importe quel agent/robot peut avoir des besoins, qu’ils soient introduits par une contrainte physique (énergie consommée, dégradation des pièces mécaniques, ...) ou artificiellement par le concepteur. Ceux-ci n’ont pas à être des variables explicites à maximiser, mais sont assimilés par des processus innés se coordon-nant avec les autres pour être satisfaits. Il n’est pas nécessaire à un être humain de mourir de faim pour comprendre que manger satisfait le besoin qu’il ressent. L’évolution nous a pourvus de systèmes biologiques permettant d’anticiper sur le manque réel, et le signal chimique ou nerveux perçu ne porte pas en lui le concept de faim ou de nécessité.

3.2.2 Régulation

Les anticipations ne restent souvent que des potentialités, seules les anticipations dont l’acti-vité est la plus forte influenceront suffisamment la dynamique de l’agent pour affecter ses inter-actions avec l’environnement. En effet, le comportement de l’agent est déterminé par l’activité

T T+¢T (b) (a) 1 2 3 4 5 1 2 3 4 5

Figure 3.4 – (a) Les sensations en provenance de l’environnement déterminent la forme glo-bale du champ d’activité ( ,2 ), reflétant la situation réelle du moment. Les anticipations les5 plus actives (flèches noires) sont celles qui partent d’une interaction assimilant les sensations prépondérantes ( ), et sont sur les trajectoires les plus courtes liant des attracteurs distants.2 (b) Les actions effectuées entre T et T + ∆T , déterminées par les anticipations les plus actives, conduisent à une nouvelle situation ( ,3 ) transformant l’intégralité du champ d’activité.5

globale résultant de toutes les interactions et anticipations, comme décrit au chapitre précédent. Plusieurs anticipations fortement actives ne se limitant pas à l’observation et l’anticipation de la dynamique de l’environnement, c’est-à-dire proposant des actions, peuvent influer sur les ac-tions de l’agent. De par la somme pondérée qui est utilisée pour réduire les acac-tions (en somme prendre une décision), une forme simple de régulation est opérée sur toutes les dimensions, aussi bien sensorielles que motrices. La valeur résultant de la réduction est un compromis entre des anticipations concurrentes qui, puisqu’elles sont actives, sont de toute manière adaptées à la situation. Il y a là une forme de régulation, puisque la trajectoire des interactions de l’agent est automatiquement ramenée au voisinage d’une anticipation forte s’il lui arrivait de s’en écarter.

Une conséquence de cette micro-régulation continue entre anticipations est l’apparition de variabilité locale. Si l’on considère deux attracteurs principaux à la manière de la figure3.4, des aspects non anticipés de la dynamique de l’environnement, du bruit dans la commande motrice ou des imperfections dans la perception peuvent modifier légèrement la trajectoire empruntée dans l’espace d’interaction. Tant que les attracteurs principaux ne changent pas (c’est-à-dire en l’absence de changement de phase), les interactions seront constamment régulées pour conduire aux buts implicites que définissent ces attracteurs.

La coordination décrite ci-dessus est relativement générale, on peut qualifier plus précisément les phénomènes émergents selon les types d’interactions et d’anticipations impliqués :

– On peut tout d’abord revenir sur l’exemple de préhension d’un objet pris au début de cette partie. Si des interactions simples et directes ne permettent pas d’atteindre l’objet, la trajectoire la plus courte dans l’espace d’interaction nécessitera peut-être de se tourner entièrement ou de se lever. Seuls des mouvements acquis (dont les conséquences sont anticipées) pourront participer à la trajectoire. Ainsi, il suffit parfois de peu de temps

dans l'espace d'interaction Trajectoire empruntée par l'agent

"Cible" "Origine" Temps X Y 1 2 3

Figure 3.5 – Exemple de trace de convergence globale vers un "but implicite" résultant de la coordination des anticipations. Ont été surimposées des causes possibles de variabilité locale qui écarte la trajectoire réelle (trait continu) de la ligne droite optimale : Imprécision ou1 trop faible nombre d’anticipations. Contraintes non anticipées de l’environnement tel qu’un2 obstacle (rectangle en pointillés) empêchant le mouvement spontané de l’agent. Émergence3 d’oscillations rapides provenant de la dynamique des propagations et des délais dans la boucle sensori-motrice.

pour apprendre à soulever une charge lourde sans se blesser, mais les bons mouvements sont rarement utilisés par le novice, qui sous-exploite certains membres ou se positionne mal.

– Si la trajectoire la plus simple intègre des interactions avec un outil, celui-ci sera utilisé dans le comportement global. Ainsi les limites du système ne se réduisent pas au corps physique de l’agent. Le concept d’outil peut ainsi être défini par l’ensemble des interactions qui le coordonne avec l’activité du sujet (le prendre, le manier, le poser). Il n’est ainsi ni une partie du corps (car seulement présent dans une petite partie de l’espace d’interaction) ni un objet quelconque (qui ne participe pas à d’autres activités).

– Si une sensation physique stable (telle la présence d’une neurohormone associée à la soif) active une partie de l’espace, l’agent ne pourra échapper à son pouvoir attracteur quelles que soient ses actions. Si le temps aidant, elle devient l’attracteur principal du système dynamique, toute l’activité de l’agent se concentrera sur la satisfaction du besoin. La satisfaction de besoin dits "vitaux" nécessite la plupart du temps la coordination du méta-bolisme (sur lequel on n’a que peu de contrôle) et d’interactions qui sont loin d’être innées ou immédiates (l’ouverture d’un réfrigérateur ou d’un robinet par exemple...).

– Même si le modèle actuel reste à un niveau sensori-moteur, toute planification s’exprime comme la coordination de moyens pour atteindre un but, quel que soit leur niveau d’abs-traction. La majorité des comportements humains sont mêmes une combinaison d’abstrac-tions et d’interacd’abstrac-tions physiques. On peut penser à la lecture d’instrucd’abstrac-tions pour monter un meuble en kit ou ouvrir un emballage.

– Tout acte de langage peut-être également interprété dans les mêmes termes. La question "Pouvez-vous me passer le sel ?" est un des nombreux moyens d’obtenir le sel, et on n’a pas besoin d’en connaître la sémantique exacte pour l’utiliser. On pourrait tout aussi bien se lever pour aller le chercher, mais ce comportement est contraint par des règles de politesse et d’autres abstractions. L’action est ici verbale et effectuée sur un environnement com-posé d’individus humains dont la réaction est prédictible. On n’anticipe pas une réponse

verbale positive, mais une action physique.

Même si tous les comportements théoriquement couverts par ce modèle de coordination n’ont pas été testé, l’utilisation d’une coordination implicite basée sur l’activité pour déterminer les actions à effectuer permet de mêler dans une même dynamique des besoins ancestraux et des abstractions construites pendant la vie.