• Aucun résultat trouvé

Types d’interactions : Les interactions représentent un mécanisme essentiel au SMA

Robotique de Groupes

4.2 Intelligence Artificielle Distribuée et Système Multi-Agents

4.2.5.2 Types d’interactions : Les interactions représentent un mécanisme essentiel au SMA

Cependant, ces interactions ne sont pas suffisantes ; elles sont à la base de relations inter-agents plus sophistiquées que de simples agissements réciproques, comme : la coordination, la coopération, la collaboration et le conflit. Avant d’entamer leurs définitions, commençons tout d’abord par introduire la relation de corrélation indispensable à l’émergence de ces interactions.

a) Corrélation : On peut déterminer (en calculant statistiquement les relations entres les

actions) si des agents sont liés sans avoir accès à leurs logiques ni au système dans sa globalité

(on a qu’a focaliser sur le comportement de ces agents). Dans tel cas, on parle alors de corrélation entre les agents. Néanmoins la notion de corrélation n’implique pas forcement l’existence d’interaction. Exemples : - soit un ensemble d’agents parfaitement identiques, plongés dans le même environnement; étant semblables et confrontés au même milieu, ils ont des comportements très similaires (en mouvements synchrones et démarrant à partir d’un même état, l’un semble l’image de l’autre). Dans ce système, on observe une très forte corrélation (ce que l’un fait, l’autre le fait aussi) malgré une absence totale d’interactions [Leg 03], - soit un labyrinthe, avec une seule entrée et une seule sortie et des passages ayant une couleur c1 ou une couleur c2 ou deux bandes juxtaposées l’une de couleur c1 et l’autre c2 et deux agents A1 et A2.

A1 ne peut se déplacer que dans le couloir de couleur c1 et A2 dans celui de c2. Les deux agents sont en relation réciproque (ils cherchent la même sortie du labyrinthe) pourtant il n’existe aucune influence des actions de l’un sur l’autre. Donc, ils sont corrélés malgré, qu’ils ne sont pas en interactions, - deux robots qui rentrent en collision permanente (interaction physique non consciente : continuent à se pousser l’un l’autre sans qu’il y est d’effets réciproques) sont en corrélation mais pas en interaction consciente/contrôlée; l’action de chacun d’eux n’influe pas sur le comportement de l’autre pour le voir changer volontairement d’attitude (malgré que physiquement il se gênent), et ceci pour la simple raison qu’aucun d’eux ne saisit les agissements de l’autre.

Si la corrélation dans les exemples précédents exprime la description d’une situation de relation réciproque en l’absence d’interactions, dans d’autres exemples elle exprime les dépendances entre les agents sur lesquels sont bâties les interactions. Dans un SMA, chaque agent est défini comme une entité autonome. Cependant, les agents ne le sont pas complètement. Pour atteindre leurs buts, ils ne possèdent pas toujours toutes les compétences et les ressources nécessaires. Il est évident qu’ils dépendent, alors, des autres agents possédant ces ressources ou compétences dont ils ont besoin. Les réseaux d’interdépendances7, exprimant la

corrélation entre les agents, ont été introduits dans ce sens. Ceci en vue de décrire les structures organisationnelles de ces agents[Gue 03].

b) Coordination : Gère lesinterdépendances entre activités. Exemples : partage de ressources, allocation de tâches ou contraintes globales à satisfaire [Mal 94].C’est aussi le processus par

7 Dans un réseau d’interdépendance, chaque nœud représente un agent et l’arc liant deux nœuds donnés représente le lien pondéré de dépendance entre deux agents. Cette pondération est quantifiée, généralement, en fonction de la quantité d’informations échangée entre les communicants ainsi que son coût [Leg 03].

Figure.4.1-Type de relations entre les actions des agents :

lorsque les agents réalisent leurs actions, les relations qui existent entre ces actions sont soit positives (favorables) soit négatives (en conflit).

lequel un ou plusieurs agents raisonnent sur leurs actions locales et sur les actions des autres (par anticipation) afin d’assurer la cohérence des actions communes [Jen 96]. D’un point de vue SMA, on peut dire que l’existence de dépendance entre : - les buts8 (compatibles ou non), - les

compétences9 ; actions/plans (suffisante/non), et - les ressources10 (suffisantes/non) des agents poussent ces derniers à vouloir se coordonner. La combinaison de ces différents paramètres donne lieu à des situations d’interactions. On parle, aussi, de coordination dans un ensemble d’agents si et seulement si : - ces agents interagissent, et - une partie au moins de ces interactions prend la forme de transmission d’information via un langage. Exemple : les abeilles utilisent les mouvements de leur corps afin d’indiquer à leurs congénères la position des sources de nourriture [Von 93]. Dans ce cas, la coordination est définie comme des interactions associées à de la communication. Il est donc loisible d’admettre que, la coordination est un concept liée à des capacités cognitives des agents. Le transfert d’informations ne se différencie d’une simple suite d’actions que par la capacité des agents à décoder son contenu ; pour que des agents soient capables de coordination, ils doivent avoir été conçus dans cette perspective.

Exemple : deux agents peuvent interagir, en se gênant mutuellement, ils peuvent êtres

conscients de cette gène mais sans avoir de plan pour l’éviter [Leg 03].

La manière la plus simple de concevoir un agent est de le doter d’un ensemble de règles sensorimotrices décrivant complètement son comportement. On parle alors d’agent réflexe ou encore d’approche comportementale [Bro 86]. La différence fondamentale entre l’approche classique et l’approche comportementale tient aux symboles. L’approche classique donne une représentation symbolique de l’environnement où l’agent est plongé via les sorties de ses capteurs. L’agent manipule ensuite ces symboles en interne grâce à un modèle décrivant le monde et décide de ses actions (représentation offline du monde). Dans l’approche comportementale, le monde est perçu directement tel qu’il se présente (représentation online

du monde). Dans sa version la plus simple (voir Figure.4.2.a), cette approche ne comporte pas d’état interne, les sorties des capteurs sont directement traitées par de simples circuits électriques qui calculent en continu le signal à envoyer aux actionneurs.

Il est possible d’adjoindre des états internes à un agent reflexe/réactif afin de rendre son comportement plus sophistiqué (voir Figure.4.2.b). Exemples : Soit un robot réactif A à la poursuite d’une cible mobile B, avec un principe de fonctionnement simple, toujours avancer vers B, si à un instant donné A ne perçoit plus B (à cause d’un obstacle par exemple) il risque de s’arrêter sur place (la source de ses réactions n’étant plus perçue) alors que si A continue à se déplacer, B finirait, probablement, par réapparaître.

8

But : état possible de l’environnement ou de l’agent lui-même à vouloir ressortir via une suite d’actions. 9

Compétence : une connaissance plutôt professionnelle (savoir, savoir-faire, savoir-être) mobilisable, tirée de l'expérience et nécessaire à l'exercice d'une activité. C’est aussi la capacité d’agir directement ou selon un plan d’action.

Figure.4.2-Architecture réactive d’un agent : (a) sans états internes, dans ce cas l’agent est

dit à réflexes simples. L’agent construit une représentation du monde à l’aide de perceptions parvenues de ses capteurs. Par la suite, il utilise ses règles pour choisir l’action qu’il doit effectuer selon ce qu’il perçoit de l’environnement. (b) avec états internes, l’agent conserve une trace du monde ; Il utilise ses informations internes (état précédent du monde, l’évolution du monde et l’impact de ses actions) pour mettre à jour ses perceptions actuelles. Par la suite, il choisit ses actions en se basant sur cette perception « améliorée » du monde qui l’entoure. Après exécution de l’action, son état actuel devient alors son état précédent.

120 En dotant A d’un seul état interne, exprimant la dernière position connue de B, on peut rendre son comportement plus robuste. Notons que malgré leur principe de fonctionnement simple, un groupe d’agents réactifs peuvent faire émerger des comportements collectifs complexes. Il est possible de modéliser le comportement de sociétés animales par des SMAs composés d’agents réactifs simples, comme le fourragement chez les fourmis [Top 99]. Les communications, dans ce type d’architecture réactive permet à chaque agent d’avoir une idée sur les états internes des autres agents. Pour des groupes de robots autonomes et mobiles il est possible de réaliser, via cette architecture, des tâches comme le déplacement des objets, le maintient de formation (maintient de la position et de la distance référencée : - par rapport au centre de la formation, - par rapport au meneur, ou - par rapport au voisin), la poursuite de cibles, le regroupement/tri d’objets et l’exploration de terrains inconnus [Leg 03].

Pour d’autres, la coordination d’actions est l’ensemble des activités supplémentaires qu’il est nécessaire d’accomplir dans un environnement multi-agents et qu’un seul agent poursuivant les mêmes buts n’accomplirait pas. On peut distinguer la coordination par synchronisation, la coordination par planification, la coordination réactive et la coordination par réglementation. Elles s’intéressent à la manière dont les actions des agents sont organisées dans le temps et dans l’espace pour accomplir les buts. Lorsqu’un conflit apparaît entre deux ou plusieurs agents, il y a deux méthodes pour le résoudre : l’arbitrage ou la négociation ; l’arbitrage consiste à définir des règles de comportement qui agissent comme des contraintes sur l’ensemble des agents. Le résultat global a pour effet de limiter les conflits et donc d’empêcher la déstabilisation du système. La résolution de conflits suppose, pour un agent cognitif, une négociation afin de venir à bout du conflit. Pour un agent réactif, ce sont les règles aux niveaux des agents qui doivent l’éviter.

Dans les SMAs situés où les agents sont autonomes, capables d'interagir avec un environnement dynamique dans lequel ils doivent poursuivre des buts parfois contradictoires pour survivre. Cette propriété, se préoccupe d'abord des comportements adaptatifs simples avant de s'intéresser à l’aspect cognitif ; elle privilégie les interactions qu'un agent entretient avec son environnement, via ses senseurs et effecteurs. La dynamique de ces interactions structure l'agent et structure son monde. L'intelligence d'un agent situé ne découle pas nécessairement de ses représentations symboliques, mais elle lui vient de ses interactions avec le monde, de la nécessité de prendre en considération la partie de l’environnement qu’il perçoit actuellement pour décider spontanément de la prochaine action à effectuer. L’environnement constitue un composant central au système. Dans ce contexte, les agents situés utilisent l’environnement comme moyen d’interaction et aussi comme support d’inscription des effets de leurs actions. Ceci n’est autre que l’appellation de stygmergie définie par Grassé en 1984 comme suit : la coordination des taches et la régulation des constructions ne dépendent pas directement des ouvriers, mais des constructions elles-mêmes. L’ouvrier ne dirige pas son travail, il est guidé par lui [Gra 84].

c) But : Si, en générale, les interactions via une architecture réactive conditionnée sont à la

base de la coordination, il est nécessaire de les enrichir avec d’autres mécanismes afin de pouvoir les exploiter dans des tâches plus élaborées, et de s’adapter à de nouvelles situations. Pour se faire, il faut que les agents soient dotés de buts [Fod 87]. Un but est un état possible de l’environnement de l’agent qu’il tente, compte tenu de ses connaissances (y compris celles concernant son environnement) et de ses compétences, d’y parvenir via ses actions. Le but, ainsi défini par le concepteur, n’est pas apparent pour un observateur. Donc, dès qu’un agent est conçu pour accomplir une tâche, il est considéré comme ayant un ou plusieurs buts. Ceci n’est pas le cas d’un agent réactif, dont les comportements sont pilotés par des règles qui peuvent lui permettre, éventuellement, d’atteindre les buts de son concepteur (transition de l’environnement vers des états spécifiques).

d) Coopération : On dit qu’il y a coopération entre les agents dans un environnement donné si

et seulement si - ces agents interagissent, et - sont dotés de buts. Dans un SMA coopératif, si les agents sont plutôt cognitifs, ils possèdent un modèle de leur environnement et donc des autres

agents qui y opèrent. Ainsi, même si les agents n’œuvrent pas en commun, ils tiennent compte les uns des autres pour déterminer leur comportement. Les activités conjointes des agents donnent donc au système un comportement global harmonieux ou du moins rationnel.

Dans un système coopératif, les agents se perçoivent les uns les autres de manière directe ou à travers les effets de leurs actions. Ces informations sont utilisées pour mettre à jour les modèles des autres agents dont dispose chacun. On peut donc considérer qu’il y a des transferts d’informations entre des agents coopérant au-delà de simples interactions. Ce qui amène à conclure que la coopération implique la coordination. Notons que les agents dans ce cas sont plutôt délibératifs.

La coopération est définie par certains auteurs comme étant une forme d’interactions. Elle consiste à établir qui fait quoi, avec quels moyens, de quelle manière et avec qui. Elle envisage d’apporter des solutions aux différents sous-problèmes posés [Fer 95][Leg 03].

Agent délibératif (dit aussi cognitif ou rationnel) : possède un modèle du monde, qui lui

permet de prédire l’évolution de son environnement, ainsi qu’un modèle de ses actions, qui lui permet de prédire l’effet de ses actions sur cet environnement (ces deux modèles opèrent sur des représentations internes de l’environnement). Le principe de l’architecture délibératif se résume à : - percevoir, - modéliser, - planifier, et - agir. Un agent délibératif perçoit son environnement, il est capable de mettre à jour un modèle de cet environnement pour prédire son évolution, il planifie ses actions dans l’optique de satisfaire ses buts et il agit en fonction de ces plans. Pour permettre à un agent de choisir ses actions, l’architecture délibérative (voir Figure.4.4) utilise le principe de la recherche dans un graphe. Ce graphe est construit grâce aux modèles dont l’agent dispose, avec comme état de départ la représentation courante que se fait l’agent de son environnement (voir Figure.4.3). Les modèles du monde et des actions sont utilisés pour générer les futurs mondes possibles sous l’hypothèse des différents enchaînements d’actions envisageables par l’agent. Ces mondes possibles sont comparés aux buts de l’agent pour choisir l’action qui amène au monde possible, correspondant aux buts ou s’en rapprochant le plus.

La différence tient d’une part à la complexité des règles, et d’autre part à la nature des états internes. Un agent réactif n’a que des états internes statiques de type « dernière position de la cible», tandis qu’un agent délibératif manipule des structures de données de manière dynamique

Figure.4.4-Architecture délibérative :

elle décrit la structure d’un agent basé sur les buts. Il est identique à l’agent réactif ; gardant une trace du monde, sauf qu’il se projette dans le futur pour voir l’impact de ses actions et qu’il choisit ses actions en se basant sur ses buts, contrairement à l’agent réactif qui ne faisait qu’appliquer des règles prédéfinies pour relier ses perceptions à ses actions. Notons qu’une fonction de satisfaction est aussi importante à prendre en compte si on cherche de la qualité dans l’action à entreprendre.

Figure.4.3-Graphe d’états : Chaque nœud du graphe représente

un état possible du problème et les arêtes les transitions possibles entre ces états. À partir d’une représentation d’un état de départ, il s’agit d’inventorier les modifications possibles sur cet état, de déterminer les états qui en résultent, et de continuer ainsi récursivement jusqu’à obtenir un état qui correspond à la solution du problème. Il suffit alors de « remonter » depuis le but pour obtenir une séquence d’«actions » ou planification qui résout le problème (partie sombre sur la figure).

122 en mémoire. Cette dernière propriété, qui fait la force de l’architecture délibérative, peut avoir des conséquences néfastes, car si cette approche permet de résoudre tout problème formalisé, encore faut-il en avoir le temps et la place mémoire [Pyl 87].

e) Collaboration : On dit qu’il y a collaboration entre agents dans un environnement donné, si

et seulement si - les agents coopèrent, et - s’ils sont dotés de mêmes buts. Dans un SMA, on parle souvent d’un ensemble d’agents collaborant comme d’une équipe. Exemple : une équipe de sport collectif. Dans un tel groupe d’agents, chaque joueur a comme but que son camp gagne. Dans une organisation multi-agents les mécanismes de communication et d’interaction sont importants aussi bien à l’existence de l’agent qu’à celle du groupe; la présence d’un agent n’a de sens que dans son environnement et l’existence du groupe émerge des existences de ses éléments (voir Figure.4.1) [Wei 99]. Pour d’autres auteurs la collaboration est une forme d’interaction qui étudie la manière de diviser le travail entre plusieurs agents.

f) Conflit : On dit qu’il y a conflit entre agents dans un environnement donnée si et seulement

si - les agents coopèrent, et - s’ils sont dotés de buts incompatibles à un instant donné [Deh 03]. Pour d’autres auteurs il y a conflit si les buts des agents sont incompatibles et les agents n’ont, par définition, rien de plus important que leurs buts.

4.2.6 Communication

C’est un ensemble d’actions qui donnent la possibilité à un agent de transmettre une information à un autre agent, par un langage articulé ou par d’autres codes. En générale, la communication désigne l’ensemble des processus physiques et psychologiques par lesquels s’effectue l’opération de mise en relation d’un émetteur avec un ou plusieurs récepteurs, dans l’attention d’atteindre certains objectifs [Anz 68].Elle est considérée comme une forme d’action particulière qui, au lieu de s’appliquer à la transformation de l’environnement, modifie les représentations mentales des agents (comme les buts et les croyances). Donc, la communication dans un univers multi-agents n’est plus une simple tâche d’entrées/sorties, mais doit être modélisée comme un acte pouvant influer sur l’état des autres agents. Dans ces conditions, les processus physiques désignent les mécanismes d’exécution des actions (l’envoi et la réception de messages), les processus psychologiques se rapportent aux transformations opérées par les communications sur les buts et les croyances des agents. Notons que la communication est développée dans la majorité des systèmes multi-agents sans fondement théorique ; elle dépend, plutôt du domaine d’application. Généralement les agents communiquent pour synchroniser leurs actions et pour résoudre des conflits de ressources, de buts ou d’intérêts. Ils communiquent aussi pour s’aider mutuellement et combler les limites de leurs champs de perception ; un agent ne peut être en relation avec tous les autres agents ni être équipé de tous les capteurs nécessaires à la connaissance de l’environnement global.

Il se présente des circonstances où les agents ont besoin de communiquer pour trouver , soit une réponse à leur problème, soit une issue à leur situation difficile, soit pour éviter de se perdre en suppositions. C’est alors qu’ils communiquent lorsqu’ils sont face à un problème qu’ils ne savent pas résoudre (à cause d’un manque de ressources ou de compétences), ou lorsqu’il est

Figure.4.5-Types d’interactions : pour que des

agents puissent interagir, ils doivent être en relation réciproque (un exemple de relation non réciproque est le fait qu’un prédateur épie sa victime). Si une partie des interactions entre agents est concrétisée via des transmissions de messages on parle alors de coordination. Le fait que ces agents soient dotés de buts transforme la coordination en coopération, et selon que ces buts soient compatibles ou non on parle et on qualifie, respectivement ceci de : collaboration ou de conflit.

nécessaire de coordonner leurs actions, ou encore lorsqu’il y a un conflit entre plusieurs agents et que ce conflit ne peut pas être résolu de façon déterministe. Les communications peuvent être diffusées à l’ensemble des agents ou dédiées à des agents en particulier.

Les procédures de communication pour véhiculer les messages (porteurs d’informations ou d’actions) entre agents s’accomplissent par : - envoi de messages (généralement les messages sont asynchrones, placés dans une mémoire-tampon sans attente de réponse, mais en indiquant à qui doit être retournée la réponse. Chaque agent sait aussi comment réagir à chaque message)

[Ouz 96], ou - par partage d’informations (boite au lettre ou tableau noir munis d’un dispositif de contrôle gérant les conflits d’accès) [Nii 86].

Pour communiquer, les agents utilisent un protocole permettant de structurer et d’assurer l’efficacité et la conformité des échanges entre le début d’une communication et sa fin. La nature de ces échanges dépend des capacités des agents à émettre des informations et de leur