Environnement et simulation - La simulation multi-agents

1.3 La simulation multi-agents

1.3.4 Environnement et simulation

Jusqu’à maintenant nous avons énoncé le terme environnement, mais aucune contrainte ou descriptif de l’environnement n’ont été donnés. Si on reprend la définition d’un agent de Weiss [Weiss, 2000] (“a computer system that is situated in some environment, and that is capable of autonomous action in this environment in order to meet its design objectifs.”), un agent est situé dans un environnement et agit dans cet environnement (figure 1.6). Malgré qu’aucune spécification ne soit donnée pour l’environnement dans cette définition, un agent ne peut exister sans environnement.

Bien que la communauté SMA n’ait pas porté son attention sur le rôle de l’environnement et par la même n’avait pas fourni de cadre formel pour l’environnement, il a récemment été formalisé par, en partie, la communauté E4MAS (Environment For Multi- Agent Systems ). De ce groupe de travail, une définition de l’environnement a été proposée [Weyns et al., 2007] :The environment is a first-class abstraction that provides the surroun- ding conditions for agents to exist and that mediates both the interaction among agents

and the access to resources. 4

[Odell et al., 2002] insistent également sur le fait que l’environnement définit les conditions dans lesquelles les agents existent dans le système multi-agents. Mais avant cette volonté de formaliser l’environnement et de le considérer comme une composante à part entière du système et nécessitant d’être formalisée, l’environnement se résumait à suppo- ser que ”l’environnement est ce qu’il est” et dans cette optique se réduisait essentiellement `

a être une infrastructure dans l’ingénierie. Plus récemment, la place de l’environnement dans le système s’est précisée et l’environnement est reconnu comme une composante es- sentielle du système devant être pris en compte dans la phase de modélisation. Russell et Norvig, dans [Russell and Norvig, 1995], et Weyns et al, dans [Weyns et al., 2005c] [Weyns et al., 2005a], identifient les responsabilités de l’environnement.

Les propriétés générales de l’environnement

En temps que composant dynamique d’un système, l’environnement possède plusieurs caractéristiques particulières.

Accessible/inaccessible Un environnement accessible est un environnement dans lequel un agent peut obtenir une information complète, précise, exacte et mise à jour de l’état de l’environnement. La majorité des environnements modérément complexes sont inaccessibles. Par modérément complexe, on peut inclure, par exemple, le monde réel et Internet. Plus l’environnement est accessible et plus simple est la construction d’un agent par son concepteur.

Déterministe/non-déterministe Un environnement déterministe est un environnement dans lequel n’importe quelle action d’un agent a un seul effet garanti. Ce qui veut dire qu’il n’y a pas d’incertitude résultant d’un nouvel état de l’environnement suite à cette action. Le monde réel peut être considéré comme indéterministe. Les environnements non-déterministes posent davantage de problèmes pour les concepteurs de SMA.

Episodique/non-épisodique Dans un environnment épisodique, la performance d’un agent est dépendante d’un nombre d’épisodes discrets sans lien avec l’exécution de l’agent dans différents scénarios. Les futures évolutions du système ne vont pas dépendre des actions déjà réalisées Un exemple d’environnement épisodique serait un système de tri de courriers électroniques. Les environnements épisodiques sont

4_{L’environnement est une abstraction de premier ordre qui fournit les conditions pour que les agents}

1.3. La simulation multi-agents

plus simples du point de vue des développeurs de SMA, du fait que l’agent peut décider de l’action à exécuter en se basant seulement sur l’épisode courant. Il n’a pas besoin d’interaction entre l’épisode courant et les épisodes futurs.

Statique/dynamique Un environnement statique est un environnement dont le passage d’un état à un autre est régi uniquement par l’exécution d’une action par un agent. A l’opposé, un environnement dynamique est un environnement qui a d’autres processus agissant sur lui, et qui risque de subir des changements au détriment de la volonté de l’agent. Le monde réel est un environnement hautement dynamique.

Discret/continu Un environnement est discret s’il comporte un nombre fixe et fini d’actions et de perceptions possible. Russel et Norvig donnent deux exemples d’environnement discret et continu :

– Discret, un jeu d’´echec,

– Continu, la conduite d’un taxi.

L’approche discrète modélise l’environnement sous la forme d’un ensemble de cellules qui représente la topologie de l’environnement spatial où les agents situés vont évoluer. L’avantage de cette dernière est d’être relativement simple à mettre en oeuvre et permet de définir de manière rapide des contraintes sur les perceptions et actions des agents en terme de nombre de cellules. Par ailleurs, le concepteur a la possibilité d’allouer des propriétés à ces cellules. Par exemple, dans le cas de la stigmergie avec l’évaporation des phéronomes, un coefficient d’évaporation peut être associé aux cellules et dans ce cas l’environnement gère de manière dynamique et simple ce phénomène. D’après Parunak [Parunak, 2003], la stigmergie est une méthode de communication où un individu communique avec un autre individu du système en modifiant leur environnement local dans lequel ils évoluent. L’inconvénient majeur de cette modélisation spatiale de l’environnement est le manque de représentativité de l’ensemble des cellules en terme de niveaux de détails pour les agents. En effet, dans tous les cas la granularité la plus basse est celle de la cellule.

Avec l’approche continue, l’agent devient le référentiel à partir duquel le champ de perception et la portée de l’action sont évalués. On peut alors parler d’individualisation du traitement de l’agent. Les classes d’environnement les plus complexes sont celles qui sont inaccessibles, non déterministes, non-épisodiques, dynamiques, et continues. Les différents points abordés précédemment énonce des caractéristiques générales de l’environnement, mais on peut se demander ce qu’il en est pour la simulation et quel rôle joue exactement l’environnement dans la simulation voir plus formellement dans la modélisation ?

Le rˆole de l’environnement

La figure 1.6 qui définit un agent, illustre parfaitement qu’un agent évolue dans un environnement et agit sur ce dernier à l’aide d’“actionneurs”. L’environnement devient alors une composante à part entière du SMA [Russell and Norvig, 1995] [Decker, 1995]. Par la suite, en plus de fournir un cadre qui délimite l’existence des agents, l’environnement peut rendre différents services aux agents pour la simulation [Weyns et al., 2005a]. À partir du moment où l’environnement propose un certain nombre de services et dispose d’une dynamique propre à lui-même, il devient une entité active du systèmes multi-agents. Plus précisément, il est considéré comme une entité commune et intermédiaire au système ce qui implique de le prendre en compte lors de la modélisation et de la mise en oeuvre du modèle dans le simulateur. Dans cette continuité, Parunak définit l’environnement comme un tuple < E, P > où E désigne l’ensemble des valeurs caractérisant l’environnement et le processus P définit la dynamique de l’environnement. L’environnement est alors considéré comme une entité active du SMA [Parunak, 1999]. Dans la littérature, des classifications ont été proposées pour positionner au mieux les services que l’environnement peut encapsuler en tant qu’entité active du système. On peut citer celle de Platon et al. [Platon et al., 2007a] qui distingue les services relatifs à la médiation des interactions, des services dépendant de la gestion des ressources et du contexte. Nous allons privilégier la distinction opérée par Weyns et al [Weyns et al., 2007] qui se référence plutôt à la nature des agents du système. Il distingue alors le rôle que peut jouer l’environnement dans les systèmes d’agents situés de celui dans les systèmes d’agents cognitifs.

Considérons le cas des systèmes d’agents situés où les agents exécutent des actions situées [Ferber and Müller, 1996] [Weyns and Holvoet, 2004] [Maes, 1990]. L’environnement est un “monde extérieur”dans le sens où l’environnement ne fait pas partie du modèle, ni de l’architecture. Mais il est “extérieur” au système. Un domaine d’application de ce principe est le domaine de la robotique [Maes, 1990] [Rosenblatt and Payton, 1989]. L’environnement est un support de coordination pour coordonner les agents à partir de ce qu’ils per¸coivent de leur environnement commun, e.g. la stigmergie avec les phéromones ou le gradient field [Weyns et al., 2006]. L’environnement fournit une architecture qui encapsule les primitives de perception, la transmission des messages des agents, la défi- nition de “lois” qui conditionnent l’exécution de l’agent, et le processus de gestion de sa dynamique indépendamment des agents.

Considérons le cas des systèmes d’agents cognitifs. L’environnement est un objet et un moyen de communication. Il joue alors le rôle d’infrastructure spécifiant des protocoles de communication et d’interaction auquel un objet de stockage peut être intégré. L’en-

1.3. La simulation multi-agents

vironnement fournit une couche organisationnelle. Il encapsule alors des primitives pour la gestion d’organisation, de groupe et de role [Gasser, 2001]. L’environnement sert d’infrastructure de coordination, e.g. Linda [Carriero and Gelernter, 1989], LIME [Murphy et al., 2001], TuCSon [Omicini and Zambonelli, 1999].

Après avoir identifié les rôles que l’environnement peut assurer au sein d’un système multi-agents, Weyns et al décompose l’environnement en 3 niveaux : 1/ le niveau bas- level, qui possède les primitives d’accès au contexte de déploiement pour les agents ; 2/ le niveau d’abstraction, qui joue le rôle d’interface entre le niveau d’abstraction nécessaire aux agents et le contexte de déploiement ; 3/ le niveau d’interaction et de médiation qui propose un support pour réguler l’accès aux ressources partagées et qui sert de médiateur pour gérer les interactions. Le premier niveau correspond au contexte de déploiement et les deux derniers niveaux sont relatif à l’environnement d’appplication.

1.3.4.1 Les responsabilit´es de l’environnement

La première responsabilité de l’environnement est de structurer l’ensemble du système en assurant son intégrit´_{e. Par exemple, dans le projet GranuLab [Breton et al., 1999]} [Breton, 2002], les agents grains disposent de trois attributs qui sont leur masse, leur rayon et leur position. La position d’un grain est forcément relative à une entité qui représente un environnement spatial et qui vérifie un certain nombre de contraintes comme le fait qu’une position ne peut pas être négative ou que deux grains ne peuvent pas avoir la même position.

De plus, l’environnement doit être capable de fournir un ensemble de services ou calculs qui seront sollicités par les agents. Par exemple, dans l’exemple préc´_{edent Granulab,} l’environnement calcule la distance qui sépare deux agents sur la requête d’un des deux agents. Plus intuitivement dans le cas d’un espace dans lequel les agents évoluent, l’environnement fournit un support de perception qui peut permettre aux agents de percevoir un sous ensemble du contexte global de l’état du système. Et l’environnement peut, en fonction des besoins et intérêts de l’agent, personnaliser la perception de son contexte en restreignant sa perception aux agents disposant des caractéristiques souhaitées. Par exemple, dans leur application E’GV, Weyns et al [Weyns et al., 2005b] ajoutent dans leur environnement virtuel un module de gestion des perceptions dont le but est de traiter les requêtes de perception de chaque agent pour leur fournir l’information adéquate. Dans Archisim, le rôle de l’environnement est de spécialiser les informations per¸cues par les agents en fonction de leur état en respectant la règle où la perception de l’environnement par un agent (qui est dispensé par le module de perception de l’environnement) diffère en

fonction de la vitesse de l’agent dans son v´ehicule.

Une autre responsabilité qui peut être allouée à l’environnement est le contrôle de l’action. En effet dans l’exemple du “Packet World” [Weyns et al., 2005d] qui est une simulation de robots transporteurs, les concepteurs définissent, à travers l’environnement dans lequel les agents robot évoluent, des règles de gestion des actions et des interactions. L’environnement est alors en charge de les mettre en oeuvre. Un autre exemple du contrôle de l’action par l’environnement est la simulation d’agents dans un réseau de bus où le but de l’environnement est de restreindre les actions et interactions des agents [Meignan et al., 2006].

L’environnement peut également être un support commun pour la communication [Saunier and Balbo, 2009] [Weyns et al., 2007] [Saunier et al., 2007]. L’environnement est alors défini comme un intermédiaire entre un ensemble d’agents du système. Pour ces agents, l’environnement est un canal commun de communication. On parle alors de communication indirecte en opposition avec les communications directes qui sont des ´

echanges pair à pair entre des agents. La stigmergie a été introduite par Grassé en 1959 [Grassé, 1959] et est un exemple d’interaction indirecte. Cette notion traduit le fait qu’au sein d’un collectif, les actions futures des agents sont influencées par les effets persistants des actions passées dans l’environnement. La notion de stigmergie peut être vue également comme un répertoire de réponses à des stimuli tel que la réponse à un stimulus transforme ce stimulus dans le stimulus suivant. Le principe de stigmergie implique que les échanges d’informations passent par une modification de l’état de l’environnement. Ce principe est appliqué dans [Sauter et al., 2008] [Panait and Luke, 2004b] [Panait and Luke, 2004a] où l’environnement est utilisé pour permettre la gestion de la propagation et de l’évaporation des phéromones dans une simulation multi-agents.

A partir du moment où l’environnement existe indépendamment des agents du sys- tème, plus précisément si l’environnement possède un processus endogène et ses propres caractéristiques, ou s’il peut exister plusieurs environnements dans un même modèle, il est nécessaire de préciser les spécifications de l’environnement au niveau du modèle opé- rationnel. Ainsi, l’environnement devient une entité à part entière, autonome avec une architecture déterminée qui lui permet d’interagir avec les agents.

1.3.4.2 Un modèle de référence pour l’environnement

Le modèle proposé par Weyns et al. [Weyns et al., 2007] repose sur la définition d’une couche d’abstraction qui permet de masquer les primitives d’interaction propres

1.3. La simulation multi-agents

au contexte de déploiement du système. Le modèle de référence pour l’environnement illustré sur la figure 1.8 est composé de trois niveaux d’abstraction : la couche physique (c’est-à-dire le contexte de déploiement du système), la couche logique (ou couche d’abstraction de l’environnement) et la couche de médiation des interactions.

Environnement d’application

perception

observation & _translation

action message

communication

synchronisation & traitement des données traitement des données

lois interaction observer données dynamique _état percept sens Agent

interactions de bas niveau Observation

des données ressource des données ressource

Observation Contexte de déploiement ensemble de lois espace de stockage module fonctionnel interface de stockage flux de données interface agent-environnemnent interaction

Fig. 1.8 – Le mod`ele d’environnement propos´e par [Weyns et al., 2007]

Nous allons maintenant décrire les différents composantes du modèle de référence. ´

etat le module état permet de représenter l’état de l’environnement avec une abstraction du contexte de déploiement comme par exemple un représentation du réseau routier synchronisation et traitement des données Ce module maintient une représenta- tion du contexte de déploiement dans le module état. Il fournit également des fonc- tions additionnelles pour adapter les capteurs au probleme.

dynamique Le module dynamique gère le processus propre à l’environnement qui en fait une entité active du système. Cette dynamique est indépendante des agents et du contexte de déploiement. Une exemple est la régle d’évaporation des phéromones.

lois Cette composant permet de prendre en compte les contraintes spécifiques à l’application qui sont relatives au interaction des agents. Par exemple, on peut modéliser une loi qui limite la perception de l’environnement pour une catégorie d’agents. perception Ce module fournit les fonctionnalités pour les agents leur permettant de

percevoir leur environnement. Le module de perception, déclenché lorsqu’un agent souhaite percevoir son environnement, génére un percept en fonction de l’état courant de l’environnement d’application et des données accessible depuis le contexte de déploiement. Ce module est contraint par le module lois.

observation et traitement des données Ce module définit les fonctionnalité pour observer le contexte de déploiement. Les données récupérées par l’observation des élé- ments du contexte de déploiement sont envoyées au module de perception après un éventuel traitement de ces dernières.

interaction Le module d’interaction gère les actions des agents sur l’environnement. Ce module doit intégrer un modele d’actions qui doivent être exécutées (par exemple le modèle IRM4S fondé sur le principe influence/réaction [Michel, 2006]). On distingue deux catégories d’actions : 1/ celles qui modifient l’environnement d’application et 1/ celles qui tentent de modifier les éléments du contexte de déploiement.

communication Le module communication assure la gestion des messages en collectant les messages et en les distribuant aux agents adéquats. Ce module peut réguler les messages échangés entre les agents à partir de l’état de l’environnement et d’un ensemble de lois. Ainsi, des protocoles de communication peuvent être définis.

Dans le document Un environnement actif pour la simulation multi-agents. Application à la gestion de crise dans les transports (Page 45-52)