• Aucun résultat trouvé

Systèmes Multi-Agents réactifs et cognitifs : différences et similitudes

DE LA CONCEPTION DES SMA

1. La dialectique Réactif / Cognitif

1.1. Systèmes Multi-Agents réactifs et cognitifs : différences et similitudes

Nous avons déjà partiellement abordé les deux notions classiques de “réactif” et “cognitif”. Or la validité et la pertinence de cette distinction sont largement discutées et controversées. Nous proposons donc quelques éléments devant permettre d’en mesurer l’intérêt éventuel selon les différents paramètres intéressant l’ingénieur.

En l’absence de réflexion approfondie, et pour la plupart des chercheurs familiers de ces concepts, la catégorisation est facile et immédiate. A la lecture d’un article décrivant un système multi-agent ou un aspect s’y référant, on identifie très vite une “approche cognitive” lorsqu’on rencontre des mots-clés comme “représentation”, “connaissance”, “raisonnement”, “plan”, “stratégie”, ou “logique”. Cette catégorie est en général implicite. A l’inverse, pour des articles assez récents (après 1991 : Demazeau, Müller, 1991, “From reactive to intentional agents”), l’approche réactive est rendue explicite, et en général on la confirme immédiatement par les classes d’exemples retenus (la fourmilière constitue la métaphore reine) ou d’après les références peu nombreuses dans ce domaine. De façon générale, l’approche réactive rejette le paradigme "représentationnaliste" et fait appel à des modèles comportementaux très simples, souvent qualifiés de “sensori-moteurs”, en ce qu’ils décrivent la sélection d’actions directement à partir des percepts instantanés. On cite aussi souvent l’absence de mémoire comme caractère distinctif (ce critère est cependant trop imprécis car la plupart des systèmes sont au moins markoviens : la variation d’état dépend de l’état lui-même).

Dans le modèle d’agent réactif que nous proposons dans cette thèse, l’espace d’état des agents peut être quelconque (p.e. {position} x {couleur}). Le changement d’état est évalué à partir de l’état courant de l’agent, de l’état d’un certain voisinage dans l’environnement, et de l’état de certains autres agents. La sélection du voisinage atteint et des agents pris en compte, est contrôlée par des filtres posés a priori ; de même que la fonction d’activation finale est elle aussi donnée. Il n’y a pas de mécanisme de perception en tant que tel, ni de communication. L’état du monde est directement intégré dans la dynamique locale via les filtres, qu’il s’agisse de l’environnement ou des autres agents. Le passage par des “actions” de perception ou de communication n’est ici pas nécessaire puisque la finalité est de produire de façon externe une dynamique globale du système. A notre sens ces agents sont réactifs tout simplement car la taille de l’automate nécessaire pour les implémenter est strictement constante. Il n’y a que des variations de leurs différents attributs internes. Dès

lors cela suppose que tout état que l'on peut atteindre est connu a priori sans recours à une combinatoire complexe. En ce sens, l’émergence de formes utilisée par la résolution n’est pas ouverte, comme par exemple dans la production automatique de discours.

Ce modèle est-il généralisable à un cadre “cognitif” ? Sans doute, mais il faut préciser ce qui est symbolique. On peut tout d’abord utiliser un environnement (un jeu de données) symbolique, et donc constitué d’un ensemble d’assertions ou de mots. La structure de cet environnement doit cependant être bien défini : s’agit-il d’un lexique, d’un texte linéaire, d’un environnement hypertexte ? Dans chacun de ces cas, il existe une topologie utilisable par l’agent lors de ses accès à l’environnement. D’autre part, l’espace d’état de l’agent aussi peut être “symbolique”. L’état de l’agent est alors donné par une collection d’assertions avérées. Les opérateurs de changement d’état doivent alors produire de nouvelles assertions ou en infirmer certaines. Le mécanisme globalement mis en oeuvre consiste alors pour chaque agent à successivement explorer dans l’environnement les éléments symboliques accessibles, puis ceux traduits par l’état des agents accessibles, et finalement d’en inférer un nouvel état. On ne précise pas ici la nature des opérateurs de changement d’état, mais pour valider ou invalider des assertions symboliques on fait logiquement appel à des moteurs... logiques. En résumé, si on compare cette approche à un système à base de connaissance classique, utilisé pour la résolution de problèmes, on observe que chaque agent fonctionne avec son propre moteur d’inférence, qui utilise à la fois ses connaissances propres (son état), des connaissances issues de l’environnement (les données du problème, par nature intangibles), et des connaissances disponibles auprès d’autres agents. Les filtres d’accès, spécifiques de notre approche, sont utilisés pour contrôler la partie de l’environnement qui est accessible, et donc sélectionner des connaissances considérées en fonction de l’état de l’agent, de même que pour choisir d’autres agents pris en compte. Si on complexifie, on peut utiliser les mécanismes d’adaptation des filtres décrits par ailleurs (cf. « Evolution Locale et Sociale : méthodologie de recherche de solution", p. 143), et on a alors une heuristique implicite d’exploration adaptative des bases de connaissances.

Sommes-nous alors en présence d’un système multi-agents cognitifs ? Probablement, dans la mesure où on dispose de connaissances, où on les manipule, où on en produit éventuellement d’autres par combinaison, et où par ailleurs on gère des accès différenciés entre les agents et vers l’environnement. De plus on utilise éventuellement des stratégies

Modèles Multi-Agents pour l’Aide à la Décision et la Négociation en Aménagement du Territoire

110 collectives transcrites dans les mécanismes adaptatifs des filtres. Il n’y a en revanche pas de représentation ni a fortiori de raisonnement sur l’état des autres.

On a donc un glissement progressif vers un modèle de type cognitif, en conservant la structure et le processus de calcul, et en changeant seulement la nature des espaces d’évolution. Cette analogie reste cependant très théorique, car fondamentalement on a permis l’explicitation de connaissances sur le problème dans un langage dont la manipulation est l’objet même du processus. Or l’approche réactive utilise la structure du problème et de la solution recherchée, et les transcrit dans les espaces d’état pour contraindre ainsi l’émergence. La représentation du problème ne se fait donc pas de façon symbolique (par le langage), mais analogique (par une structure mise en correspondance).

Plus généralement, le domaine des systèmes multi-agents devrait recouvrir uniquement les systèmes présentant des propriétés complémentaires résultant spécifiquement des interactions entre les agents, et en particulier qui ne sont pas spécifiées a priori et activées de façon opportuniste. Notre hypothèse est qu’en matière de résolution de problèmes, les systèmes cognitifs sont souvent trop séquentiels et restreints (faible nombre d’agent et caractère préemptif) pour présenter de réelles propriétés émergentes. A cet égard il ne constituent bien souvent qu’une tentative de parallélisation de processus réalisables de façon classique. Les travaux spécifiques abordant la coordination, la négociation entre agents, la représentation mutuelle, et l’élaboration de modèles sociaux, ne sont pertinents que pour des contextes temps réel ou des environnements ouverts. En clair, l’apport spécifique des SMA pour la résolution de problèmes doit provenir de l’émergence et de son contrôle, et donc être issu des systèmes à dynamique ouverte.

Dans cette partie relative à nos propositions sur le débat réactif / cognitif et simulation / résolution, nous avons précisé que nous envisagions la résolution de problèmes essentiellement comme une transcription dans un espace adéquat au sein duquel des agents vont évoluer jusqu’à atteindre un attracteur représentatif d’une solution. Le problème est alors d’obtenir la convergence et de contrôler l’émergence. A cet effet nous introduisons des notions de filtrage éventuellement adaptatif. Et par ailleurs nous avons avancé que la complexification des modèles d’agents et le passage au symbolique étaient justifiés lorsqu’on souhaitait simuler des processus sociaux réels, et en particulier des processus humains, ce qui est un des objets de cette thèse. Quand tel est le cas, nous avons insisté sur l’importance d’une référence et d’une utilisation des travaux des domaines spécifiques, que

ce soit la psychologie et la sociologie pour les systèmes sociaux humains, ou l’écologie ou l’éthologie pour les écosystèmes (ou l’économie, ou la physique, ou la mécanique, pour les différents systèmes cibles).