Construction d’un SMA
Approche réactive: Inspiration des sociétés d’insectes
Quelques exemples
Tri collectif
Fourragement (fourmis)
Les robots fourrageurs
Applications du monde réel
• Routage dans les réseaux
• Équilibrage dynamique multicritères
• Sécurité dans les réseaux
Tri Collectif
Tri Collectif (Deneubourg & al 91)(Drogoul 93)
Problème: Trier des objets de types différents
Critère d’arrêt: structure de l’environnement avec des tas homogènes de chaque type d’objet
Principes:
Déplacement aléatoire des agents (par défaut)
Capacité de discriminer des objets à trier
Mémoire à court et moyen terme des dernières cases visitées
Possibilité de déposer/ramasser en fonction de la densité d’objets de même type (dans leurs mémoires)
Regroupement de plusieurs objets de même type sur une case réduit l’intensité du stimulus émis
Tri Collectif
Environnement : ensemble de cases contiguës
Objets:
Etat initial Etat final
Tri Collectif
Constat 1:
Structuration de l’environnement a pour effet la structuration des agents
=> focalisation des agents sur les objets non triés
Renforcement d’actions
Focalisation des agents sur certains types d’objets : spécialisation des agents
Structuration sociale
Constat 2:
Structuration sociale bénéfique à la structuration de l’environnement
Convergence plus rapide vers un tas par type d’objets
Tri Collectif
Remarques:
Pas de comportement émergent
La fonctionnalité peut-être obtenue avec un seul agent (robustesse)
En revanche, fonctionnalité amplifiée par une structure sociale émergente
=> répartition dynamique des tâches
Application (cas réel):
Organisation dynamique de documents sur le web
Approche réactive: Inspiration des sociétés d’insectes
Fourragement (fourmis)
Nid
Source Source
Source
Exploration aléatoire de l’environnement
Détection de source de nourriture
Collecte et retour en ligne droite vers le nid
Marquage du chemin de retour (phéromone)
Source
Approche réactive: inspiration des sociétés d’insectes
Fourragement (fourmis): Phénomène autocatalytique
Source
Les fourmis découvrent les chemins les plus courts de la source de nourriture au nid.
Dépôt de phéromone sur le chemin menant à la source
Plus la concentration en phéromone est élevée sur un chemin, plus il a des chances d’être emprunté
La phéromone s’évapore au cours du temps
3 mécanismes: diffusion, évaporation, enrollement
Approche réactive: inspiration des sociétés d’insectes
Fourragement (fourmis): Applications
En recherche opérationnelle : plusieurs applications
Exemple: Problème du voyageur de commerce (TSP)
Un ensemble de villes reliées entre elles par des arcs définissant une certaine distance. Le problème est de trouver le chemin minimal, permettant de ne parcourir chaque ville qu’une fois.
Méta-heuristique ACO (inspirée des fourmis)
Des fourmis sont positionnées aléatoirement sur les différents sommets
Chaque arc se voit attribuer en plus de sa longueur un taux de phéromone
A chaque itération une règle globale fait s’évaporer une quantité de phéromone et augmente le taux de phéromone des arcs contribuant au plus court chemin
Métaphore de fourragement
Robots fourrageurs (Steels 88, Drogoul 93):
Problème: équipe de petits robots autonomes qui récoltent des échantillons de minerais dans un environnement inconnu,et les ramènent à une base centrale.
=> double problème posé aux robots
Récolte d’échantillons
Recherche efficace dans l’environnement
(structuration de l’environnement en terme d’espaces explorés et non explorés)
Principes:
Populations de robots simples et autonomes
Base émet un signal d’intensité décroissante avec la distance
Source (tas) de minerais
Capacité des robots à se déplacer, ramasser des minerais, les déposer
Métaphore de fourragement
Base
Expérience 1:
Comportements du robot basique 1.Recherche aléatoire
2. Ramassage du minerai 3. Retour à la base
4. Recherche aléatoire
Constat :
Robots complètement inefficaces individuellement et collectivement
Aucune exploitation de l’environnement (mémoire) pour repérer le lieu de leur dernière récolte
=> Aucune interaction avec le groupe (échange d’info), aucune coopération
Drogoul 93
Métaphore de fourragement
Base
Expérience 2:
Partage d’info par structuration de l’environnement Les robots rentrent en ligne droite à la base en suivant le signal qu’elle émet , en marquant leur chemin
Munir les robots de la capacité de déposer des marques
Et de la capacité de suivre un chemin marqué
Constat :
Amélioration des performances
Partage effectif d’info: rétroaction positive sur le comportement global de fourragement
Pb: si minerai épuisé, les robots continuent à suivre une trace qui les mène vers une source inexploitable
(information vide de sens toujours transmise)
Drogoul 93
Métaphore de fourragement
Base
Expérience 3:
Supprimer l’info qui ne servira peut-être plus
Marquage de la piste en revenant de la source à la base
Supprimer la marque en suivant une piste
Constat :
Performances dégradées du système
Dynamique trop grande dan le partage de l’information (création/suppression au même rythme)
L’information ne se propage pas assez pour créer un effet amplificateur
Drogoul 93
Métaphore de fourragement
Base
Expérience 4:
Atténuer l’information qui ne servira peut-être plus sans complètement la détruire
Déposer 2 marques au lieu d’une en revenant de la source à la base
Supprimer 1 marque en suivant une piste
Constat :
Meilleure solution
Partage d’info souple, coopération globale
Autre constat : Baisse des performances au delà d’un certain nombre de robots
Non prise en compte des contraintes environnementales: encombrement
Dispersion des traces à cause des déviations des robots pour s’éviter
Drogoul 93
Métaphore de fourragement
Base
Expérience 5:
Ajout d’un comportement de prise opportuniste
Un robot suivant une piste vers la source et qui croise un autre robot qui en revient, chargé d’un minerai,
le détrousse.
Capture du minerai là ou il se trouve
Constat :
Meilleure solution que précédemment et surtout stabilité à partir d’une certaine densité Autres constat :
émergence d’une structure prenant la forme d’une chaîne
Taux de fréquentation des pistes bien supérieur => épuisement d’un gisement vite repéré
éparpillement des pistes marginales=> concentration de l’info là où il le faut
Structuration sociale (formation de chaîne) et spatiale (chemins optimaux) et
Drogoul 93
Approche réactive: inspiration des sociétés d’insectes
Fourragement (fourmis): Applications (Real world)
En télécommunication : routage de réseaux
En réseaux informatiques:
Equilibrage dynamique de charge
Equilibrage dynamique multicritères
En sécurité: réponse distribuée et dynamique à la détection d’intrusion
Quelques références
Russell & Norvig, A modern approach for Artificial Intelligence, Prentice Hall 1995
J. Ferber, Les systèmes multiagents, edition
Un cours sur les SMA à l’université laval (Québec) pointant vers d’autres cours:
http://www.damas.ift.ulaval.ca/~coursMAS/
Page personnelle de Marco Dorigo: http://iridia.ulb.ac.be/%7EDorigo
Quelques pointeurs vers des environnements de simulation:
Page de starlogo : http://el.www.media.mit.edu/groups/el/Projects/starlogo/
Page de swarm: http://www.swarm.org