• Aucun résultat trouvé

Construction d’un SMA

N/A
N/A
Protected

Academic year: 2022

Partager "Construction d’un SMA"

Copied!
19
0
0

Texte intégral

(1)
(2)
(3)

Construction d’un SMA

(4)

Approche réactive: Inspiration des sociétés d’insectes

 Quelques exemples

 Tri collectif

 Fourragement (fourmis)

 Les robots fourrageurs

 Applications du monde réel

• Routage dans les réseaux

• Équilibrage dynamique multicritères

• Sécurité dans les réseaux

(5)

Tri Collectif

 Tri Collectif (Deneubourg & al 91)(Drogoul 93)

Problème: Trier des objets de types différents

Critère d’arrêt: structure de l’environnement avec des tas homogènes de chaque type d’objet

Principes:

Déplacement aléatoire des agents (par défaut)

Capacité de discriminer des objets à trier

Mémoire à court et moyen terme des dernières cases visitées

Possibilité de déposer/ramasser en fonction de la densité d’objets de même type (dans leurs mémoires)

Regroupement de plusieurs objets de même type sur une case réduit l’intensité du stimulus émis

(6)

Tri Collectif

Environnement : ensemble de cases contiguës

Objets:

Etat initial Etat final

(7)

Tri Collectif

Constat 1:

 Structuration de l’environnement a pour effet la structuration des agents

=> focalisation des agents sur les objets non triés

 Renforcement d’actions

 Focalisation des agents sur certains types d’objets : spécialisation des agents

 Structuration sociale

Constat 2:

Structuration sociale bénéfique à la structuration de l’environnement

 Convergence plus rapide vers un tas par type d’objets

(8)

Tri Collectif

Remarques:

 Pas de comportement émergent

 La fonctionnalité peut-être obtenue avec un seul agent (robustesse)

 En revanche, fonctionnalité amplifiée par une structure sociale émergente

=> répartition dynamique des tâches

Application (cas réel):

Organisation dynamique de documents sur le web

(9)

Approche réactive: Inspiration des sociétés d’insectes

 Fourragement (fourmis)

Nid

Source Source

Source

Exploration aléatoire de l’environnement

Détection de source de nourriture

Collecte et retour en ligne droite vers le nid

Marquage du chemin de retour (phéromone)

Source

(10)

Approche réactive: inspiration des sociétés d’insectes

 Fourragement (fourmis): Phénomène autocatalytique

Source

Les fourmis découvrent les chemins les plus courts de la source de nourriture au nid.

Dépôt de phéromone sur le chemin menant à la source

Plus la concentration en phéromone est élevée sur un chemin, plus il a des chances d’être emprunté

La phéromone s’évapore au cours du temps

3 mécanismes: diffusion, évaporation, enrollement

(11)

Approche réactive: inspiration des sociétés d’insectes

 Fourragement (fourmis): Applications

 En recherche opérationnelle : plusieurs applications

 Exemple: Problème du voyageur de commerce (TSP)

Un ensemble de villes reliées entre elles par des arcs définissant une certaine distance. Le problème est de trouver le chemin minimal, permettant de ne parcourir chaque ville qu’une fois.

 Méta-heuristique ACO (inspirée des fourmis)

Des fourmis sont positionnées aléatoirement sur les différents sommets

Chaque arc se voit attribuer en plus de sa longueur un taux de phéromone

A chaque itération une règle globale fait s’évaporer une quantité de phéromone et augmente le taux de phéromone des arcs contribuant au plus court chemin

(12)

Métaphore de fourragement

Robots fourrageurs (Steels 88, Drogoul 93):

Problème: équipe de petits robots autonomes qui récoltent des échantillons de minerais dans un environnement inconnu,et les ramènent à une base centrale.

 => double problème posé aux robots

Récolte d’échantillons

Recherche efficace dans l’environnement

(structuration de l’environnement en terme d’espaces explorés et non explorés)

Principes:

Populations de robots simples et autonomes

Base émet un signal d’intensité décroissante avec la distance

Source (tas) de minerais

Capacité des robots à se déplacer, ramasser des minerais, les déposer

(13)

Métaphore de fourragement

Base

Expérience 1:

Comportements du robot basique 1.Recherche aléatoire

2. Ramassage du minerai 3. Retour à la base

4. Recherche aléatoire

Constat :

Robots complètement inefficaces individuellement et collectivement

Aucune exploitation de l’environnement (mémoire) pour repérer le lieu de leur dernière récolte

=> Aucune interaction avec le groupe (échange d’info), aucune coopération

Drogoul 93

(14)

Métaphore de fourragement

Base

Expérience 2:

Partage d’info par structuration de l’environnement Les robots rentrent en ligne droite à la base en suivant le signal qu’elle émet , en marquant leur chemin

Munir les robots de la capacité de déposer des marques

Et de la capacité de suivre un chemin marqué

Constat :

Amélioration des performances

Partage effectif d’info: rétroaction positive sur le comportement global de fourragement

Pb: si minerai épuisé, les robots continuent à suivre une trace qui les mène vers une source inexploitable

(information vide de sens toujours transmise)

Drogoul 93

(15)

Métaphore de fourragement

Base

Expérience 3:

Supprimer l’info qui ne servira peut-être plus

Marquage de la piste en revenant de la source à la base

Supprimer la marque en suivant une piste

Constat :

Performances dégradées du système

Dynamique trop grande dan le partage de l’information (création/suppression au même rythme)

L’information ne se propage pas assez pour créer un effet amplificateur

Drogoul 93

(16)

Métaphore de fourragement

Base

Expérience 4:

Atténuer l’information qui ne servira peut-être plus sans complètement la détruire

Déposer 2 marques au lieu d’une en revenant de la source à la base

Supprimer 1 marque en suivant une piste

Constat :

Meilleure solution

Partage d’info souple, coopération globale

Autre constat : Baisse des performances au delà d’un certain nombre de robots

Non prise en compte des contraintes environnementales: encombrement

Dispersion des traces à cause des déviations des robots pour s’éviter

Drogoul 93

(17)

Métaphore de fourragement

Base

Expérience 5:

Ajout d’un comportement de prise opportuniste

Un robot suivant une piste vers la source et qui croise un autre robot qui en revient, chargé d’un minerai,

le détrousse.

Capture du minerai là ou il se trouve

Constat :

Meilleure solution que précédemment et surtout stabilité à partir d’une certaine densité Autres constat :

émergence d’une structure prenant la forme d’une chaîne

Taux de fréquentation des pistes bien supérieur => épuisement d’un gisement vite repéré

éparpillement des pistes marginales=> concentration de l’info là où il le faut

Structuration sociale (formation de chaîne) et spatiale (chemins optimaux) et

Drogoul 93

(18)

Approche réactive: inspiration des sociétés d’insectes

 Fourragement (fourmis): Applications (Real world)

 En télécommunication : routage de réseaux

 En réseaux informatiques:

Equilibrage dynamique de charge

Equilibrage dynamique multicritères

En sécurité: réponse distribuée et dynamique à la détection d’intrusion

(19)

Quelques références

Russell & Norvig, A modern approach for Artificial Intelligence, Prentice Hall 1995

J. Ferber, Les systèmes multiagents, edition

Un cours sur les SMA à l’université laval (Québec) pointant vers d’autres cours:

http://www.damas.ift.ulaval.ca/~coursMAS/

Page personnelle de Marco Dorigo: http://iridia.ulb.ac.be/%7EDorigo

Quelques pointeurs vers des environnements de simulation:

Page de starlogo : http://el.www.media.mit.edu/groups/el/Projects/starlogo/

Page de swarm: http://www.swarm.org

Merci :))

Références

Documents relatifs

Avec ce film – le troisième sur ce sujet que je réalise pour ARTE –, je souhaite rendre hommage aux scien- tifiques qui ont fait du sida leur cheval de bataille mais aussi

Norme de compatibilité électromagnétique (CEM) – Partie 3-2 : Limites – Limites pour les émissions de courant harmonique (courant appelé par les appareils inférieur ou égal

Here, it is stated that a complete natural language HRI system should be able to: (i) react in the same time frame of a human; (ii ) process all stages of language processing in

Charger (« Load ») – Touchez cette option pour dire à votre équipement Dremel 3D20 de commencer à chauffer l’extrudeuse en vue du chargement du filament (voir page 72 pour

 Pour autant, maintien d’une grande diversité des « technologies de production (entre enseignes, mais aussi parfois au sein d’une même enseigne.  Les entrepôts

Contrairement aux approches classiques et déjà largement étudiées dans la littérature, nous nous intéressons plus particulièrement aux modèles réalistes dans lesquelles les

En ce qui concerne l'héritage, les robots et les obstacles sont des éléments contenus dans la grille, par conséquent, les classes (respectivement interfaces) « Robot » et «

Même avec des mesures non bruités, la quantité d’information qui vient des capteurs est trop faible pour identifier la pose du robot à partir d’un seul percept.