• Aucun résultat trouvé

Partie I État de l'art 1

2.1 Le problème de la patrouille multi-agent dénition

Nous pouvons dénir le problème de la patrouille multi-agent comme le fait de surveiller

ecacement un environnement à l'aide d'un groupe d'agents an d'assurer sa protection.

En particulier, nous cherchons à empêcher toute intrusion (par exemple pour la surveillance

d'un bâtiment) ou à contrôler l'apparition d'évènements (par exemple pour la prévention

des feux de forêt ou encore la surveillance de réseaux ou de sites web [Andrade et al., 2001;

Cho and Garcia-Molina, 2000]).

Une patrouille ecace revient donc à déterminer et à appliquer une politique de patrouille

(c'est-à-dire la fonction permettant aux agents de choisir la prochaine action à eectuer)

minimisant (ou maximisant) une fonction objectif de performances dénie en fonction du

scénario de patrouille envisagé.

En eet, la protection de l'environnement peut être envisagée selon plusieurs points de

vue. La littérature dénit deux variantes majeures du problème de la patrouille multi-agent

de natures profondément diérentes et répondant chacune à des impératifs et des besoins

particuliers :

La première variante considère qu'une patrouille ecace revient à visiter aussi

sou-vent que possible l'ensemble des lieux accessibles dans l'environnement. Maximiser la

fréquence de visite, permet un suivi (détection d'un événement ou d'un changement

d'état) ecace de l'environnement mais n'ore pas de solution réellement pertinente

à la capture d'intrus (en particulier si ces derniers sont capables d'observer les agents

patrouilleurs et de modéliser leur politique de patrouille).

La seconde variante considère qu'une patrouille ecace revient à rechercher et capturer

d'éventuels intrus aussi vite que possible, la couverture exhaustive de l'environnement

n'étant pas considérée comme un critère d'ecacité pertinent. Pour cette variante, les

intrus sont généralement capables de modéliser les agents patrouilleurs an de pouvoir

leur échapper au mieux.

Nous présentons ci-après ces deux variantes principales de la patrouille multi-agent.

2.1.1 La patrouille vue comme la visite répétitive de l'environnement

Pour cette variante de la patrouille multi-agent, on cherche à visiter l'ensemble des lieux

accessibles de l'environnement le plus souvent et le plus régulièrement possible à l'aide d'un

groupe d'agents. Cette représentation du problème est principalement issue des domaines de

la décision (et relève en particulier de la planication), des systèmes multi-agents réactifs et

de la robotique mobile.

Nous considérons ici l'environnement comme étant un espace discret représenté par un

graphe. On cherchera à minimiser une fonction objectif reposant sur un critère d'occupation

des n÷uds.

Le problème pourra alors être considéré comme un problème de décision classique

reve-nant à chercher le circuit le plus court visitant tous les n÷uds ou couvrant l'intégralité de

l'environnement (respectivement dans des cadres discrets et continus).

Cette variante sera principalement destinée à la détection d'évènements statiques et

du-rables au sein de l'environnement.

Ce type d'approche sera donc particulièrement pertinent pour des tâches telles que la

détection de départs de feux de forêt par un groupe de drones

13

ou la surveillance de la

modication de sites web pour leur indexation.

La couverture de l'environnement, une tâche connexe à la patrouille

La couverture consiste simplement à explorer l'ensemble de l'environnement, c'est-à-dire

à visiter au moins une fois chaque n÷ud de l'environnement. L'ecacité d'un algorithme en

couverture est simplement mesurée par la durée d'une couverture complète de

l'environne-ment. Cette durée est souvent désignée sous le terme de blanket time. Une couverture optimale

consiste, dans un cadre mono-agent, à suivre un chemin hamiltonien. Dans un contexte

multi-agent, cela revient à diviser l'environnement en un ensemble de chemins hamiltoniens (un

par agent) ne s'intersectant pas (c'est-à-dire que chaque agent visitera un n÷ud inexploré à

chaque itération).

Notons cependant que l'obtention d'une couverture optimale ne garantit pas une patrouille

optimale. Si l'on est tenté de considérer intuitivement la patrouille comme une couverture

répétée de l'environnement, un simple exemple prouve le contraire. La gure 2.1.a présente

une couverture optimale sur un environnement grille. En suivant cette stratégie, une fois que

l'agent a eectué la couverture de l'environnement, celui-ci se retrouve dans une situation

où sa prochaine décision sera nécessairement sous optimale puisque la cellule de plus grande

oisiveté correspondra au point de départ de l'agent (ici en haut à gauche). Une patrouille

optimale correspondra cependant à la répétition d'une couverture optimale si ses points de

départ et d'arrivée sont adjacents (cf. gure 2.1.b).

a. une couverture optimale b. une patrouille optimale

Figure 2.1 Une couverture optimale ne signie pas nécessairement une patrouille optimale

2.1.2 Perception d'intrus à distance

La seconde variante principale de la patrouille multi-agent est issue des domaines des

sys-tèmes multi-agents cognitifs, de la théorie des jeux et de la décision dans l'incertain, et se

concentre sur la capture d'un ou plusieurs intrus se déplaçant dans l'environnement [Basilico

et al., 2009; Marino et al., 2009].

La patrouille est alors modélisée comme un jeu avec adversaire où l'on cherche une

poli-tique maximisant l'utilité des agents (voir gure 2.2), c'est-à-dire une polipoli-tique maximisant

l'espérance des gains futurs.

Les adversaires sont modélisés comme des agent rationnels capables d'observer les agents

patrouilleurs et cherchant eux aussi à maximiser leur utilité. Dans certains cas, les agents

patrouilleurs sont capables de modéliser le comportement des intrus an d'augmenter leur

propre utilité.

Pour cette variante du problème de la patrouille multi-agent, la couverture de

l'environ-nement n'est pas un critère de performance pertinent (il ne s'agit ici pas d'un but explicite

pour les agents). On ne pourra donc, dans cette optique, ni garantir une visite exhaustive de

l'environnement (couverture répétitive) ni se donner de contraintes sur la fréquence de visite.

2.1.3 Problème considéré

Ces deux grands types d'approches au problème de la patrouille sont donc très diérents,

tant dans les objectifs achés que dans la façon d'y répondre. Un modèle construit pour un

type de problème ne répondra que partiellement aux besoins de l'autre classe.

Figure 2.2 Maximisation de l'utilité pour la capture d'intrus. Sachant qu'un intrus a été

récemment perçu à cet endroit, l'agent aura intérêt à se déplacer vers le couloir de gauche.

En eet, des deux zones (en vert et en bleu) contenant de l'information (sur la présence ou

l'absence d'intrus), l'agent rejoindra la zone vert plus rapidement et minimisera ainsi le temps

perdu dans l'éventualité ou l'intrus ne s'y trouve pas.

Nous nous positionnons dans la suite de cette thèse sur le problème de la patrouille déni

comme la visite répétitive des lieux accessibles de l'environnement an de minimiser le délai

entre deux visites consécutives.

Documents relatifs