MAS4AT : un SMA auto-adaptatif pour le déclenchement d'alertes dans le cadre de la surveillance maritime

(1)

O

pen

A

rchive

T

OULOUSE

A

rchive

O

uverte (

OATAO

)

OATAO is an open access repository that collects the work of Toulouse researchers and

makes it freely available over the web where possible.

This is an author-deposited version published in :

http://oatao.univ-toulouse.fr/

Eprints ID : 12399

To link to this article : DOI :10.3166/ria.27.371-395

URL :

http://dx.doi.org/10.3166/ria.27.371-395

To cite this version : Brax, Nicolas and Andonoff, Eric and Georgé,

Jean-Pierre and Gleizes, Marie-Pierre and Mano, Jean-Pierre

MAS4AT : un SMA auto-adaptatif pour le déclenchement d'alertes

dans le cadre de la surveillance maritime. (2013) Revue d'Intelligence

Artificielle, vol. 27 (n° 3). pp. 371-395. ISSN 0992-499X

(2)

MAS4AT, un SMA auto-adaptatif

pour le dŽclenchement dÕalertes

dans le cadre de la surveillance maritime

Nicolas Brax

1

, Eric Andonoff

1

, Jean-Pierre GeorgŽ

1

,

Marie-Pierre Gleizes

1

, Jean-Pierre Mano

2

1. Equipe SMAC - IRIT, UniversitŽ de Toulouse 118 route de Narbonne F-31062 Toulouse cedex {brax, andonoff, george, gleizes}@irit.fr 2. UPETEC

Parc technologique du Canal

10 avenue de lÕEurope F-31520 Ramonville Saint-Agne jean-pierre.mano@upetec.fr

RƒSUMƒ. Cet article prŽsente MAS4AT, un syst•me multi-agent coopŽratif et auto-adaptatif pour le dŽclenchement dÕalertes lors de la dŽtection de comportements suspects dans le cadre de la surveillance maritime. Ce syst•me est con•u et dŽveloppŽ dans le cadre du projet europŽen I2C qui vise ˆ mettre en Ïuvre une nouvelle gŽnŽration de syst•mes de surveillance maritime, capables dÕaider les opŽrateurs humains (i) ˆ identifier les comportements anormaux de navires, (ii) ˆ Žvaluer la suspicion associŽe ˆ ces comportements et (iii) ˆ dŽclencher des alertes sÕils reprŽsentent des menaces. Cet article introduit le projet I2C puis se consacre plus particuli•rement ˆ la prŽsentation de MAS4AT et ˆ ses capacitŽs dÕapprentissage par renforcement.

ABSTRACT. This paper introduces MAS4AT, a cooperative and self-adaptive multi-agent system for abnormal behaviour detection and alert triggering in maritime surveillance. MAS4AT is designed and implemented in the context of the I2C project, a FP7 European project in which we are involved, which aims at implementing a new generation of maritime surveillance system able to permanently track and monitor all type of ship tracks in vulnerable trading lanes in order (i) to detect abnormal ships behaviours, (ii) to analyse it and, (iii) to trigger alerts if these behaviours correspond to threatening situations. This paper presents I2C and then focuses on MAS4AT and its learning abilities by reinforcements.

MOTS-CLƒS: surveillance maritime, I2C, MAS4AT, dŽclenchement dÕalertes, apprentissage, SMA auto-adaptatif.

KEYWORDS: maritime surveillance, I2C, MAS4AT, alert triggering, learning, self-adaptive MAS.

(3)

1. Introduction

LÕactivitŽ maritime sÕest fortement dŽveloppŽe ces derni•res annŽes et sert de support ˆ de nombreuses activitŽs illicites telles que la contrebande (de drogue, dÕarmes, de biens), la p•che dÕesp•ces protŽgŽes par des quotas et des rŽglementations, la pollution (dŽgazage en pleine mer)É Il est devenu nŽcessaire que les organismes impliquŽs dans la surveillance maritime disposent de syst•mes efficaces pour les aider ˆ identifier ces activitŽs illicites.

Les syst•mes de surveillance maritime (SSM) doivent aider les opŽrateurs humains impliquŽs dans la surveillance ˆ observer de mani•re efficace un espace maritime large, ˆ identifier les anomalies de comportement des navires Žvoluant dans lÕespace en question, et ˆ dŽclencher des alertes documentŽes si ces anomalies am•nent ˆ penser que les navires ont un comportement suspect. Plus prŽcisŽment, les SSM doivent offrir les fonctionnalitŽs suivantes :

Ð couverture (surveillance) permanente et large des espaces maritimes sensibles (zones portuaires, lignes commerciales de forte activitŽ, zones c™ti•res, zones de p•ches) ˆ lÕaide de radars et de capteurs efficaces, dŽployŽs sur des plateformes fixes ou mobiles ;

Ð intŽgration en temps rŽel des informations issues de ces radars et capteurs ; Ð dŽtection automatique dÕanomalies de comportement de navires Žvoluant dans les zones surveillŽes ;

Ð dŽclenchement dÕalertes si lÕanalyse des anomalies associŽes aux navires am•ne ˆ penser que ces derniers sont suspects, voire mena•ants ;

Ð documentation des alertes pour permettre aux autoritŽs de prendre rapidement, et en information compl•te, des dŽcisions dÕintervention sur le terrain afin de traiter les menaces que reprŽsentent les navires en question ;

Ð interface adaptŽe pour les opŽrateurs humains impliquŽs dans la surveillance maritime.

Ë lÕheure actuelle, aucun syst•me existant (Garcia et al, 2011 ; HŽbrard, 2011) ne supporte lÕensemble de ces fonctionnalitŽs et les opŽrateurs humains impliquŽs dans la surveillance maritime ne disposent que dÕoutils assez incomplets pour les aider ˆ dŽtecter des comportements suspects de navires et ˆ dŽclencher des alertes. En outre, les progr•s techniques significatifs rŽalisŽs autour des capteurs de surveillance et des techniques dÕintŽgration de donnŽes font quÕil est maintenant envisageable de recevoir en temps rŽel des donnŽes dÕobservation prŽcises pour des zones de surveillance ciblŽes, de les intŽgrer, de les analyser et de dŽclencher des alertes pour signaler des comportements suspects de navires.

(4)

Le projet europŽen I2C1 a pour objectif de dŽfinir et mettre en Ïuvre un tel SSM. La partie du projet prŽsentŽe dans cet article concerne la dŽtection automatique dÕanomalies et le dŽclenchement dÕalertes. CÕest une des fonctionnalitŽs fondamentales du projet I2C.

Cette proposition sÕappuie sur lÕutilisation conjointe dÕun moteur de r•gles pour la dŽtection dÕanomalies et dÕun syst•me multi-agent (SMA) pour lÕanalyse de ces anomalies et le dŽclenchement dÕalertes aupr•s des opŽrateurs humains (appelŽs opŽrateurs dans la suite de lÕarticle) impliquŽs dans la surveillance maritime. Avant de discuter de lÕintŽr•t de ce couplage il convient de rappeler que, dans le domaine de la surveillance maritime, les notions dÕalerte et dÕanomalie ne doivent pas •tre confondues. Une anomalie est un ŽvŽnement anormal qui se produit pour un navire et qui rŽsulte bien souvent du non-respect dÕune rŽglementation ; elle ne donne cependant pas nŽcessairement lieu au dŽclenchement dÕune alerte, qui combine gŽnŽralement plusieurs anomalies associŽes ˆ un navire.

Le couplage dÕun moteur de r•gles et dÕun SMA se justifie car il sÕagit dÕune part, de prendre en compte la rŽglementation maritime et de dŽtecter des anomalies de comportement de navires en accord avec cette rŽglementation. Utiliser un moteur de r•gles pour mener ˆ bien cette phase de dŽtection est adŽquat car le formalisme des r•gles est bien adaptŽ ˆ lÕexpression de la rŽglementation maritime. Mais il sÕagit dÕautre part dÕanalyser les anomalies dŽtectŽes, de cumuler leur importance (i.e. leur poids), de dŽclencher des alertes, et dÕŽventuellement apprendre lÕimportance de ces anomalies lorsque les alertes dŽclenchŽes (ou pas) ne sont pas pertinentes du point de vue de lÕopŽrateur. Ces combinaisons dÕanomalies sont nombreuses et ne sont pas toujours les m•mes pour des navires diffŽrents (par exemple, pour un bateau de plaisance ou pour un tanker) : il est impossible, ou en tout cas tr•s difficile, pour un concepteur de les prŽvoir a priori lors de la conception du syst•me. La capacitŽ dÕapprentissage est Žgalement une caractŽristique clŽ car lÕimportance des anomalies est difficile ˆ caler dŽfinitivement lors de la conception du syst•me mais sÕapprend plut™t au fur et ˆ mesure de leur apparition. Ces ŽlŽments nous am•nent donc ˆ prŽconiser lÕutilisation dÕun syst•me multi-agent adaptatif pour rŽaliser la levŽe dÕalertes pertinentes.

Plus prŽcisŽment, cet article dŽtaille le syst•me MAS4AT (Multi Agent System

for Alert Triggering) pour lÕanalyse des anomalies, lÕapprentissage de leur

importance et le dŽclenchement dÕalertes pertinentes. MAS4AT re•oit du moteur de r•gles les anomalies dŽtectŽes. Il Žvalue numŽriquement le comportement des navires en fonction de lÕimportance de ces anomalies et dŽclenche des alertes si cette valeur numŽrique est supŽrieure ˆ un seuil dÕalerte. Ces alertes sont ensuite transmises aux opŽrateurs impliquŽs dans la surveillance maritime ; ces derniers les valident ou les invalident. Les alertes invalidŽes sont retournŽes au SMA qui dŽclenche une phase dÕapprentissage par auto-adaptation afin de modifier

1. Integrated System for Interoperable sensors & Information sources for Common abnormal

(5)

lÕimportance quÕil associe aux anomalies. Les opŽrateurs peuvent Žgalement indiquer au SMA les alertes non dŽclenchŽes. Dans ce cas, le SMA va Žgalement mettre en Ïuvre une phase dÕapprentissage pour les anomalies concernŽes. Ce SMA est un vrai plus pour I2C puisquÕil permet de dŽclencher des alertes pertinentes aupr•s des opŽrateurs. Il a les deux avantages suivants :

Ð Il propose une reprŽsentation mathŽmatique de la suspicion associŽe aux navires ; il en rŽsulte des reprŽsentations graphiques, comprŽhensibles par lÕopŽrateur, du comportement des navires vis ˆ vis du seuil dÕalerte.

Ð Il propose Žgalement une reprŽsentation mathŽmatique de lÕimportance des anomalies et supporte lÕapprentissage par auto-adaptation de cette importance.

Cet article est organisŽ comme suit. La section 2 fait un rapide Žtat de lÕart des travaux rŽalisŽs dans le domaine de la surveillance, quÕelle soit maritime ou non. Elle positionne Žgalement notre contribution et notamment le type dÕapprentissage de MAS4AT La section 3 donne lÕarchitecture de la solution I2C. La section 4 dŽcrit le SMA auto-adaptatif MAS4AT en prŽsentant tour ˆ tour les agents dŽdiŽs ˆ lÕŽvaluation du comportement des navires et ceux dŽdiŽs ˆ la reprŽsentation des anomalies et de leurs valeurs. La section 5 traite de lÕapprentissage mis en Ïuvre dans MAS4AT. Elle introduit les algorithmes dÕapprentissage des valeurs des anomalies. Elle reporte Žgalement les rŽsultats dÕapprentissage obtenus dans les diverses simulations rŽalisŽes. Enfin, la section 6 fait le bilan du travail rŽalisŽ et donne les principales pistes pour nos prochains travaux.

2. ƒtat de lÕart

Le syst•me MAS4AT Žtant un des composants du syst•me de surveillance maritime (SSM) I2C, la section 2.1 examine les principaux syst•mes de surveillance existants. La section 2.2 est consacrŽe ˆ un Žtat de lÕart sur les approches et techniques dÕapprentissage. Comme dŽfendu en introduction, MAS4AT dispose de capacitŽs pour apprendre lÕimportance des anomalies. En effet, les valeurs associŽes ˆ ces anomalies sont une reprŽsentation des connaissances des opŽrateurs impliquŽs dans la surveillance maritime. Il est difficile de donner une valeur initiale ˆ ces anomalies et il est pertinent dÕapprendre leur valeur en fonction de leurs apparitions et de leurs combinaisons avec dÕautres anomalies.

2.1. Syst•mes de surveillance

Dans le domaine de la surveillance, quel que soit le contexte (surveillance maritime, mŽdicale (Li et al., 2011), sociologique (Gupta et al., 2011) ou dans le domaine de la sŽcuritŽ des rŽseaux (Shi et al., 2011), les syst•mes peuvent •tre classŽs en deux catŽgories. Nous distinguons tout dÕabord les syst•mes de surveillance qui modŽlisent les comportements autorisŽs ˆ lÕaide par exemple de rŽseaux de neurones, et qui indiquent comme anormal tout comportement qui nÕest

(6)

pas dŽcrit dans le mod•le (Fok et al., 2011 ; Celik et al., 2011) Ces syst•mes consid•rent les comportements inconnus comme des comportements anormaux, ce qui nÕest pas nŽcessairement vrai dans le contexte de la surveillance maritime (DCNS, 2010). La deuxi•me catŽgorie de syst•me modŽlise plut™t les comportements interdits en se basant sur la lŽgislation du domaine dans lequel ils sÕappliquent (par exemple la lŽgislation maritime). Cette lŽgislation est dŽcrite sous forme de r•gles construites par des experts du domaine et qui traduisent les infractions relatives au domaine. Les syst•mes adoptant cette philosophie identifient donc les comportements anormaux en fonction des ŽvŽnements observŽs dans les zones surveillŽes (Tan, 2005 ; Jakob et al., 2010 ; Gupta et al., 2009 ; Nilsson et al., 2008). Ces syst•mes sont pertinents pour la dŽtection dÕanomalies correspondant ˆ des comportements inattendus. Mais ils sont inadŽquats et doivent •tre amŽliorŽs dans le contexte de la surveillance maritime pour trois raisons principales.

Ð Premi•rement, la plupart du temps, le comportement anormal dÕun navire est le rŽsultat de la violation de plusieurs r•gles et chaque infraction considŽrŽe indŽpendamment nÕest pas nŽcessairement une anomalie en soi et ne provoque pas le dŽclenchement dÕalertes. Malheureusement, les syst•mes basŽs sur des r•gles ne permettent pas cette distinction.

Ð Deuxi•mement, la lŽgislation maritime est tr•s complexe et les alertes peuvent en outre •tre dŽpendantes du type du navire. Tout cela rend la rŽglementation maritime difficile ˆ modŽliser sous forme de r•gles.

Ð Troisi•mement, en se basant uniquement sur une approche ˆ base de r•gles, il nÕest pas possible de dŽcouvrir les nouveaux comportements des criminels, qui sont de plus en plus imaginatifs quand il sÕagit de contourner la loi. Un syst•me de surveillance maritime doit •tre capable dÕidentifier de nouveaux comportements anormaux, et donc de dŽcouvrir les nouvelles stratŽgies mises en Ïuvre par les criminels (Auslander et al., 2011).

Concernant les syst•mes de surveillance et de dŽtection des comportements, il faut Žgalement citer les syst•mes basŽs sur les techniques de reconnaissance de chroniques (Dousson, 1994 ; Cram, 2010) ou dÕintentions (Cohen et al., 2008). La reconnaissance de chroniques est utilisŽe pour dŽtecter des ŽvŽnements ponctuels qui sont liŽs par des contraintes temporelles se produisant dans un contexte donnŽ. (Dousson, 1994). Ces ŽvŽnements et les contraintes associŽes sont gŽnŽralement reprŽsentŽs sous la forme de graphes qui constituent une base de connaissance pour le syst•me. Bien que pertinente, cette technique est difficilement utilisable dans notre contexte car les ŽvŽnements se produisant dans le domaine de la surveillance maritime ne sont pas nŽcessairement connus ˆ lÕavance. Nous avons affaire ˆ un syst•me fortement dynamique dans lequel des ŽvŽnements peuvent appara”tre ou dispara”tre et le syst•me de surveillance doit pouvoir sÕadapter et dŽcouvrir par lui-m•me ces changements. La reconnaissance dÕintention porte elle sur lÕanalyse des actions dÕun objet et des changements quÕil provoque dans lÕenvironnement en vue de dŽterminer son objectif (Sadri, 2010). Cette technique se base sur la formalisation de biblioth•ques pour Žtablir des comparaisons avec les traces observŽes. Cette

(7)

formalisation exhaustive peut sÕavŽrer difficile dans le domaine de la surveillance maritime en raison de la complexitŽ de la lŽgislation associŽe.

2.2. Apprentissage

En mati•re dÕapprentissage automatique, il existe plusieurs techniques comme lÕapprentissage supervisŽ (Venturini, 1994), non supervisŽ (Hinton, 1999) ou par renforcement (Kaelbling et al., 1996).

Dans le cas dÕun apprentissage supervisŽ, le syst•me sÕappuie sur une base de connaissances construite par un expert du domaine considŽrŽ pour associer des donnŽes fournies en entrŽe ˆ une des classes dŽfinie dans la base de connaissance. Si le syst•me ne trouve aucune classe, il associe ces nouvelles donnŽes ˆ une classe qualifiŽe dÕinconnue. Cette technique est tr•s utilisŽe en reconnaissance de formes (Pao, 1989 ; Jurafsky et al., 2000).

Dans le cadre dÕun apprentissage non supervisŽ, le syst•me dŽcouvre, ˆ partir de donnŽes fournies en entrŽe, les classes par lui-m•me, cÕest-ˆ-dire sans lÕaide dÕun expert. Le syst•me analyse les donnŽes quÕil re•oit en se basant sur des groupes dÕattributs ou de fonctions quÕil est capable dÕobserver (Barlow, 1989). LÕutilisateur de la base de connaissance doit ensuite analyser les rŽsultats pour dŽterminer la nature de chaque classe alors identifiŽe. LÕapprentissage non supervisŽ est souvent utilisŽ lorsquÕil sÕagit de traiter de vastes corpus de donnŽes quÕil faut Žvaluer et classer, comme par exemple, les donnŽes relatives ˆ lÕŽvaluation du trafic sur des rŽseaux informatiques (Zander et al., 2005) ou les donnŽes relatives ˆ la classification des protŽines (Andrade et al., 1993).

Enfin, nous distinguons lÕapprentissage par renforcement dans lequel les effets dÕune action sur lÕenvironnement sont pris en compte. La base de connaissances est capable de se rŽorganiser en fonction de ces actions et de modifier les classifications Žtablies. LÕalgorithme dÕapprentissage qui sert de support ˆ cette rŽorganisation va utiliser les retours en provenance de lÕenvironnement pour amŽliorer la classification de la base de connaissances (Sutton et al., 1998). Bien souvent les syst•mes ˆ base dÕagents sont utilisŽs pour mettre en Ïuvre ce type dÕapprentissage (Lauer et al., 2000). En effet, les agents peuvent prendre des dŽcisions en fonction de leurs objectifs, communs ou individuels, et observer lÕimpact direct sur leur environnement. En fonction des bŽnŽfices ou des inconvŽnients quÕils en retirent, les agents peuvent choisir de modifier leur classification ou non.

Parmi les mŽthodes dÕapprentissage par renforcement, nous pouvons retenir les algorithmes de Q-Learning et de TD-Learning (Watkins et al., 1992 ; Sutton, 1988) ou encore les rŽseaux de neurones gr‰ce aux mŽcanismes de rŽtro-propagation de lÕerreur et dÕŽlagage (Coulom, 2002). LÕinconvŽnient de ces mŽthodes est principalement le cožt en temps de calcul. De plus, de tels syst•mes peuvent •tre complexes ˆ implŽmenter en raison des mŽcanismes de dŽcision parfois mal connus (Kaelbling et al., 1996).

(8)

LÕapprentissage par renforcement est le type dÕapprentissage que nous utilisons dans le syst•me I2C. En effet, les alertes dŽclenchŽes par le SMA MAS4AT sont soumises ˆ un opŽrateur impliquŽ dans la surveillance maritime. Le r™le de cet opŽrateur est de valider ou invalider ces alertes. Les alertes validŽes sont documentŽes et transmises aux autoritŽs qui vont dŽcider dÕŽventuelles interventions sur le terrain tandis que les alertes invalidŽes ou les alertes non relevŽes sont transmises ˆ MAS4AT pour quÕil apprenne les valeurs quantifiant lÕimportance des anomalies impliquŽes dans ces alertes.

3. Le syst•me de surveillance maritime I2C

Cette section prŽsente lÕarchitecture du syst•me de surveillance maritime I2C. Elle introduit tout dÕabord les principaux composants de ce syst•me et indique ensuite comment MAS4AT interagit avec ces diffŽrents composants.

3.1. Architecture dÕI2C

LÕarchitecture du syst•me I2C est prŽsentŽe en figure 1. I2C est principalement composŽ dÕune sŽrie de capteurs (senseurs) retournant des informations issues des zones maritimes surveillŽes, dÕun ensemble de bases de donnŽes donnant des informations sur les conditions maritimes et les navires Žvoluant dans les zones surveillŽes, dÕune plateforme de visualisation intelligente, appelŽe SITU, dÕun

moteur de r•gles responsable de la dŽtection dÕanomalies de comportement des

navires et du syst•me multi-agent MAS4AT responsable de la levŽe dÕalertes.

(9)

Plus prŽcisŽment, le composant SITU int•gre et fusionne les informations issues des diffŽrentes sources disponibles, ˆ savoir les capteurs et les bases de donnŽes, avec pour objectif de visualiser, sur une carte maritime, la reprŽsentation en temps rŽel des navires Žvoluant dans la zone surveillŽe. Ces informations sont ensuite envoyŽes au moteur de r•gles dont le but est de dŽtecter les anomalies correspondant ˆ des comportements suspects. Le moteur de r•gles int•gre la lŽgislation maritime et modŽlise sous la forme de r•gles les anomalies pouvant •tre dŽtectŽes et les conditions de dŽtection de ces anomalies. Par exemple, la r•gle suivante exprime la dŽtection dÕune anomalie de vitesse sur un navire qui se dŽplace trop rapidement dans une zone portuaire :

IF speed > 15 AND area = "Harbour" THEN Detect(Speed_anomaly)

Ces anomalies sont ensuite envoyŽes ˆ MAS4AT dont le but est de lever des alertes pertinentes ˆ lÕintention des opŽrateurs impliquŽs dans la surveillance maritime. Ceux-ci valident ou invalident ces alertes. Les alertes validŽes sont envoyŽes aux autoritŽs qui vont dŽcider dÕŽventuelles interventions sur le terrain. Les alertes invalidŽes sont renvoyŽes ˆ MAS4AT pour une phase dÕapprentissage. LÕopŽrateur peut Žgalement signaler ˆ MAS4AT une alerte quÕil per•oit mais qui nÕa pas ŽtŽ levŽe par le SMA. Dans ce cas, lÕopŽrateur signale au SMA cette alerte non levŽe et ce dernier dŽclenche une phase dÕapprentissage.

3.2. R™le de MAS4AT

Le moteur de r•gles est combinŽ au SMA auto-adaptatif MAS4AT qui supporte les trois fonctionnalitŽs suivantes. Premi•rement, il Žvalue et reprŽsente graphiquement le comportement des navires en leur associant une valeur numŽrique qui cumule lÕimportance des anomalies identifiŽes par le moteur de r•gles. Deuxi•mement, il l•ve des alertes en direction des opŽrateurs impliquŽs dans la surveillance maritime si cette valeur est supŽrieure ˆ un seuil donnŽ. Enfin, il apprend par auto-adaptation lÕimportance de ces anomalies quand il re•oit des opŽrateurs des alertes invalidŽes, i.e. des alertes dŽclenchŽes de mani•re erronŽe ou des alertes non dŽclenchŽes (non dŽtectŽes par le SMA). Dans ce cas, MAS4AT modifie les valeurs quÕil associe aux anomalies et qui reprŽsentent leur importance.

4. Le syst•me multi-agent MAS4AT

Cette section introduit dÕabord lÕarchitecture du syst•me MAS4AT. MAS4AT int•gre deux principaux sous-syst•mes : lÕOperative Multi-Agent System (OpMAS) et le Parameter Adjustment Multi-Agent System (PaMAS). Le syst•me multi-agent OpMAS, dŽcrit en section 4.2, modŽlise les navires Žvoluant dans la zone de surveillance. Il est en charge de gŽrer le niveau de suspicion des navires et de lever des alertes. Le syst•me multi-agent PaMAS, dŽtaillŽ en section 4.3, modŽlise les anomalies associŽes aux navires. Il a pour r™le dÕattribuer aux anomalies une valeur

(10)

reprŽsentant leur importance ; il peut aussi •tre sollicitŽ pour apprendre lÕimportance des anomalies en fonction de leur apparition dans le monde rŽel.

4.1. Architecture de MAS4AT

La figure 2 ci-dessous introduit cette architecture. Plus prŽcisŽment, le sous-syst•me OpMAS (Operative Multi-Agent System) regroupe un ensemble dÕagents-navires, chacun reprŽsentant un navire surveillŽ par I2C dans le monde rŽel. Pour chaque agent-navire est associŽe une valeur appelŽe SBv (Ship Behaviour value) qui reprŽsente le niveau de suspicion associŽ au navire. SBv est calculŽe en combinant les diffŽrentes anomalies associŽes au navire. Une alerte est levŽe par OpMAS si cette valeur est plus grande quÕun seuil donnŽ.

Le sous-syst•me PaMAS (Parameter Adjustment Multi-Agent System) compl•te OpMAS et modŽlise les anomalies sous forme de valeurs numŽriques en utilisant deux types dÕagents : les anomalies et les param•tres. Les agents-anomalies reprŽsentent les agents-anomalies associŽes aux navires. La valeur de ces anomalies est dŽcrite par trois param•tres, chacun reprŽsentŽs par un agent-param•tre (Mano et al., 2010). Ainsi, PaMAS distingue la valeur que prend lÕanomalie lors de son apparition (param•tre Init), la valeur que prend lÕanomalie lorsquÕelle persiste dans le temps (param•tre Incr) et enfin la valeur que prend lÕanomalie apr•s sa disparition (param•tre Decr).

Figure 2. Architecture de MAS4AT

4.2. Les agents-navires dans OpMAS

Comme indiquŽ prŽcŽdemment, chaque agent-navire reprŽsente un navire Žvoluant dans la zone sous surveillance et est dotŽ dÕun comportement lui permettant dÕatteindre ses objectifs. Cette section dŽcrit ce comportement en distinguant les capacitŽs individuelles des agents-navires de leur comportement collectif ; ces

(11)

comportements sont les briques de base des algorithmes dÕapprentissage introduits en section 5.1.

4.2.1 CapacitŽs individuelles des agents- navires

Un agent-navire est dotŽ de capacitŽs lui permettant (i) de calculer la valeur de son comportement et de la reprŽsenter sous forme de courbe, (ii) de dŽclencher une alerte si cette valeur est supŽrieure ˆ un seuil fixŽ par les opŽrateurs impliquŽs dans la surveillance maritime, et (iii) de dŽclencher une phase dÕapprentissage des valeurs dÕanomalies si lÕalerte dŽclenchŽe est incorrecte ou si une alerte nÕa pas ŽtŽ dŽclenchŽe alors que cÕŽtait nŽcessaire.

4.2.1.1 ƒvaluation et reprŽsentation du comportement

La valeur de comportement dÕun agent-navire, appelŽe SBv (Ship Behaviour

value), reprŽsente la suspicion associŽe ˆ son comportement. Elle est calculŽe en

tenant compte des anomalies envoyŽes par le moteur de r•gles par la fonction suivante :

LÕidŽe est de cumuler lÕimportance des diffŽrentes anomalies associŽes ˆ un navire en sÕappuyant sur les valeurs des param•tres des anomalies en question et en prenant en compte le temps et le nombre dÕapparitions de ces anomalies. Comme indiquŽ prŽcŽdemment, les param•tres de lÕanomalie sont au nombre de trois : ils reprŽsentent la valeur initiale de lÕanomalie lorsquÕelle appara”t, la valeur quÕelle prend lorsquÕelle persiste dans le temps, et la valeur quÕelle prend lorsquÕelle dispara”t (cette valeur correspond ˆ lÕeffet de dissipation de lÕanomalie ; on garde ainsi trace un certain temps quÕune anomalie sÕest produite). Plus prŽcisŽment, pour chaque anomalie relative ˆ un agent-navire, la fonction additionne : 1) le nombre de fois o• lÕanomalie sÕest produite multipliŽ par la valeur de son param•tre Init (Init(ai)) et 2) le nombre de pas de temps o• lÕanomalie perdure (nb(ÔIncrÕ,ai)) multipliŽ par la valeur de son param•tre Incr (Incr(ai)). Elle retranche ensuite au rŽsultat de cette addition le nombre de pas de temps (nb(ÔDecrÕ,ai)) o• lÕanomalie considŽrŽe nÕest pas per•ue multipliŽ par la valeur de son param•tre Decr (Decr(ai)).

Le niveau dÕanomalie dÕun navire rŽsultat de son comportement peut •tre reprŽsentŽ comme une fonction mathŽmatique. Il est ainsi possible, ˆ un instant donnŽ, cÕest-ˆ-dire pour une situation donnŽe, (i) dÕindiquer la valeur dÕun point de la courbe et (ii) de donner lÕinŽquation relative au seuil dÕalerte fixŽ par les opŽrateurs.

(12)

Par exemple, la figure 3 illustre lÕexemple dÕun navire dont le comportement est composŽ de lÕanomalie a1 entre pas0 et pas13, puis des anomalies a1 et a2 entre pas14 et pas19. Les cercles reprŽsentent la valeur calculŽe du comportement du navire ˆ un instant donnŽ. Les cercles blancs reprŽsentent lÕapparition dÕanomalies tandis que les noirs ne sont pas liŽs ˆ lÕapparition dÕŽvŽnements suspicieux.

Ainsi, dans lÕexemple de la figure 3, ˆ pas5, nous avons pour valeur de SBv :

1*Init(a1)+5*Incr(a1). En effet, ˆ pas5, a1 est apparu 1 fois (un cercle blanc

reprŽsente lÕapparition de a1) et a durŽ 5 pas de temps (5 cercles noirs reprŽsentent le fait que a1 perdure). A pas11, a1 est apparu deux fois et a perdurŽ de 9 pas de temps et a disparu pendant 2 pas de temps (avant de rŽappara”tre). Ë pas18, ˆ la fois a1 et a2 sont prŽsentes et donc combinŽes. Au total, lÕanomalie a1 est apparue 3 fois, a persistŽ durant 12 pas de temps et a disparue 4 pas de temps avant de rŽappara”tre. De son c™tŽ, a2 est apparue 1 fois et a persistŽ durant 4 pas de temps. Ë chacun de ces pas de temps, lÕagent-navire peut construire lÕinŽquation qui correspond ˆ sa situation comportementale vis-ˆ-vis du seuil dÕalerte fixŽ par les opŽrateurs.

Figure 3. Calcul du comportement dÕun navire

4.2.1.2 DŽclenchement dÕalerte et apprentissage

En plus de savoir Žvaluer et reprŽsenter la valeur de son comportement, un agent-navire a Žgalement la capacitŽ de dŽclencher une alerte aupr•s des opŽrateurs si la valeur du comportement du navire quÕil reprŽsente est supŽrieure au seuil dÕalerte (qui est en fait le seuil de dŽclenchement).

Un agent-navire a aussi la capacitŽ de dŽclencher lÕapprentissage par auto-ajustement des valeurs des anomalies qui lui sont associŽes. Plus prŽcisŽment, un agent-navire peut solliciter les agents-anomalies concernŽs qui vont eux-m•mes dŽclencher lÕapprentissage par auto-ajustement des valeurs de leurs param•tres Init, Incr et Decr. Les diffŽrents algorithmes dÕapprentissage sont donnŽs en section 5.1.

(13)

4.2.1.3 CapacitŽs dÕinteraction

Enfin, pour pouvoir mettre en Ïuvre les capacitŽs prŽsentŽes prŽcŽdemment (calcul de comportement, dŽclenchement dÕalertes, phase dÕapprentissage), un agent-navire doit pouvoir interagir avec trois composants de I2C ˆ savoir :

Ð Le moteur de r•gles, pour recevoir les anomalies dŽtectŽes ; ces anomalies sont utilisŽes pour calculer la valeur du comportement du navire (ces valeurs sont dans PAMAS).

Ð PAMAS, pour conna”tre les valeurs des anomalies mais aussi pour lancer une phase dÕapprentissage par auto-adaptation de ces valeurs.

Ð Les opŽrateurs impliquŽs dans la surveillance maritime, qui re•oivent les alertes levŽes par OpMAS et qui, apr•s vŽrification, les valident ou les invalident. Les opŽrateurs peuvent Žgalement directement solliciter les agents-navires dÕOpMAS pour leur indiquer des alertes non identifiŽes.

4.2.2 Comportement collectif des agents-navires

Un agent-navire coop•re de mani•re directe, par envoi de messages, avec dÕautres agents-navires puisquÕil peut leur demander des informations telles que leur niveau de suspicion (i.e. leur valeur SBv de comportement), ou leur indiquer son niveau de suspicion. Il peut Žgalement indiquer sÕil a dŽclenchŽ une alerte afin que les navires qui partagent avec lui des anomalies ou qui naviguent dans son voisinage puissent recalculer leur valeur de comportement et Žventuellement dŽclencher une alerte. Ce comportement coopŽratif de dŽclenchement dÕalerte est important pour dŽterminer lÕensemble des navires impliquŽs dans une alerte.

Les agents-navires peuvent aussi coopŽrer de mani•re indirecte. Cela est important dans le contexte de la surveillance maritime afin de prendre en compte les activitŽs illŽgales rŽalisŽes par plusieurs navires dont le comportement individuel est normal, mais dont le comportement collectif est anormal. Dans un tel cas de figure, le moteur de r•gles est inutile puisquÕil ne dŽtecte aucune anomalie (individuelle). Pour pallier ce probl•me, OpMAS introduit la notion de stigmergie comme mŽcanisme de dŽtection. Un agent-navire peut donc marquer sa position dans lÕenvironnement dans le but dÕinformer les autres navires dÕun ŽvŽnement qui peut les intŽresser. Tout comme dans les cas des traces de phŽromones des fourmis, ces marques sont peu cožteuses en ressources et sÕav•rent •tre des sources dÕinformations utiles et prŽcieuses (Tsankova, 2004). Une marque est dŽposŽe par un agent-navire ; elle poss•de une valeur critique et un taux de persistance (dÕŽvaporation) traduisant sa durŽe de vie. Quand un autre agent-navire per•oit une marque, il peut ˆ son tour lÕutiliser si nŽcessaire dans le calcul de sa valeur de comportement et Žventuellement dŽclencher une alerte.

(14)

4.3. Les agents-anomalies et agents-param•tres dans PAMAS

Cette section dŽcrit les capacitŽs individuelles et les comportements collectifs des agents-anomalies et des agents-param•tres. Ces capacitŽs individuelles et ce comportement collectif sont les briques de base des algorithmes dÕapprentissage introduits en section 5.1.

4.3.1. CapacitŽs individuelles des agents-anomalies

Les agents-anomalies disposent des capacitŽs individuelles relatives ˆ lÕajustement des valeurs de leurs param•tres. Les agents-anomalies peuvent dŽclencher lÕajustement de tous leurs param•tres. Cette capacitŽ est utile en phase dÕapprentissage car les agents-anomalies concernŽs par une alerte invalidŽe vont •tre sollicitŽs par lÕagent-navire correspondant pour auto-adaptation de leurs valeurs. Les agents-anomalies vont alors solliciter leurs agents-param•tres pour quÕils sÕajustent (i.e. changent leurs valeurs Init, Incr et Decr). Les agents-anomalies peuvent Žgalement dŽterminer sÕil y a eu un ajustement de leurs param•tres. SÕil nÕy a pas eu dÕajustement, ils peuvent dŽcider dÕen imposer en fonction des ajustements rŽalisŽs par les autres agents-anomalies des alertes dans lesquels ils sont impliquŽs. Ils peuvent donc :

Ð demander lÕajustement de leurs agents-param•tres,

Ð calculer et communiquer leur importance, en tenant compte des poids de leurs agents-param•tres,

Ð calculer et communiquer leur criticitŽ, qui rŽsulte de la criticitŽ des agents-param•tres qui les composent.

4.3.2. CapacitŽs individuelles des agents-param•tres

Les agents-param•tres disposent des capacitŽs individuelles suivantes :

Ð SÕajuster i.e. auto-ajuster leur valeur Žvoluant dans un intervalle dŽfinissant lÕespace de recherche du param•tre dŽfini a priori par lÕopŽrateur. Ils utilisent pour cela un Adaptive Value Tracker (Lemouzy et al., 2011). Un AVT est un syst•me multi-agent capable dÕestimer la valeur dÕune variable donnŽe en fonction de retours per•us dans son environnement.

Ð Choisir de sÕajuster, en fonction de leurs ajustements passŽs (prise en compte de lÕhistorique des ajustements) et de la demande formulŽe par lÕopŽrateur qui peut •tre : (i) il faut monter au-dessus du seuil ou (ii) il faut descendre en dessous du seuil. Ë lÕissue de ce choix, les agents-param•tres dŽclenchent ou non lÕajustement.

Ð Communiquer leur valeur ˆ leur anomalie.

Ð Calculer et communiquer leur importance au sein de lÕanomalie afin de mener au mieux lÕauto-ajustement. Lˆ, cÕest le nombre de fois o• une anomalie sÕest produite, le temps quÕelle a durŽ ou le temps quÕil a fallu avant quÕelle ne se dissipe, qui est pris en compte.

(15)

Ð Calculer et communiquer leur criticitŽ, qui est une valeur numŽrique reprŽsentant la latitude quÕils ont ˆ sÕajuster en accord avec leur espace de recherche. Cette latitude peut •tre tr•s faible si, par exemple, la valeur du param•tre est tr•s proche de la borne supŽrieure de lÕintervalle dŽfinissant son espace de recherche et que le retour de lÕopŽrateur lui demande de monter (au dessus du seuil).

4.3.3. Comportement collectif des agents-anomalies et agents-param•tres

Au m•me titre que les agents-navires coop•rent entre eux de mani•re directe, par envoi de messages, pour se communiquer leur niveau de suspicion, les agents-anomalies coop•rent entre eux pour se communiquer leur criticitŽ. Ainsi, lorsque les agents param•tres de toutes les anomalies concernŽes par une situation dÕapprentissage refusent de sÕajuster, les agents-anomalies vont dŽsigner collectivement, ˆ partir de lÕŽchange de leur criticitŽ, celles(s) qui va (vont) se dŽvouer pour ajuster leur param•tres : cÕest (ce sont) lÕ (les) agent-anomalie(s) le (les) moins critique(s) qui demandera (demanderont) lÕajustement de leur agents-param•tres.

De mani•re analogue, les agents-param•tres coop•rent aussi entre eux de mani•re directe, par envoi de messages, pour se communiquer leur importance et leur criticitŽ. LÕimportance est prise en compte lors de lÕajustement dÕun agent

-param•tre car plus un agent est important, plus une modification de sa valeur va avoir des consŽquences significatives. La criticitŽ est Žgalement prise en compte lors dÕun ajustement, notamment lorsque les agents param•tres de toutes les anomalies concernŽes par une situation dÕapprentissage refusent de sÕajuster. Dans ce cas, les agents-param•tres vont dŽsigner collectivement, ˆ partir de lÕŽchange de leur criticitŽ, celui (ceux) qui va (vont) se dŽvouer pour auto-ajuster sa (leur) valeur(s) : cÕest (ce sont) lÕ (les) agent(s)-param•tres(s) le (les) moins critique(s) qui sÕauto-ajustera (sÕauto-ajusteront).

5. Apprentissage dans MAS4AT : mise en Ïuvre et Žvaluation

Cette section prŽsente dÕabord les algorithmes dÕapprentissage dŽveloppŽs dans le syst•me multi-agent MAS4AT. Elle explicite ensuite comment ce SMA a ŽtŽ mis en Ïuvre. Elle dŽcrit enfin les premi•res expŽrimentations effectuŽes en prŽsentant deux principaux cas dÕŽtude et les rŽsultats obtenus. Cette derni•re section analyse plus particuli•rement les rŽsultats de lÕapprentissage et notamment la convergence et lÕajustement.

5.1. Algorithmes dÕapprentissage

Un des objectifs de MAS4AT est lÕapprentissage par les agents de PaMAS des valeurs des anomalies dŽtectŽes et transmises par le moteur de r•gles. Cet apprentissage se fait lorsquÕune alerte levŽe par OpMAS est invalidŽe par un opŽrateur (alerte erronŽe) ou lorsque lÕopŽrateur dŽtecte une alerte non levŽe par MAS4AT. LÕajustement consiste ˆ ajuster la valeur des param•tres de chaque

(16)

anomalie impliquŽe dans lÕalerte correspondante. Plus prŽcisŽment, les agents-param•tres de PaMAS sÕauto-ajustent pour que leurs valeurs soient en adŽquation avec le retour de lÕopŽrateur. Cependant, m•me si lÕajustement repose essentiellement sur les agents-param•tres, chaque type dÕagent de MAS4AT participe ˆ lÕajustement, chacun avec un r™le particulier.

5.1.1. Les agents-navires dans lÕapprentissage

Comme nous lÕavons vu en section 4, le r™le des agents-navires est de reprŽsenter, dans lÕenvironnement de MAS4AT, les navires rŽels surveillŽs par le syst•me I2C. Ces agents re•oivent des anomalies en provenance du moteur de r•gles, calculent la valeur SBv du comportement des navires quÕils reprŽsentent et dŽclenchent une alerte lorsque cela est nŽcessaire, i.e. lorsque que SBv dŽpasse un seuil dÕalerte. LorsquÕune alerte est erronŽe ou non levŽe et quÕun retour nŽgatif (i.e. lÕalerte levŽe est invalidŽe ou une alerte non levŽe est dŽtectŽe) est renvoyŽ par lÕopŽrateur, les agents-navires provoquent alors un ajustement selon lÕalgorithme suivant. Algorithme Ajustement DŽbut ParallŽliser | appeler AjustementAnomalies Fin parallŽlisation SBv = somme(valeur_agents-param•tres) Si SBv == SBvAnterieur Alors | appeler AjustementAnomaliesMinimal Fin Si Fin

Algorithme 1. Les agents-navires dans lÕajustement

Cet algorithme indique que lorsquÕun retour nŽgatif est re•u, lÕagent-navire lÕayant re•u diffuse ce retour aux agents-anomalies concernŽs en leur demandant de sÕajuster. Les agents-anomalies sÕajustent (cf. section 5.1.2.) et renvoient leurs nouvelles valeurs ˆ lÕagent-navire qui va vŽrifier si la nouvelle valeur SBv calculŽe est conforme au retour opŽrateur, cÕest-ˆ-dire au-dessous du seuil dÕalerte si une alerte non valide a ŽtŽ dŽclenchŽe, ou au-dessus du seuil dÕalerte si lÕopŽrateur a indiquŽ ˆ MAS4AT quÕil aurait dž dŽclencher une alerte. Pour Žviter le sur-apprentissage, les agent-navires prennent en compte la nouvelle valeur de SBv et la transmettent aux opŽrateurs. Un nouvel ajustement sera demandŽ aux agents-anomalies uniquement apr•s rŽception dÕun nouveau feedback. Cependant, si cette nouvelle valeur de comportement est Žgale ˆ la valeur de comportement avant ajustement, les agents-navires vont forcer lÕajustement dÕau moins un des param•tres des anomalies impliquŽes. Ce cas de figure correspond au cas o• lÕensemble des agents-param•tres des anomalies concernŽes par une situation dÕapprentissage ont refusŽ de sÕajuster (cf. 4.3.2 : capacitŽ choisir de sÕajuster).

(17)

5.1.2. Les agents-anomalies et les agents-param•tres dans lÕapprentissage

Les agents-anomalies reprŽsentent la valeur des anomalies envoyŽes par le moteur de r•gles aux agents-navires. Plus prŽcisŽment, cette valeur est dŽcrite comme la combinaison des trois agents-param•tres Init, Incr et Decr (cf. section 4.3.). Lors de la phase dÕapprentissage, les agents-anomalies vont utiliser lÕalgorithme ci-dessous. Algorithme AjustementAnomalies DŽbut ParallŽliser | appeler AjustementParam•tres Fin parallŽlisation Fin

Algorithme 2a. Les agents-anomalies dans lÕajustement

Suite ˆ lÕajustement des agent-param•tres, les agent-anomalies transmettent leurs valeurs aux agent-navires qui vont calculer la nouvelle valeur de SBv. Si cette valeur nÕa pas changŽ, lÕagent-navire concernŽ va considŽrer quÕaucun ajustement nÕa ŽtŽ fait. Il va donc dŽclencher un ajustement minimal et forcer lÕajustement dÕau moins un des agents-anomalies impliquŽs, selon lÕalgorithme suivant.

Algorithme AjustementAnomaliesMinimal DŽbut

Calculer criticitŽ agents-anormalies

DŽsigner lÕ(s) agent(s)-anomalie(s) le(s) moins critique(s)

Appeler AjustementParam•tresMinimal

Fin

Algorithme 2b. Ajustement minimal des agent-anomalies

Lorsque les agent-param•tres re•oivent une demande dÕajustement de la part de leur agent-anomalie, lÕalgorithme suivant est utilisŽ.

Algorithme AjustementParam•tres DŽbut

Calculer SensAdjust = retourOpŽrateur * dynamique * importance +

(1 - dynamique) * SensAdjustPrŽcŽdent

Si (signe(SensAdjust) == retour) Alors

| Ajuster

Fin Si Fin

(18)

Les agents-param•tres se basent sur le retour re•u de lÕopŽrateur et sur lÕhistorique de leur Žvolution pour dŽcider de procŽder ou non ˆ lÕajustement. Si aucun retour nÕest fait par lÕopŽrateur, les agents-param•tres vont considŽrer un retour positif implicite. Cela leur permet de renforcer leur confiance dans la valeur quÕils attribuent ˆ leur param•tre propre. En revanche, lors de la rŽception dÕun retour nŽgatif, les agents-param•tres vont consulter lÕhistorique de leur Žvolution pour prendre la dŽcision dÕajustement ou non.

LÕhistorique de lÕŽvolution dÕun agent-param•tre est un indicateur des derni•res actions de lÕagent. Cela peut •tre vu comme la prŽfŽrence de lÕagent ˆ augmenter ou diminuer sa valeur en fonction des retours re•us. Cet historique est reprŽsentŽ par le terme (1 - dynamique) * SensAdjustPrŽcŽdent. La variable dynamique reprŽsente la dynamique de lÕenvironnement et va permettre de pondŽrer lÕimportance que lÕon souhaite donner ˆ la situation courante par rapport aux situations passŽes. La variable SensAdjustPrŽcŽdent est la prŽfŽrence de lÕagent ˆ augmenter ou abaisser sa valeur. On associe ˆ ce rŽsultat le calcul retourOpŽrateur * dynamique *

importance. La variable retourOpŽrateur est lÕaction demandŽe ˆ lÕagent-param•tre, i.e. augmenter ou abaisser la valeur globale de lÕanomalie. La variable importance

indique la part prise par lÕagent dans la situation courante ; cette valeur pond•re son action. Le rŽsultat de cette expression permet donc ˆ lÕagent-param•tre de prendre une dŽcision sur lÕaction ˆ effectuer. En effet, si le signe de SensAdjust est celui du retour per•u, alors lÕagent ajuste sa valeur. Dans le cas contraire, lÕagent ne fera rien car cela va ˆ lÕencontre de sa prŽfŽrence. Ainsi, si un retour nŽgatif demandant dÕabaisser la valeur globale est re•u par un agent qui a eu tendance ˆ augmenter sa valeur, cet agent prŽf•rera ne pas agir et laisser faire les agents plus aptes ˆ aller dans le sens demandŽ. Une fois que tous les agents-param•tres ont pris une dŽcision, et participŽ ou non ˆ lÕajustement de lÕanomalie, les nouvelles valeurs sont envoyŽes ˆ lÕagent-anomalie correspondant.

Algorithme AjustementParam•tresMinimal DŽbut

Calculer criticitŽ agents-param•tres

DŽsigner lÕ(s) agent(s)-param•tre(s) le(s) moins critique(s) Ajuster

Fin

Algorithme 3b. Ajustement minimal des agent-param•tres

Si chaque agent-param•tre de lÕanomalie dŽcide de ne pas sÕajuster car le retour demande un ajustement inverse ˆ leurs prŽfŽrences, on est dans le cas dÕun ajustement minimal. Les agents-param•tres vont alors Žchanger leurs criticitŽs. Cet indicateur, gŽrŽ par lÕAdaptive Value Tracker, va permettre aux agents-param•tres (i) de dŽterminer celui (ou ceux) qui est (sont) le(s) moins contraint(s) et (ii) de forcer son (leur) ajustement(s). Cette technique permet dÕŽviter une boucle infinie au niveau des agents-navires. En effet, si aucun param•tre dÕaucune anomalie ne sÕajuste, la nouvelle valeur SBv calculŽe ne sera pas diffŽrente de sa valeur

(19)

prŽcŽdente. LÕagent-navire demandera alors ˆ nouveau aux agents-param•tres, et donc aux agents-anomalies, de sÕajuster car la valeur SBv nÕa pas ŽvoluŽ et nÕest toujours pas conforme au retour re•u. Ainsi, on Žvite de dŽstabiliser le syst•me. LÕalgorithme dÕajustement minimal des param•tres est lÕalgorithme 3b.

5.2. Exploitation de MAS4AT

Le fonctionnement de MAS4AT prend en compte diffŽrents ŽlŽments. Dans un premier temps, il faut un environnement et des navires qui agissent dans cet environnement. De plus, un moteur de r•gles doit •tre capable dÕobserver ces navires et dÕanalyser leurs comportements pour envoyer des anomalies au SMA. Enfin, un opŽrateur doit •tre capable de comparer les alertes levŽes par le SMA avec ce quÕil se passe dans lÕenvironnement afin de valider ou invalider les alertes levŽes, et dans ce dernier cas, retourner une erreur ˆ MAS4AT. Nous avons donc construit une plateforme de simulation prenant en compte ces diffŽrents ŽlŽments pour nous permettre de tester et dÕŽvaluer le fonctionnement de MAS4AT. Comme nous pouvons le voir dans la figure 4, cette plateforme de simulation est constituŽe de trois composants en plus du syst•me MAS4AT : le GŽnŽrateur de ScŽnario, le

Moteur de R•gles et lÕOpŽrateur.

Figure 4. Architecture globale de la plateforme de simulation

Le GŽnŽrateur de scŽnarii construit un nombre donnŽ de navires et dÕanomalies diffŽrents. Ensuite, un scŽnario alŽatoire est crŽŽ et associŽ ˆ chaque navire. Un scŽnario est une suite non prŽvisible dÕanomalies qui se produisent sur un navire. Le gŽnŽrateur est cependant construit de mani•re ˆ Žviter des scŽnarios improbables. Toutes les donnŽes crŽŽes sont aussi des connaissances partagŽes avec les deux autres composants de la plateforme de simulation en tant que connaissance partagŽe.

(20)

Le Moteur de R•gles simule le fonctionnement du moteur de r•gles du syst•me I2C. Pour chaque navire, ce composant va lire sŽquentiellement le scŽnario associŽ et transmettre les anomalies per•ues au syst•me MAS4AT. Chaque anomalie reprŽsente dans I2C le rŽsultat dÕune analyse par le simulateur du moteur de r•gles et le dŽclenchement dÕune r•gle particuli•re. Ce sont les valeurs de ces anomalies que devront apprendre les agents de MAS4AT et qui seront utilisŽes pour calculer la valeur du comportement des navires.

LÕOpŽrateur est le composant qui simule lÕanalyse et le retour des opŽrateurs humains impliquŽs dans la surveillance maritime. Au sein de la plateforme de simulation, lorsquÕune alerte est levŽe par MAS4AT, elle est envoyŽe au composant

OpŽrateur qui va comparer les valeurs des anomalies qui constituent lÕalerte avec les

valeurs rŽelles. Dans le cas o• lÕalerte a ŽtŽ levŽe de mani•re erronŽe, lÕOpŽrateur envoie un retour nŽgatif ˆ MAS4AT. Sinon, aucun retour nÕest envoyŽ et le SMA lÕinterpr•tera comme un retour positif. Le composant OpŽrateur est aussi capable de signaler au SMA quÕune alerte aurait due •tre levŽe ˆ un instant donnŽ et que rien nÕa ŽtŽ fait, ce qui est aussi interprŽtŽ comme un retour nŽgatif par MAS4AT.

Cette plateforme a ŽtŽ con•ue pour remplacer les diffŽrents ŽlŽments qui constitueront le syst•me I2C final et qui seront en lien direct avec le syst•me multi-agent. Ainsi, outre les entrŽes et les sorties nŽcessaires ˆ son fonctionnement, chaque composant est un module indŽpendant qui peut •tre aisŽment retirŽ et remplacŽ dans la plateforme de simulation. Ë terme, chaque module pourra alors •tre supprimŽ et le syst•me multi-agent sera interfacŽ avec lÕŽquivalent au sein de I2C.

5.3. ƒvaluation de lÕapprentissage 5.3.1. Indicateurs pour lÕŽvaluation

LÕobjectif principal de MAS4AT est de lever des alertes pertinentes ˆ lÕattention des opŽrateurs du syst•me I2C. Pour ce faire, les agents-anomalies sont capables dÕapprendre les valeurs des anomalies quÕils reprŽsentent en accord avec les retours des opŽrateurs. Ë la lumi•re de cet objectif, nous avons choisi de mesurer lÕapprentissage de MAS4AT en observant la convergence du syst•me vers un Žtat stable. Cette convergence, que lÕon pourrait qualifier de globale, est le rŽsultat de la convergence locale des agents-anomalies vers les valeurs quÕils ont ˆ apprendre. Un Žtat stable du syst•me est un Žtat dans lequel lÕopŽrateur nÕenvoie plus de retours nŽgatifs ˆ MAS4AT. Pour avoir une Žvaluation plus prŽcise, nous allons nous baser sur le nombre de retours mais aussi sur lÕŽcart entre la valeur apprise par chaque agent-param•tre et la valeur ˆ apprendre. Nous allons pouvoir ainsi Žvaluer la vitesse dÕajustement et la justesse de lÕapprentissage effectuŽ.

Lors des tests que nous avons effectuŽs, nous avons spŽcifiŽ les bornes infŽrieure et supŽrieure de lÕespace de recherche pour les valeurs des agents-param•tres. Ainsi les valeurs ˆ apprendre par les agents-param•tres sont comprises entre 0 et 100.

(21)

5.3.2. Cas dÕŽtudes

Deux principaux cas ont ŽtŽ ŽtudiŽs. Dans un premier temps, nous avons testŽ MAS4AT dans un environnement contenant 1 anomalie et 10 navires. Ainsi, les scŽnarios construits pour chacun des dix navires ne contiennent quÕune seule anomalie pouvant se produire plusieurs fois. La figure 5 montre le rŽsultat de lÕapprentissage des agents-param•tres correspondant.

Figure 5. Convergence locale des agents-param•tres

Sur cette figure, nous pouvons apercevoir la convergence des valeurs apprise par chacun des param•tres vers la valeur rŽelle ˆ apprendre. Cette premi•re observation simple nous a permis de vŽrifier que les algorithmes dÕajustement permettaient de trouver la valeur souhaitŽe pour un agent-anomalie. En moyenne, sur une sŽrie de 50 jeux de tests, entre 20 et 40 retours de lÕOpŽrateur sont nŽcessaires pour que lÕajustement des param•tres m•ne aux valeurs correctes des agents-anomalies. Ces rŽsultats sont intŽressants car ils nous permettent de valider lÕajustement et nous pouvons nous assurer du fonctionnement de lÕauto-ajustement des agents de MAS4AT.

Dans un second temps, nous avons ŽvaluŽ le syst•me avec 10 anomalies et 10 agents. La figure 6 indique la convergence globale du syst•me vers un Žtat stable. Nous pouvons observer la stabilisation du syst•me, cÕest-ˆ-dire que les valeurs des anomalies sont suffisamment proches des valeurs rŽelles.

(22)

Figure 6. Convergence globale des agents-anomalies et agents-param•tres

Cet Žtat se traduit par lÕabsence de retours nŽgatifs en provenance des opŽrateurs. Dans le cas des simulations avec 10 navires et 10 anomalies diffŽrentes, le syst•me converge vers un Žtat stable avec entre 50 et 200 retours nŽgatifs (sur un jeu de 50 tests). Le nombre de retours nŽcessaires est relativement ŽlevŽ, mais cela sÕexplique par les algorithmes dÕajustement utilisŽs. En effet, ceux-ci doivent encore •tre optimisŽs pour prendre en compte des situations comme celle qui a eu lieu au pas de temps 4000. On peut voir sur la courbe de la figure 6 que les agents-anomalies Žtaient relativement proches des valeurs ˆ trouver mais quÕun retour nŽgatif a provoquŽ un ajustement qui a augmentŽ lÕŽcart entre les valeurs estimŽes par les agents-param•tres et les valeurs ˆ trouver, au lieu de le rŽduire. Cela sÕexplique par les valeurs initiales des param•tres, ŽloignŽes des valeurs cibles. Ainsi, les premiers retours re•us par les agents provoquent de grands pas dÕajustement. Ces rŽsultats nous permettent cependant de valider le fonctionnement des algorithmes dÕajustement des agents de MAS4AT dans des situations o• on trouve plusieurs navires et plusieurs anomalies. Il nous faut maintenant nous concentrer sur lÕoptimisation de ces algorithmes, notamment pour prendre en compte le dŽbut de lÕapprentissage.

6. Conclusion

Cet article a prŽsentŽ MAS4AT, un syst•me multi-agent (SMA) pour le dŽclenchement dÕalertes dans le cadre de la surveillance maritime. MAS4AT fonctionne en couplage avec un moteur de r•gles dŽtectant les anomalies de comportement de navires Žvoluant dans une zone maritime sous surveillance.

(23)

MAS4AT calcule le comportement des navires en cumulant lÕimportance associŽe aux diffŽrentes anomalies qui leur sont associŽes et dŽclenche une alerte ˆ destination dÕopŽrateurs humains impliquŽs dans la surveillance maritime lorsque ce comportement est ŽvaluŽ comme mena•ant. Les opŽrateurs valident ou invalident ces alertes qui sont documentŽes et transmises aux autoritŽs pour intervention, ou bien retournŽes au SMA pour une phase dÕapprentissage. Dans ce cas, le SMA ajuste par auto-adaptation les valeurs des anomalies afin de prendre en compte les retours des opŽrateurs humains. Ce syst•me est con•u et dŽveloppŽ dans le cadre du projet europŽen I2C.

Deux raisons principales nous font penser que lÕapproche adoptŽe dans I2C pour la surveillance maritime est pertinente. La premi•re repose sur le couplage du moteur de r•gles et du SMA. Le moteur de r•gles permet de modŽliser les comportements anomaux ˆ travers un ensemble de r•gles reprŽsentant la lŽgislation maritime. Se limiter ˆ utiliser un moteur de r•gles est cependant insuffisant car (i) il nÕest pas possible de dŽcrire toute la lŽgislation maritime ˆ travers des r•gles, (ii) il nÕest pas possible de faire une analogie avec anomalie et alerte, et (iii) tous les comportements anormaux ne sont pas connus ou modŽlisables sous forme de r•gles. Le SMA est introduit pour pallier ces insuffisances et notamment pour dŽclencher une alerte si le cumul des anomalies est supŽrieur ˆ un seuil dÕalerte donnŽ, mais aussi pour dŽcouvrir des comportements collectifs anormaux alors que les comportements individuels qui les composent sont considŽrŽs comme normaux. La deuxi•me raison repose sur le type dÕapprentissage utilisŽ dans I2C. En effet, cet apprentissage par renforcement qui tient compte des retours effectuŽs par les opŽrateurs humains impliquŽs dans la surveillance maritime est reconnu comme Žtant adaptŽ dans le cas dÕun SMA (Tan, 1993).

Plus prŽcisŽment, les contributions de lÕarticle sont les suivantes :

Ð La spŽcification des capacitŽs individuelles et comportements coopŽratifs des agents-navires, agents-anomalies et agents-param•tres de MAS4AT. Nous avons plus particuli•rement mis lÕaccent sur les propriŽtŽs et les capacitŽs spŽcifiques aux agents en leur permettant dÕajuster les valeurs des param•tres.

Ð Les algorithmes dÕapprentissage de ces diffŽrents agents. Nous avons dŽveloppŽ la mŽthode de dŽcision des agents lors de la rŽception dÕun feedback et explicitŽ en quoi lÕauto-ajustement des agents-param•tres permet dÕapprendre les valeurs cibles.

Ð Une implŽmentation de MAS4AT couplŽe ˆ un simulateur de scŽnario, dÕanomalies et de retours effectuŽs par des opŽrateurs humains. La plateforme SIM4AT a ŽtŽ dŽveloppŽe pour pallier au manque de donnŽes rŽelles et son architecture est expliquŽe dans lÕarticle, ainsi que ses interactions avec MAS4AT.

Ð Une premi•re Žvaluation de lÕapprentissage des agents de MAS4AT. Les premiers rŽsultats obtenus lors de lÕŽvaluation de lÕapprentissage montrent que les algorithmes dÕajustement con•us et dŽveloppŽs pour les diffŽrents agents permettent dÕapprendre les valeurs des anomalies de mani•re satisfaisante, cÕest-ˆ-dire quÕils

(24)

permettent la diminution de retours nŽgatifs des opŽrateurs au cours de la simulation. Ces rŽsultats nous permettent aussi de valider la modŽlisation et la mŽthode dÕajustement dŽterminŽe. En effet, les agents-param•tres sont capables de sÕauto-ajuster en se basant uniquement sur les retours des opŽrateurs. Chaque action des diffŽrents agents aura un impact sur la valeur de comportement des agents-navires et provoquera un retour, quÕil soit nŽgatif ou positif. Nous pouvons ainsi valider lÕutilisation dÕun apprentissage par renforcement en utilisant des SMA.

Nos travaux futurs vont dans un premier temps, cÕest-ˆ-dire ˆ court terme porter sur lÕoptimisation des algorithmes dÕajustement pour rŽduire le nombre de retours nŽcessaires ˆ lÕapprentissage des valeurs des anomalies. Nous allons pour cela Žtudier la possibilitŽ dÕassocier des poids diffŽrents aux anomalies. LÕimplantation actuelle ne consid•re en effet que des anomalies ayant le m•me poids, i.e. la m•me importance. Nous allons rŽflŽchir ˆ la pertinence de prendre en compte des anomalies dÕimportance diffŽrente et voir si ce nouveau crit•re amŽliore lÕapprentissage dans MAS4AT. Nous allons Žgalement confronter lÕapprentissage dans MAS4AT ˆ des cas rŽels de surveillance maritime. Cela sera probablement possible dans le courant de lÕannŽe 2013 lorsque les diffŽrents capteurs fixes ou mobiles dŽployŽs dans I2C seront compl•tement opŽrationnels. Cela permettra de valider le passage ˆ lÕŽchelle de MAS4AT.

Enfin, nous allons ˆ plus long terme essayer de voir dans quelle mesure le SMA pourrait faire des retours au moteurs de r•gles en lui proposant de nouvelles anomalies ou de nouvelles r•gles quÕil pourrait intŽgrer.

Bibliographie

Andrade M.A., Chacon P., Merelo J.J., Moran F. (1993). Evaluation of Secondary Structure of Proteins from UV Circular Dichroism Spectra Using an Unsupervised Learning Neural Network. Protein Engineering, vol. 6, Oxford University Press, p. 383-390.

Auslander B., Gupta K.M., Aha D.W. (2011). A comparative evaluation of anomaly detection algorithms for maritime video surveillance. Society of Photo-Optical Instrumentation

Engineers, vol. 8019, p. 3.

Barlow H.B. (1989). Unsupervised Learning. Neural Computation, vol. 1, n¡ 3, MIT-Press, p. 295-311.

Capera D., GeorgŽ J.P., Gleizes M.P., Glize P. (2003). The AMAS Theory for Complex Problem Solving based on Self-Organizing Cooperative Agents. Enabling Technologies

Infrastrucure for Collaborative Enterprises, WETICE, p. 383-388.

Celik M., Dadaser-Celik F., Dokuz A.S. (2011). Anomaly Detection in Temperature Data Usinf DBSCAN Algorithm. IEEE Innovations in Intelligent Systems and Applications

(INISTA), p.91-95.

Cohen C.J., Morelli F., Scott K.A. (2008). A Surveillance System for the Recognition of Intent Within Individuals and Crowds. Technologies for Homeland Security, 2008 IEEE

(25)

Coulom R. (2002). Reinforcement Learning using Neural Networks, with Applications to

Motor Control. Th•se de Doctorat, Institut National Polytechnique de Grenoble.

Cram D. (2010). DŽcouverte interactive et compl•te de chroniques : application ˆ la

co-construction de connaissance ˆ partir de traces. Th•se de Doctorat en Informatique,

UniversitŽ Claude Bertrand Lyon 1.

Direction des Constructions Navales, Syst•mes et services et partenaires. Description of

Work, Projet I2C, 2010.

Dousson C. (1994). Suivi dÕŽvolution et reconnaissance de chroniques. PhD thesis, UniversitŽ Paul Sabatier Toulouse 3.

Fok V., Lingard D.M. (2011). Using a Genetic Algorithm to Optimise Maritime Surveillance Performed by Space-based Sensors. National Committee for Space Science & National

Space Society of Australia.

Garcia J., Molina J.M., Singh T., Crassidis J., Llinas J. (2011). Research Opportunities in Contextualized Fusion System. The Harbor Surveillance Case. Advances in

Computational Intelligence, LNCS vol. 6692, p. 621-628.

GeorgŽ J.P., Gleizes M.P., Glize P. (2003). Conception de syst•mes adaptatifs ˆ fonctionnalitŽ Žmergente : la thŽories des AMAS. Revue dÕIntelligence Artificielle, vol. 17, n¡ 4, p. 591-626.

Gupta K.M., Aha D.W., Moore P. (2009). Case-based Collective Inference for Maritime Object Classification. Eighth International Conference on Case Based Reasoning, p.443-449.

Gupta S., Hossain L. (2003). Towards Near Real-Time Detection of Insider Trading Behavior Through Social Networks. Computer Fraud & Security, vol. 1, p. 7-16.

HŽbrard P. (2011). Politique maritime : La surveillance maritime, enjeu stratŽgique pour lÕUE. Revue Maritime, vol. 490, p. 68.

Hinton G., Sejnowski T.J. (editors) (1997). Unsupervised Learning : Foundation of Neural

Computation, MIT-Press.

Jakob M., Van!k O., Urban "., Benda P., P!chou#ek M. (2010). AgentC : Agent-based Testbed for Adversarial Modeling and Reasoning in maritime Domain. Proceedings of the

9th International Conference on Autonomous Agents and Multiagent Systems, vol. 1,

p. 1641-1642.

Juradsky D., Martin J.H., Kehler A., Vander-Linden K., Ward N. (2000). Speech and

Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice-Hall New Jersey,

Kaelbling L.P., Littman M.L., Moore A.W. (1996). Reinforcement Learning: a Survey.

Journal of Artificial Intelligence Research, vol. 4, p.237-285.

Lauer M., Riedmiller M. (2000). An Algorithm for Distributed Reinforcement Learning in Cooperative Multi-Agent Systems. Proceedings of the 17th International Conference on

Machine Learning, Citeseer.

Lemouzy S. (2011). Syst•mes intŽractifs adaptatifs par syst•mes multi-agents

auto-organisateurs : applications ˆ la personnalisation de lÕacc•s ˆ lÕinformation. Th•se de

(26)

Lemouzy S., Camps V., Glize P. (2011). Principles and Properties of a MAS Learning Algorithm: a Comparison with Standard Learning Algorithms Applied to Implicit Feedback Assessment. IEEE/WIC/ACM International Conference on Intelligent Agent

Technology, CPS, p. 228-235.

Li X., Xue Y., Chen Y., Mali B. (2011). Context-aware Anomaly Detection for electronic Medical Record Systems. Proceedings of the 2nd USENIX Conference on Health Security and Privacy, p. 812.

Mano J.P., GeorgŽ J.P., Gleizes M.P. (2010). Adaptive Multi-Agent System for Multi-Sensor Maritime Surveillance. International Conference on Practical Applications of Agents and

Multiagent Systems.

Nilsson M., van Laere J., Ziemke T., Edlund J. (2008). Extracting Rules from Expert Operators to Support Situation Awareness in Maritime Surveillance . Proceedings of the

11th International Conference on Information Fusion, IEEE.

Pao Y. (1989). Adaptive Pattern Recognition and Neural Networks. Addison-Wesley Publishing Co.

Sadri F. (2010). Logic-based approaches to intention recognition. Handbook of Research on

Ambient Intelligence: Trends and Perspectives.

Shi Y., Tian Y., Kou G., Peng Y., Li J. (2001). Network Intrusion Detection.

Optimization-based Data Mining: Theory and Applications, p. 237-241.

Shoham Y., Powers R., Grenager T. (2003). Multi-Agent Reinforcement Learning: a Critical Survey. Unpublished Survey http://robotics.stanford.edu/shoham.

Sutton R.S. (1988). Learning to Predict by the Method of Temporal Differences. Machine

Learning, vol. 3, p. 9-44.

Sutton R.S., Barto A.G. (1998). Reinforcement Learning: an Introduction, The MIT-Press Cambridge.

Tan K. (2005). A Multi-Agent System for Tracking the Intent of Surface Contacts in Ports and

Waterways. Naval Postgraduate School Monterey CA.

Tan M. (1993). Multi-agent Reinforcement Learning: Independent vs. Cooperative Agents.

Proceedings of the 10th International Conference on Machine Learning, p. 330-337.

Venturini G., Kodratoff Y. (1994). Apprentissage adaptatif et apprentissage supervisŽ par

algorithme gŽnŽtique. Th•se de Doctorat, UniversitŽ de Paris 11.

Watkins C.J.C.H., Dayan P. (1992). Q-Learning, Machine Learning, vol. 8, p. 279-292. Zander S., Nguyen T., Armitage G. (2005). Automated Traffic Classification and Application

Identification Using Machine Learning. The IEEE Conference on Local Computer