Architecture de contrôle hybride pour systèmes multi-robots mobiles

(1)

HAL Id: tel-00669559

https://tel.archives-ouvertes.fr/tel-00669559

Submitted on 13 Feb 2012

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Architecture de contrôle hybride pour systèmes

multi-robots mobiles

Ahmed Benzerrouk

To cite this version:

Ahmed Benzerrouk. Architecture de contrôle hybride pour systèmes multi-robots mobiles. Autre.

Université Blaise Pascal - Clermont-Ferrand II, 2011. Français. �NNT : 2011CLF22118�. �tel-00669559�

(2)

N

o

d'ordre: D. U : 2123

E D S PI C: 518

UNIVERSITE BLAISE PASCAL - CLERMONT II

ECOLE DOCTORALE

SCIENCES POUR L'INGENIEUR DE CLERMONT-FERRAND

Thèse

Présentée par

AHMED BENZERROUK

titre : Master Mécatronique

pour obtenirle grade de

DOCTEUR D'UNIVERSITE

SPECIALITE: Vision pour la robotique

Architecture de Contrôle Hybride pour les

Systèmes Multi-robots Mobiles.

Soutenue publiquementle 18avril 2011 devant lejury:

COMPOSITION DU JURY

M. Thierry FRAICHARD Président du jury

M. Lounis ADOUANE Encadrant

M. Rachid ALAMI Rapporteur

M. Philippe MARTINET Encadrant

M. René ZAPATA Rapporteur

(3)

(4)

Table des matières 3

Remerciements 5

Glossaire 9

Introduction générale 11

1 Etat de l'art et positionnement 15

1.1 Historique . . . 16

1.1.1 Pourquoi la robotique mobile?. . . 17

1.2 Le contrôle d'un robotmobile . . . 19

1.2.1 Laperception etla localisation . . . 20

1.2.2 Ladécision . . . 20

1.2.3 L'action . . . 21

1.3 Les systèmes multi-robots (SMR) . . . 22

1.3.1 Lestâches coopérativesen robotique mobile . . . 23

1.3.2 Lesmécanismes de coopération . . . 24

1.3.3 Lescritères de performance du système . . . 25

1.4 Classication des architectures de contrôle : centralisées,distribuées 29 1.4.1 Architecture de contrôle centralisée . . . 30

1.4.2 Architecture de contrôle distribuée . . . 30

1.4.3 Architecture de contrôle centralisée oudistribuée? . . . 31

1.5 Classication des architecture de contrôle distribuées : cognitives, réactives . . . 33

(5)

1.5.1 Architectures de contrôle cognitives . . . 33

1.5.2 Architectures de contrôle réactives . . . 34

1.5.3 Approches cognitiveversus réactive . . . 36

1.6 Tâche de navigation en formation : stratégies de contrôle . . . 39

1.6.1 Approche hiérarchique . . . 39

1.6.2 Approche comportementale . . . 43

1.6.3 Structure virtuelle . . . 48

1.7 Positionnement de la stratégiedu maintien de formationproposée 49 1.7.1 Justication des choix adoptés . . . 51

1.8 Conclusion . . . 53

2 Architecture de contrôle proposée 55 2.1 Principe généralde lastratégiede maintiende formation . . . 56

2.2 Modèle de l'entité robotique utilisé . . . 57

2.2.1 Robots mobiles àroues . . . 58

2.2.2 Modèle cinématique du robotmobileutilisé . . . 60

2.3 Structure de l'architecture de contrôle proposée . . . 62

2.3.1 Attractionvers une Cible Dynamique . . . 63

2.3.2 Evitement d'Obstacles . . . 72

2.3.3 Loide commande proposée . . . 86

2.3.4 Sélection d'actionhiérarchique . . . 88

2.3.5 Principe de coopération entre les robots (allocation dyna-mique des cibles) . . . 89

3 Stabilité de l'architecture de contrôle proposée 103 3.1 Introduction auxsystèmes hybrides . . . 105

3.1.1 Modes glissants . . . 106

3.1.2 Commutation hystérétique . . . 107

3.2 Stabilitédes systèmes hybrides . . . 109

3.2.1 Fonctionsde Lyapunov Multiples(FLM) . . . 111

(6)

3.2.3 Stabilitéfaible. . . 115

3.2.4 Discussion . . . 116

3.3 Stabilité de l'architecture de contrôle proposée . . . 117

3.3.1 Stabilitéde la loide commandeutilisantun seul contrôleur 118 3.3.2 Contrôleur d'évitementd'obstacles . . . 131

3.3.3 Stabilitéglobalede l'architecture de contrôle . . . 138

3.4 Simulation etdiscussion . . . 144 3.5 Conclusion . . . 149 4 Phase expérimentale 151 4.1 Plate-forme expérimentale . . . 152 4.1.1 L'environnement . . . 152 4.1.2 Supervision de l'expérimentation . . . 152

4.1.3 Lesrobots Khepera III . . . 156

4.2 Implémentationde l'architecture de contrôle proposée . . . 157

4.3 Expérimentations . . . 165

4.3.1 Évitement de collision entre lesrobots . . . 165

4.3.2 Navigation en formation et exibilité de l'architecture de contrôle proposée . . . 167

4.3.3 Stabilitéde l'architecture de contrôle proposée en présence d'obstacles . . . 170

5 Conclusion générale et perspectives 177

Annexes 182

A Algorithme d'évitement d'obstacles utilisé 185

B Dénitions de base de la stabilité 191

(7)

(8)

Ungrandmerci àmes parents! Sansleursoutien, mathèse n'aurait jamais vulejour.

CettethèseaétéréaliséeauLASMEA(LAboratoiredesSciencesetMatériauxpour l'Elec-tronique, et d'Automatique), au sein du groupe GRAVIR (Groupe Automatique, Vision et Robotique).Ellen'apuêtremenéeàboutsansl'aidedecertainespersonnesauxquellesjeveux diremerci.

Ainsi, je tiens àremercier en premier lieu Rachid Alami, Directeur de Recherche CNRS au LAAS, et René Zapata, Professeurà l'université de MontpellierII, pour avoiraccepté de rapportersurcettethèse.

MareconnaissancevaaussiàThierryFraichardpourm'avoirfait l'honneurde présiderle jurydesoutenance.

JeremercieNicolasAndreProfesseuràl'universitédeFranche-Comté,pouravoirdirigéma thèselesdeux premièresannées avantderejoindrel'universitéde Franche-Comté.Jeremercie également,PhilippeMartinet,Professeuràl'InstitutFrançaisdeMécaniqueAvancéepouravoir acceptédeleremplacerladernièreannée.Jelesremercietouslesdeuxpourleursconseilsqui ont aidé àl'avancement des travaux de ma thèse, et m'ont permis de prendre durecul pour placeretsituermestravaux.

JeremercieLounisAdouane,maitredeconférencesàPolytech'Clermont-Ferrandpouravoir encadrécettethèse.Jeleremerciepoursesconseils,pouravoirtoujoursétédisponibleetproche demestravauxtout enmelaissantunegrandelibertéd'action etdedécision.

Mes remerciementsvontaussi à Laurent Lequièvrepour tout le temps et les eorts que nous avonsinvestis dans la partie expérimentale. Je ne peux oublier de remercier également l'équipeVIPA qui nousasoutenus: Nadir Karam,Clément Deymier, Hicham Hadjet Datta Ramadasan.

Jeveuxaussidiremerciàtoutceuxqui,deprèsoudeloin,avecunecritique,uneremarque ousimplementunediscussionletempsd'unepause,ontinuencéd'unemanièreoud'uneautre mes travaux : Omar Ait-Aider, Pierre Avanzini, François Berry, Jonathan Courbon, Roland Lenain,Guillaume Lozenguez,YoucefMezouar, Jean-CharlesQuinton,BenoitThuilot,et j'en oubliecertainementd'autres.Jem'excused'avoiromisdelesciter.

Enn,merciàtousceuxquej'aiconnusaulaboratoirerendantlaviedanscelui-ciagréable etconviviale.Lalisteseralongue,maislespersonnessereconnaîtrontàtraverslespausescafé, soirées poker, week-ends canoe, et toutes les activitésqui nous ont unis. J'aipu nouer avec certainsunevéritableamitié.

(9)

(10)

mobilesesttraitéeeninvestiguantplusavantlespotentialitésdesarchitecturesdecontrôle com-portementalesdontlebutestdebriserlacomplexitédestâchesàexécuter.Eneet,lesrobots mobiles peuvent évoluerdans des environnementstrès complexes et nécessite desurcroît une coopération préciseet sécuriséedesvéhiculespouvant rapidement devenir inextricable.Ainsi, pourmaîtrisercettecomplexité,lecontrôleurdédiéàlaréalisationdelatâcheestdécomposéen unensemblede comportements/contrôleursélémentaires(évitementd'obstacleset decollision entrelesrobots,attractionversunecible,etc.)quilientlesinformationscapteurs(provenantde caméras,descapteurslocauxdurobot,etc.)auxactionneursdesdiérentes entitésrobotiques. Latâche considéréeest lanavigationen formationenprésence d'obstacles(statiqueset dyna-miques).Laspécicitédel'approchethéoriqueconsisteàallierlesavantages desarchitectures de contrôle comportementales à la méthode de la structure virtuelle où le groupe de robots mobilessuituncorpsvirtuelavecunedynamique(vitesse,direction)donnée.Ainsi,l'activation d'uncomportementélémentaireenfaveurd'unautresefaitenrespectantlescontraintes struc-turellesdesrobots(e.g.vitessesetaccélérationsmaximales,etc.)envued'assurerlemaximum de précision et de sécurité des mouvements coordonnés entre les diérentes entités mobiles. Lacoopération consisteà separtager lesplaces dans la structure virtuellede manière distri-buée et de façonà atteindre plus rapidement la formation désirée. Pour garantir les critères de performances visésparl'architecturede contrôle, les systèmeshybrides qui permettentde commanderdes systèmes continus en présenced'évènementsdiscrets sontexploités. En eet, ces contrôleurs (partie discrète) permettent de coordonnerl'activité des diérents comporte-ments (partie continue) disponibles au niveau de l'architecture, tout en orant une analyse automaticiennerigoureusedelastabilitédecelle-ciausensdeLyapunov.Chaquecontribution estillustréepardesrésultatsdesimulation.Ledernierchapitreestdédiéàl'implémentationde l'architecturedecontrôleproposéesurungroupederobotsmobilesKheperaIII.

Mots-clés: Systèmesmulti-robotsmobiles,Navigationenformation,Evitementd'obstacles, Architecturedecontrôle,Systèmeshybrides, stabilitéausensdeLyapunov.

Abstract : Inherentdiculty of coordinating agroupof mobile robots is treatedby inves-tigatingbehavior-basedarchitectureswhich aimtobreaktaskcomplexity.Infact,multi-robot navigation maybecome rapidlyinextricable, specicallyif itis madein hazardous and dyna-mical environment. The considered task is the navigation in formation in presence of (static and dynamic)obstacles.Toovercomeits complexity,it is proposed to divide the overalltask intotwobasicbehaviors/controllers(obstacleavoidance,attractiontoadynamicaltarget). Ap-pliedcontrolischosenamongthesecontrollersaccordingtosensorsinformation(camera,local sensors,etc.). Theoretic approachcombinesbehavior-basedand thevirtualstructurestrategy whichconsiderstheformationasavirtualbodywithagivendynamic(velocity,direction).Thus, activatingacontrolleroranotherisaccomplishedwhilerespectingstructuralrobotsconstraints (e.g.maximalvelocitiesandaccelerations).Theobjectiveistoinsurethehighestprecisionand safetyofthecoordinated motionbetweentherobots.These ones cooperatebyoptimizing the way of sharing their places in the formationin order to form it in afaster manner. To gua-rantee performance criteriaof thecontrol architecture, hybridsystems tolerating the control of continuous systemsin presenceof discrete events are explored.In fact,this control allows coordinating(bydiscretepart)thedierentbehaviors(continuouspart)ofthearchitecture.A completeanalysis ofthisarchitecturestabilityisalso giventhanksto Lyapunov-basedtheory. Everycontributionisillustratedthroughsimulationresults.Thelastchapterisdevotedto the implementationoftheproposedcontrolarchitectureonagroupofKheperaIIIrobots.

Key-words: Multi-mobilerobotssystem,Formationnavigation,Obstacleavoidance,Control architecture,Hybridsystems,Lyapunov-basedstability.

(11)

(12)

SMR :Système Multi-Robots.

FLM: théorème des Fonctionsde Lyapunov Multiple.

TT : Temps de Tenue.

TTM : Temps de Tenue Moyen.

V : Fonctionde Lyapunov.

v

i

:vitesse linéairedu robot

i

.

(13)

(14)

En résumé, cet essaim se reproduit, il est autonome, il est capable d'apprentissage, il possède une intelligence distribuée, collective et il est en mesure d'innover pour résoudre des problèmes. Autrement dit,pour ce qui est des caractéristiques concrètes, il est vivant.Voilà une sale nouvelle! Michael Crichton

LA PROIE , le livre de Michael Crichton [Crichton 03] est l'histoire de chercheurs qui ont créé un essaim composé de millions de robots de l'ordre du nanomètre. Cet essaim avaitpour objectif premier d'être une caméra autonome destinée àl'armée. Seulement, ilaéchappé aucontrôle des chercheurs et devient très dangereux pour les humains. Ce scénario de science-ction est parmi tant d'autres traduisantlespeurs desprogrèsscientiquesettechnologiques.Etsinos robotsdeviennent siautonomes à en perdrele contrôle?

Loin de ces questions philosophiques posées à la lecture de tels scénarios, cette histoirerappelleaussi combien l'objectif des chercheurs, et notamment des roboticiens,est d'exploiteretde rendre lesrobotsde plus en plus autonomes. Le but nal est de leur coner des tâches de plus en plus complexes, etde s'assurer qu'ils les accomplissent avec succès et sans une intervention humaine. Travail pénibled'ouvriers, assistanceàlapersonne,transport,ouexplorationsontautant dedomainesoùunrobotpeut rivaliseravec l'hommevoireréussirlàoùce dernier échoue.

Sereposantsurlanotiond'essaim,l'aspectmulti-robotsduscénariode Crich-ton ne peut échapper aulecteur. Cependant, lacoopération de plusieursrobots, notammentmobiles,pouraccomplirune tâche ne relève plusde lascience ction maisest aujourd'huiuneréalité.Lecontrôled'untelsystèmeconstitue la théma-tique générale des travaux de recherche abordés dans cette thèse. Les avantages

(15)

liés à cette coopération sont multiples. Fiabilité, exibilité, et rapidité induite par la redondance des entités robotiques sont des caractéristiques susamment convaincants pour se tourner vers ces systèmes.

Cependant, les enjeux engendrés sont tout aussi nombreux. En eet, la co-opérationde plusieurs robots signiequ'ils doivent partager des ressources com-munes, communiquer, et, pour chaque entité, tenir comptede l'actiondes autres an d'accomplir lasienne.

Plus particulièrement,l'objectif de nos travauxde thèse viseà construireune architecturedecontrôlepourunsystèmemulti-robotsévoluantenformationdans desenvironnementsencombrés(présenced'obstacles).Nousvoulonsaboutiràune structurede contrôlequisoitouverte. End'autrestermes,nousvoulonsquecette architecture puisse être aisément adaptée et modiée au fur et à mesure que la tâche à réaliser devient plus complexe.

L'approche théoriqueadoptée consisteàs'éloigner d'un contrôle centralisé au protd'uncontrôledistribuésurlesentitésrobotiques.Aussi,lesconceptions cog-nitives prônant l'utilisationde moyens sophistiqués et de planicationde tâches sont abandonnées pour tendre vers un contrôle plus réactif où les capteurs des robotssont leurs seules sourcesd'informations.

Dans ce contexte, nous proposons d'investiguer les architectures de contrôle comportementalesdontlebutpremierestdebriserlacomplexitédelatâcheà exé-cuter en ladécomposant en un ensemble de comportements/contrôleurs élémen-taires.Cetteapprocherépondraalorsàlacontrainted'ouvertureexigée.Eneet, pour coner une tâche plus complexe au système multi-robots, il sut d'a jou-ter lesnouveaux comportements/contrôleurs correspondant auxnouvelles tâches dans la base des comportements/contrôleurs déjà disponibles. A cette approche comportementale vient s'allier la méthode de la structure virtuelle où le groupe de robots mobiles suit un corps virtuel avec une dynamique (vitesse, direction) donnée.

Le contrôle de chaque robotdu système se fait alors en commutant entre les contrôleurs tout en respectant les contraintes structurelles des entités (vitesses maximales, accélérations maximales, etc.). Pour étudier et analyser la stabilité de l'architecture de contrôle proposée, les potentialités des systèmes hybrides permettantde contrôlerdes systèmescontinus(contrôleurs)enprésence d'évène-mentsdiscrets (conditions de commutationentre contrôleurs)seront exploitées.

(16)

Chapitre 1

Il est dédié à un état de l'art sur la robotique mobile. Les diérentes archi-tectures de contrôle utilisées en robotique mobile sont classiées. Une attention particulièreestaccordéeaucontrôledistribuéetréactifdessystèmesmulti-robots naviguant en formation. Les travaux proposés dans cette thèse sont positionnés par rapportaux travauxexistant.

Chapitre 2

Ce chapitre est consacré à l'architecture de contrôle proposée. Les diérents blocs constituant cette dernière sont expliqués de façon détaillée. Les contribu-tions apportées sontillustréespar des simulations.Lemécanismede coopération entre les entités robotiques y est également exposé.

Chapitre 3

En plus d'une introduction aux systèmes hybrides, ce chapitre comprend l'étude de la stabilité au sens de Lyapunov de l'architecture de contrôle pro-posée. On y trouveégalementla priseen comptedes contraintes structurelles du robot.Ils'agit de déterminerleslimites de l'architecture de contrôleproposée en fonction des contraintes cinématiques des robotsutilisés.

Chapitre 4

Il est consacré à la présentation détaillée de la plate-forme expérimentale. Il s'articule autour de la plate forme utilisée, les outils développés, et surtout l'implémentationeectivedes contributionsthéoriques sur des robotsmobilesde type Khepera III.

Le manuscrit setermine par une conclusiongénérale reprenant lesdiérentes contributions apportées ainsi que lesperspectives envisagées.

(17)

(18)

Etat de l'art et positionnement

Ce chapitre est consacré à un état de l'art sur les systèmes multi-robots mo-biles. Nous nous focaliserons principalementsur les types et la classication des architecturesde contrôle quileurs sontdédiées. Comptetenu des objectifs etdes travauxréalisés,uneattentionparticulièreseraaccordéeauxdiérentesapproches traitant leproblème de lanavigation en formation.

(19)

1.1 Historique

Le robot doit son nom à Karel CAPEK. Dérivé de robota , il signie corvée ou travail forcé en tchèque et dans les langues slaves. Ce mot fut alors utilisé pour la première fois dans la pièce de théâtre RUR

1

en 1921 où le robot cherche à détrôner l'homme en prenant laplace des ouvriers dans les usines.

Maisilafalluattendreledébutdesannées

1950

,pourquelespremiersrobots mobiles équipés de capteurs voient le jour. Ainsi, William Grey Walter mit au pointdes tortues(appelées lesTortuesde Bristol)(cf. Figure1.1). Chacune aun ÷ilphotoélectriquequilui permetde détecter lessources de lumière.Des ampli-cateurs transmettent le signal reçu par la plaque photoélectrique aux moteurs qui permettentà la tortuede s'approcher de lasource de lumière.

Figure 1.1Les tortues de Bristolpar WilliamGrey Walter.

Le premier robot mobileà comporter un planicateurd'actions (et donc une notion d'intelligence) s'appelle Shakey et fut développé au Stanford Research Institute SRIàlan des années1960. Ilfut équipéd'unecaméra,d'untélémètre et connecté àdeux ordinateursvia une liaison radio (cf. Figure1.2).

En france, le premier robot mobile est né au LAAS-CNRS en 1977. Il se localisaitdans unepièceen fusionnantlesdonnées de plusieurstypesde capteurs (ultrasons, odométrieet télémètre)(cf. Figure1.3).

Les avancées technologiques réalisées à lan du siècle dernier et jusqu'à nos joursontdonnénaissanceàdenouveauxmatériaux,desordinateursplusrapides, plus petits etmoins chers, etc. Ceci apropulsé larecherche en robotique mobile. Ainsi,lesrobotssedéplacentmaintenantsurlesol,dansl'air, sousl'eauetmême dans l'espace.

(20)

Figure 1.2 LerobotShakey de SRI.

Figure 1.3 Lerobot Hilaredu LAAS, France.

1.1.1 Pourquoi la robotique mobile?

Les applications de la robotique étaient en premier lieu principalement in-dustrielles. Elles reposaient sur des bras manipulateurs xes pour accomplir des tâches de manipulation,soudure, usinage,etc. L'inconvénient majeur de tels ro-botsest d'avoir un domaineatteignable limité par leurs structures.

(21)

En eet, grâce à cette propriété, il devient possible d'augmenter considérable-mentledomaineatteignabledu robotsansaugmenter ses dimensions, maisaussi d'élargirl'utilisationde la robotique à d'autres domaines.

Ainsi, l'agriculture a vu se développer des travaux de recherche menant à la commercialisation de tracteurs implantant des fonctionnalités semi-autonomes. On entend par semi-autonomeque seul l'ordre d'exécution de latâche à réaliser est donné par l'homme.Cependant, celle-ci est exécutée de façon complètement autonome. Lesvéhiculesagricoles (tondeuse,tracteurs, moissonneuses-batteuses, etc) AutoGuide de lasociété AGCO , ainsi que E-drive de Agrocom [Cariou10] permettent d'avancer parallèlement à la trajectoire précédente et eectuent, en tout autonomie, des corrections de parallélisme sur les lignes droites oucourbes (cf. Figure1.4).

Figure1.4 Utilisationde larobotique dans l'agriculture.

Le domaine militaire a aussi bénécié de cette révolution. Un exemple peut êtreillustréautraversdurobotPackbot[Yamauchi04].Cerobotestéquipéd'une caméra et peut transporter un bras manipulateur (cf. Figure 1.5). Il est conçu pour détecteretendommagerlesenginsexplosifsande sauverlaviedessoldats.

Figure1.5 Le robotPackbot, une créationde iRobot.

Les robots mobiles ont même précédé l'homme dans l'exploration spatiale. C'est notamment lecas du robotSojourner(cf. Figure1.6) quise pose sur le

(22)

solde laplanèteMarsàbord de lasondePathnder en juillet1997.Ses capteurs (caméras, capteurs lasers) lui permettent de naviguer en toute autonomie pour exécuter latâche demandée depuis la Terre.

Figure 1.6 Lerobot Sojourner utilisé par la NASA sur Mars.

Malgrétoutescesavancées,lamobilitésoulèveencoredenombreuxproblèmes. Eneet, lesrobots mobilessontamenésàévoluer demanièreautonomedans des environnements réels qui risquent d'être encombrés ou peu structurés. Plusieurs champsd'investigationpourlarecherchedans plusieursdisciplinesontalorsvule jour:enmécaniqueandedimensionnerlastructuredurobotetsamotorisation, en électronique pour choisir les composantsadéquats (alimentation des moteurs, cartesmémoire,etc.),en intelligence articielleetsciences cognitivespour repro-duirelesconnaissances animalessurlesrobots, en automatiqueoùonretrouve le contrôle régissantlecomportementdurobotmobiledansson environnement,etc. Letravailréalisé dans cette thèse s'inscritplutôt dans cette dernière discipline.

An d'explorer l'état de l'art et positionner nos contributions dans le cadre desarchitecturesde contrôle existantes, ilest d'abord proposé d'exposer certains éléments sur le contrôle de l'entité robotique dont la connaissance préalable est primordiale.

1.2 Le contrôle d'un robot mobile

Le contrôle d'un robot mobile nécessite naturellement la perception totale oupartielledel'environnementoùilsetrouve,ainsi quesalocalisationdanscet environnement,ande déciderde l'actionàentreprendre.On retientalorstrois éléments principaux indispensables au contrôle du robot mobile : la perception etla localisation,ladécision etl'action.

(23)

1.2.1 La perception et la localisation

Lesêtreshumainsetanimauxdisposentgénéralementde sens (vue,ouïe, tou-cher, etc) pour percevoir l'environnement dans lequel ils vivent et interagissent. A l'image des vivants, et pour naviguer dans son environnement an d'accom-plir la tâche désirée, le robot doit pouvoir le connaître. Ainsi, pour atteindre un point ou suivre une trajectoire, ou alors éviter un obstacle gênant, les ro-bots mobiles disposent généralement de capteurs permettant de récupérer des stimuli appropriés an d'alimenter un modèle et produire une représentation de cet environnement.La dispositiondes capteurs etson inuence sur laqualité du contrôledu robotattirent unelarge communautéinspiréegénéralementdes êtres vivants [Collins 05], [Iida 05]. Ainsi, des capteurs tactiles inspirés des poils des animaux comme les moustaches peuvent s'avérer très ecaces pour les robots mobiles an de détecter des obstacles ou suivre un mur par exemple [Fend 06]. Par contre, comparer un robot disposant de deux ou quatre capteurs, avec des précisionspouvantêtrelimitées,àunanimalayantdesmilliersde capteursrisque d'être très loin de la réalité. En conséquence, il faut trouver avec précaution le boncompromisentre lescapacités sensoriellesdes robotsetlatâcheàaccomplir.

On distingue deux types de capteurs en fonctionde ce qu'ils mesurent: 1. Lescapteurs extéroceptifs : ilsdécrivent l'interaction avec l'environnement

et informent donc sur la localisation relative du robot par rapport à cet environnement. Les caméras, les capteurs GPS Global Positioning Sys-tem , ultrasons, infrarouges, laser, radars magnétiques etc. font partie de cette catégorie.

2. Les capteurs proprioceptifs : ces capteurs mesurent l'état interne du robot (vitesse, position, couple, charge de la batterie, etc.). On retrouve dans cette catégorie à titre d'exemple, les capteurs d'odométrie permettant de donner une estimation de la position du robot et de son orientation. Ces estimations sont données par rapportà un repère de référence quiest celui du véhiculedans sa congurationinitiale sous leshypothèses de roulement sans glissement.

1.2.2 La décision

Dans cette phase, des éléments de décision interviennent pour décider des actions à entreprendre. Celles-ci sont choisies en fonction de la tâche à accom-plir et du contexte d'exécution déterminé par les éléments de perception et de localisation. Tout un niveau peut-être attribué à cet élément dans certaines ar-chitectures de contrôle étantdonné son importance. Ainsi,l'architectureLAAS

2

(24)

proposée dans[Alami98a] contientun niveau décisionnelcapabledeplanierdes actions et superviser leur exécution. Cette exécution relève de la responsabilité d'un niveau appelé niveau fonctionnel où setrouvent des modules qui ont accès auxressourcesdurobot(capteurs,actionneurs).Cesmodulessontsouslecontrôle d'un niveau appeléniveau exécutif (cf. Figure1.7(a)).

Dans l'architecture CLARAty 3

[Estlin 01], onretrouve un niveau décisionnel diviséen deux parties: un planicateuretun niveau exécutif (cf. Figure1.7(b)). La tâche globale à accomplirest d'abord fournie par le planicateur.Ce dernier brise sa complexité en la décomposant en un ensemble d'objectifs plus élémen-taires à accomplir. Ces objectifs sont ensuite coordonnés et exécutés dans un niveau inférieur (leniveau fonctionnel).

Niveau fonctionnel

Niveau décisionnel

modules

Tâche

Planificateur

Niveau exécutif

(a) ArchitectureLAAS

Planificateur

Base commune

Niveau exécutif

Niveau fonctionnel

(b) ArchitectureCLARAty

Figure1.7 Lesarchitectures LAAS et CLARAty dans leurs formes simples.

1.2.3 L'action

Les actions décidées dans la phase précédente sont utilisées pour calculer les commandesà appliquer auxrobots.

Lerobot,immergédanssonenvironnement,peut-êtrereprésentéparunschéma d'asservissementen automatique(cf.Figure1.8).Ainsi,leblocLoi de commande génèrela commandeà appliqueraux actionneurs (blocActionneurs) en fonction desinformationsfourniespar lescapteurs,etde laconsigne.Cettedernière est la tâchedésiréeprovenantde laphasededécision(tâche planiée,pointàatteindre, etc.).

(25)

Consigne

_{Loi de}

commande

Actionneurs

Capteurs

+

-

Robot

Sortie

Figure1.8 Schéma d'un asservissement d'un robotmobile.

Après avoirvulesélémentsnécessairesaucontrôled'unrobotmobile,àsavoir la perception et la localisation,la décision et l'action, nous allons dès à présent s'intéresser àson immersiondans ungroupede robotsmobilesdontlebut est de coopérer an de réaliserles tâches demandées.

1.3 Les systèmes multi-robots (SMR)

Ces dernières décennies, l'idéed'utiliserun groupe derobotsmobilesdans un seul environnementa attiréun grand nombre de roboticiens,notammentdans le domaine de la commande. L'intérêt porté à ce champ d'investigationest justié partouteslestâchespossiblesetvariéesqu'orel'utilisationd'ungroupederobots parrapportàunseul.Lesavancéestechnologiques réaliséesdansledomainede la communication entre systèmes ont grandement contribué aux résultats obtenus. Lalittératureest sirichequ'ilest dicilederassemblerun étatde l'artexhaustif sur le contrôle des SMR.

Avantd'abordercertainsaspectslesplussoulevésdanscedomaine,nous com-mençonsparlesnombreusesmotivationsencourageantàsetournervers unSMR:

1. comparé à un robotmobile unique, le SMRpeut améliorerletemps d'exé-cution de la tâche, voire laqualité d'exécution de celle-ci.Parexemple, un robot unique peut ne pas avoir la force nécessaire pour pousser un objet lourd.L'utilisationd'ungroupederobotspermetalorsdedivisercetteforce sur les diérentes entités robotiques qui peuvent détecter les points opti-maux où appliquer leurs eorts [Parra-Gonzalez 08], et pousser ensemble dans la direction de mouvement souhaitée [Yamada 01], [Adouane 04]. Un autreexemple est l'utilisationd'un groupe de robotsmobiles pour explorer un environnement dans le but d'élaborer une cartographie de cet environ-nement [Rekleitis 01]. L'idée est que chaque robot en explore une partie diérente etétablit une carte partiellequi servira àconstruire la carte glo-bale.Lacartographiedel'environnementparunouplusieursrobotsmobiles

(26)

est connudans lalittératuresous lenom de Simultaneous Localization And Mapping (SLAM).

2. avec un groupede robots mobiles,on bénécie d'une distribution des cap-teurs et des actionneurs sur les entités robotiques, ce qui rend le système plus tolérant à certains défauts de fonctionnement. Par exemple, la panne d'un robot n'entraîne pas l'arrêt systématique de la mission, du fait de la redondancedes entités robotiques [Mataric'95b].

3. l'utilisation d'un groupe de robots peut s'avérer une solution plus simple et moins chère que la conception d'un seul robot dont la structure et le contrôle peuvent vitedevenir complexeset encombrants.

Utiliser un groupe de robots mobiles paraît donc une idée séduisante. Cepen-dant, cela entraîne aussi l'apparition de certains aspects liés à l'interaction de plusieursentitésdans lemêmeenvironnement.Laprise encomptede ces aspects est indispensable pour contrôler un SMR. On distingue alors la tâche coopéra-tive à accomplir, les mécanismes de coopération entre entités, et les critères de performances du SMR.Ces points sont sommairementexplicités ci-dessous.

1.3.1 Les tâches coopératives en robotique mobile

La tâche coopérative peut être considérée comme l'objectif à atteindre par le système multi-robots. Cet objectif change selon les applications désirées ou le type de robots utilisés.

Pourqu'unetâche soitqualiéede coopérative,lesrobotschargésde l'accom-plir doivent coordonner leurs actions en interagissant dans le même environne-ment,eten partageantimpérativementdes objectifsetdes ressourcescommuns: pousser ou porter lemême objet, cartographier un environnement, etc. sont des exemplesdetâchescoopérativesdanslesquelschaque robotdoittenircomptedes actionsdes autresen accomplissant lasienne.

L'utilisation d'un SMR doit alors améliorer l'ecacité d'exécution de cette tâcheparrapportàlaqualitéd'exécutionoerteparunseulrobot.Ellepeutaussi rendrelatâchepossible,alorsquecelle-ciestirréalisableparunseul(parexemple, porteroupousserun objet trop lourdpour un seul robot,explorer une zonetrop vaste, etc.).Cela signiequedans tous lesdomaines oùlarobotiquemobile peut êtreutile,larobotiquecoopérativepeutapporterdenouvellespossibilités intéres-santes. Onpeut alors citerl'exploration spatiale[Huntsberger 03], lemaintien de formationde véhicules ou d'avions militaires[Balch99], le transbordement dans lesportsetaéroports [Alami98b],leconvoide véhiculespourletransporturbain de passagers [Bom05], sauvetage et navigation sous-marins [Bahr09], etc.

(27)

1.3.2 Les mécanismes de coopération

Ces mécanismes représentent la méthodologie utilisée pour la coordination entre les robotsan de présenter ou d'accomplirlatâche coopérative.Il est pos-sible de distinguer trois communautés scientiques diérentes qui abordent la coopération de robots mobiles sans pour autant pouvoir les dissocier complète-ment[Adouane05].

Une partie des travaux sur la robotique coopérative cherche à reproduire les activités des animaux, insectes, etc. En eet, l'homme a toujours eu des inspi-rations biologiques comme dans la gure (1.9) qui montre une analogie entre la navigationenformationd'avionsde chasseacrobatiquesetunsystèmebiologique composéd'oiseaux volanten formation.Ce typed'approches extrait de lanature estvenuenrichirledomainedelarobotiquecoopérativegrâceàl'introductiondes architecturesdecontrôlescomportementales[Brooks85],[Arkin86].Cesdernières sontdécritesparlarelationexistanteentre lestroisélémentscités précédemment (cf. Section 1.2) : perception, décision, et action. Le principe comportemental Behavior-based sert à examiner les caractéristiques et les règles de la vie sociale de certains animaux et insectes (oiseaux, poissons, fourmis, abeilles, etc) an de les reproduire sur des robots. Ainsi, dans [Mataric' 95a], des actions de fourragement, rassemblement en troupeaux, dispersion, etc, toutes inspirées de sociétés vivantes ont été reproduites sur de véritablesrobotsmobiles.

Figure 1.9 Analogieavionsmilitaires-oiseauxvolanten formation.

L'informatique a aussi des apports importants dans le domaine de la robo-tique coopérative.Cela a commencé avec l'apparition de lanotion d'Intelligence Articielle (IA), puis de l'Intelligence Articielle Distribuée produite par un en-sembled'agents coopératifs. Lesinformaticiens favorisent l'aspect conceptuel du problème àcelui de laprise en comptedes contraintes physiques desagentsdans leurenvironnement.Cependant,dénuderlesagentsdeleurscontraintesphysiques ensimulationrisquedecompliquerlepassageàl'implantationréelledessolutions

(28)

apportées à cause de l'absence d'une modélisation précise de la dynamique des agents.

L'approche robotique est sans doutela plus apte àlamise en ÷uvre eective de ses résultats, car elle se base sur un modèle (cinématique, géométrique, dy-namique) prenant en compte les contraintes réelles des entités robotiques, et de leurenvironnement. Contrairementauxapproches informatiquesetcelle inspirée des sociétés vivantes, et grâce à l'utilisation d'un modèle, l'approche robotique ore la possibilité d'étudier les performances du contrôle établi pour le système multi-robots selon certains critères de performances (cf. Section 1.3.3). Cepen-dant, cette étude peut se compliqueravec l'augmentation du nombre des entités robotiques dans le SMR. Même si l'architecture de contrôle proposée dans le cadrede cette thèse (cf.Chapitre 2)est basée sur leprincipecomportemental,le modèle cinématique oert par l'approche robotique constitue la base de l'étude de ses performances.

1.3.3 Les critères de performance du système

La performance etlajusticationde l'utilisationd'un SMRpeuvent être me-surées en se basant sur diérentes caractéristiques :

1.3.3.1 Temps d'exécution de la mission

C'estletempsmisparleSMRpouraccomplirlatâchedemandée(parexemple, poussée d'objets,cartographie,etc.). Commepremière intuition,ce temps d'exé-cutiondevraits'améliorerde façonproportionnelleaunombrede robotsgrâceau partagedes tâches (ex:cartographied'unenvironnement[Rekleitis01],[Sty01]). Cependant, ce n'est pas une règle générale. Dans [Adouane 05] où la tâche de pousser un objet aété étudiée, ilest montré que l'ajout de nouveaux robots mo-biles n'améliore pas forcément le temps d'exécution. En eet, des situations de conits entre les robots peuvent apparaître ce qui aecte directement ce temps. Ces conitssontdus àlasurface limitéede pousséequelesrobotscherchent à se partager. Un nombre optimal de robots

N

∗

est alors nécessaire. Avoir moins ou plus de

N

∗

robots pourraitnuire au temps d'exécution. Ce dernier a été mesuré dans la gure 1.10 par le nombre d'itérations nécessaires pour que la tâche soit accomplie.

N

c

désigne le nombre minimalde robots qui doivent pousser la boite aumême temps.

(29)

N*

Figure1.10Évolutiondunombred'itérationsnécessairespourréaliserlatâche coopérative de poussée d'objets en fonction du nombre de robotsutilisés.

1.3.3.2 Stabilité et abilité

La stabilité est sans doute une condition impérative pour le bon fonction-nement d'un système automatique. Une architecture de contrôle stable signie qu'elle assure au SMR d'atteindre la consigne désirée (point à atteindre, trajec-toireàsuivre, etc.)etdoncd'accomplirsatâche.Ilest aussisouhaitabled'étudier lasensibilitédu SMRàladéfaillanced'uneentité robotiqueetsacapacité ànir la mission même avec la perte totale (ex : arrêt du à une panne) ou partielle (ex:défaillancede certainscapteurs)d'unélémentde laottille.Dans l'architec-tureALLIANCE [Parker00], chaquerobot

r

i

calculeuncoecient demotivation globale propreà chaque tâche

a

ij

.Ce coecient est calculé commesuit











m

ij

(0) = 0

et

m

ij

(t) = [m

ij

(t − 1) + impatience

ij

(t)] × retour

_

capteur

ij

(t)×

suppression

_

activite

ij

(t) × reinitialisation

_

impatience

ij

(t) × accord

ij

(t)

La fonction

impatience

ij

(t)

décrit le taux d'impatience du robot.Les autres variables sont de type booléen telles que

retour

_

capteur

ij

(t)

décrit si les condi-tions nécessaires pour la réalisationd'une tâche sont réuniesou non;

suppression

_

activite

ij

(t)

indiques'ilexisteunetâche

a

ik

,telleque

k 6= j

,qui nécessited'êtreaccomplieàl'instant

t

;

reinitialisation

_

impatience

ij

(t)

estmise à

0

siun autre robotréaliseecacementlatâche que

r

i

s'impatiented'accomplir (et à

1

sinon).

accord

ij

(t)

détermine si le robot est d'accord pour abandonner la tâche qu'il réalise au prot d'un autre. Ainsi, en mesurant la motivation du robot, cette fonction ore à chaque entité la possibilité de vérier si les autres accomplissent bien leurs tâches. Par exemple si un robot

r

l

est en panne ou accomplitmalsatâche, lerobot

r

i

s'impatientede prendre lerelais ce qui donne l'assurance que latâche sera accomplie.

(30)

1.3.3.3 Complexité du calcul et de la communication nécessaires

Même silesavancéestechnologiques ontdonnénaissance àdes machines avec depuissantes capacitésdecalculetdesmoyensde communicationévolués, la ges-tion d'une ottille constituée d'un grand nombre de robotset la communication entre entités peuvent devenir complexes, voire irréalisables. C'est le cas notam-mentoùune seuleunitédecalculdoitgérerentempsréellecontrôlede toutesles entitésdecetteottille,surtoutsiellessedéplacentavecdesvitessesimportantes. En eet, un calcul et une communication coûteux en temps entraînent la dimi-nution de la fréquence de calcul et d'envoi des commandes aux entités. Celles-ci risquentalors desedéplaceren boucleouverte siletempsentre deuxcommandes reçuesestrelativementlong(risquedecollision,dépassementdesconsignes,etc.).

Lagure1.11 montreladiminutionde laqualité de serviceQoS du réseaude communication utilisé en fonctiondu nombre des robots. Cette grandeur mesure lacapacité duréseauàvéhiculerlesdonnéesdans debonnesconditionsentermes de retard de transmission, perte de paquets,et tâche à réaliser.

0 0,2

0,4

0,6

0,8

1 1,2

1 2 3

4 5 6

7 8 9 10 11 12 1 3 14 15 1 6 17 18 1 9 20 21 2 2 23 24 2 5 26 27 2 8 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

Q

o

S

Nombre de robots

Figure1.11 Inuence dunombre desentités robotiquesdu SMRsurlaqualité de service du réseau.

On remarquequel'augmentationdunombre desrobotsutilisésaecte sérieu-sement cette qualité de service.

Dans [Mechraoui 10], l'inuence de la communication sur la performance du système est illustrée.Pour cela, la tâche d'une unité de calcul commandant plu-sieursentités robotiques pour rejoindreleurscibles respectivesest considérée. La

(31)

gure 1.12montre latrajectoirede l'unedes entités devant sedéplacer de sa po-sition initiale

(0, 0)

à sacible situéeà

(1, 1)

.On remarqueque l'augmentationde la charge du réseau liée à l'augmentationdu nombre des robots du SMR aecte directement le comportement de chaque entité. En eet, un réseau trop chargé engendre des retards de communication. L'entité ne reçoit pas ses commandes à temps etéchoue dans sa tâche.

0

0.5

1

0

0.2

0.4

0.6

0.8

1 Trajectoire du robot

avec 50% de charge

X (m)

Y (m)

0

0.5

1

0

0.2

0.4

0.6

0.8

1 Trajectoire du robot

avec 90% de charge

X (m)

Y (m)

−0.5

0

0.5

1

1.5

0

0.2

0.4

0.6

0.8

1 Trajectoire du robot

avec 95% de charge

X (m)

Y

(m)

Figure 1.12 Inuence de la charge du réseau provoquée par le nombre des robotsutilisés sur la performance des entités robotiques.

1.3.3.4 Flexibilité

Il s'agit de la capacité du SMR à accepter l'ajout de nouvelles entités, en coursde laréalisationde latâche, silebesoins'en faitsentir.Il fautalorsétudier l'inuence des nouveaux robots sur lesélémentsde laottille déjàopérationnels.

Il est important de noter que ces paramètres sont fortement corrélés. Ainsi, allouer des tâches de façon à minimiserla complexité du calcul (ex : dans le cas d'une unité centrale assurant le calcul, programmer des tâches plus souvent en sériequ'enparallèle)signiel'augmentationdutempsd'exécutiondelamissionet viceversa.Ajouter de nouveaux robotsest souventsynonymed'augmentationde complexitéde calculce quin'est pas sans incidencesur letemps alorsnécessaire. Il s'agit alors souvent de chercher un compromis qui optimise leplus de critères en cherchant un nombre optimal de robots avec des vitesses maximalesprenant en compte lespuissances des unités de calcul [Brian02].

Nous avons vu dans cette section quel'utilisationde plusieursrobots, plutôt que d'un seul, présente de nombreux avantages. Cependant, an d'accomplir la tâche désiréede façonecace, ilest indéniabled'assurer une bonne coordination entre ces robots. Il faut donc prendre en considération qu'une mauvaise gestion des ressources communes ou une mauvaise coordination des agents a des réper-cussionsdirectes sur la productivité etles résultatsaccomplis(tout commedans

(32)

nos sociétés humaines). An d'éviter des situations de conit et de blocage qui peuvent en découler, il est important de mettre en place une stratégie pour al-louer lesactions aux robots. Cette stratégiepeut être centralisée au niveau d'un seulsuperviseur,oudistribuée surlatotalitéouunepartiedesentités.Les activi-tés humaines etanimales restent parmi les meilleuressources d'inspiration pour établirces stratégies.

Atitred'exemple,desactivitéshumainescommelesenchères,lesnégociations, etmêmedes sentimentsontété reproduitssur desrobotspour unemeilleure allo-cationdestâches. C'estlecas del'architectureALLIANCE quenousavons abor-dée dans le critère de abilité où l'impatience et la motivation sont reproduites surdesrobots.Cettearchitectureaététestéesurunetâchede fourragement [Par-ker 98], et de poussée d'objet [Parker94].

D'autres méthodes reprennent un fonctionnement plus collectif de la société humainehabituéeàlanotiond'hiérarchie:un courtier centraldécidedela répar-titionetl'attributiondestâchesetchaqueagentreçoitalorslamissiond'accomplir une partie de la tâche globale suivant son aptitude à réaliser cette tâche [Mar-tin99],[Sycara96].MURDOCH[Brian02],estunprocessusdistribué(cf.Section 1.4.2)surlesrobotsetutilisedesméthodesd'enchèreandegérerlacompétitivité entre les robots.

Pour explorer plus en détail ces coordinations, des architectures de contrôle ont fait l'objet de plusieurs travaux recherches. En eet, le contrôle des enti-tés robotiques constitue le noyau des SMR et sa qualité détermine directement sa performance. Ainsi, la section suivante est dédiée à un état de l'art sur ces architectures de contrôle etleur catégorisation.

1.4 Classication des architectures de contrôle :

centralisées, distribuées

Depuis la n des années 80, la recherche dans le cadre de la robotique co-opérative est devenu un centre d'intérêt majeur où plusieurs projets et tâches génériques ont vu le jour (cf. Section 1.3.1). Ces tâches orent aussi la possibi-litéd'évaluer lesarchitectures de contrôle proposées dans lalittérature, etdénir leurs avantages et inconvénients.

Unedistinctionprincipaleentrelesarchitecturesdecontrôleportesurlechoix de centraliser le contrôle du système multi-robots ou de le distribuer sur les en-tités robotiques. On trouve alors des architectures de contrôle centralisées et distribuées.

(33)

1.4.1 Architecture de contrôle centralisée

Comme son nom l'indique, le contrôle du SMR est délocalisé par rapport à la structure physique des robots et se trouve au niveau d'une unité centrale (superviseurdans[Jones01]ouplanicateurcentraldans [Noreils93])quigèreet garantitl'exécutiondelatâche.L'unitécontientlespartiessensorielles(capteurs) an de collecter les informations de l'environnement, et calcule les consignes de commande(positions,vitesses)qu'elleenvoieauxentitésrobotiques.Elleestaussi responsablede prendre les décisions pour laréalisationde latâche globaleet les communiquerauxrobots. Elledoitdoncavoirunepuissantecapacité calculatoire pour satisfaire à toutes ces exigences.

Comme dans [Khoshnevis 98], ce typed'architecture de contrôle a été essen-tiellementmotivé par deux facteurs:

l'ambition d'alléger la structure physique des robots : en eet, les robots utilisés n'ont besoin ni de capteurs embarqués ni d'une puissante unité de calcul.Ceci réduitconsidérablementleur coût.

laconcentrationdescapteursauniveaud'uneunitécentraleoreunemeilleure connaissance de l'environnement global, ce qui peut assurer une meilleure prise de décision par rapport à des robots se basant sur des informations locales fournies par des capteurs embarqués.

On peut faire l'analogie entre les architectures de contrôle centralisées et la notion d'hiérarchie chez les groupements sociaux, et notamment humaines dans lamanière de coordonner les actionsentre

un superviseurcentralayant une visionglobale de l'environnement etde la tâche à réaliser,

des robotsdisposantuniquementdes informationsutilesàl'exécution de la partie de la missionqui leur est conée par le superviseur.

1.4.2 Architecture de contrôle distribuée

Paropposition auxarchitectures de contrôle centralisées, lesressources (cap-teurs, unitésde calcul, etc.)sont dansce cas distribuéessur tous les élémentsdu SMR. Chaque robot n'utilise alors que ses propres capteurs et sa propre unité de calcul et de traitement. Il doit aussi pouvoir communiquer et partager des informations avec les autres robots an de les informer et de s'informer sur la progression de la mission.

La distribution des ressources peut être très avantageuse si la mission du SMR devient trop complexe et fastidieuse. En eet, la complication de la tâche duSMRentraînenaturellementlacomplicationducontrôlenécessairesibienqu'il

(34)

devient dicile voire impossible sa réalisation par un superviseur [Lerman 01]. Parexemple,lesimpleajoutdenouveauxrobotssigniedenouveauxagents(avec tous lescalculs relatifs) que lesuperviseur doit gérer.

Ce type d'architectures de contrôle est donc venu dans l'ambition de pal-lier aux limitations des architectures de contrôle centralisées. Néanmoins, elles partagent la même source d'inspiration qui reste les sociétés vivantes. Ainsi, le projet CEBOT (CEllular roBOTics System) [Fukuda 89] est un système distri-bué inspiré de l'organisation des cellules d'un organisme biologique. Les entités robotiques sont alors assimilées à des cellules couplées entre elles. Ces robots cellules sont continuellement recongurable an de répondre aux éxigences de l'environnement. Ce système est cité à titre d'example, beaucoup d'autres sys-tèmess'inscrivantdanslecadredessystèmesdistribuéspeuventêtretrouvésdans lalittérature [Jin 94], [Parker 98], [Yamaguchi01], [Zhiqiang 06].

1.4.3 Architecture de contrôle centralisée ou distribuée?

Chaque type d'architectures de contrôle présente ses avantages et ses incon-vénients. Il est alors dicilevoire impossible de privilégier un type plutôt qu'un autre sans connaître lanature de la mission conée auSMR nile contexte de sa réalisation.

En eet, l'unité centrale du contrôle centralisée dispose d'informations glo-bales de l'environnementce qui est un atout non négligeable d'aide àla décision et de coordination d'actions entre les éléments du SMR. Cependant, cette unité constitueaussi lalimitationdece typed'architecturesdu faitqu'elledoit gérerle contrôle et la communication de toutes les entités robotiques. Si puissante soit-elle, elle n'est pas à l'abri des goulots d'étranglement dans le cas où la mission demandée requiert lacoopération d'un nombre important de robotsmobiles. En eet, contrôler et communiquer avec tous les robots mobiles en temps réel de-viendraitimpossiblecar letempsde calculrisque de s'allongerlaissantlesrobots en boucle ouverte. De plus, le SMR dépend entièrement de cette unité, ce qui signiequ'un défaut du superviseur centralimplique l'arrêtcompletdu système.

Lesarchitecturesdecontrôledistribuéespermettentdetirerprotdela distri-butiondes ressources : chaque robotsecontentede prendre une décisionrelative à lui, en fonction des informations locales de l'environnement délivrées par ses proprescapteursetdesacommunicationavecsesvoisins.Cettedistributionallège la tâche des unités de calcul.De plus, les défauts de fonctionnement sont mieux gérésetlapanned'unrobotnesigniepasl'arrêtcompletdu SMR.Enrevanche, l'absence d'un superviseur global et d'une information globale sur l'environne-ment rend dicile la coordination des robots etl'optimisation de l'exécution de lamission.

(35)

Le tableau 1.1 résume lesdiérences observées principalementau niveau des trois modulesnécessairesà lacommandedes robotsmobiles,à savoir:la percep-tion et lalocalisation,la décision,etl'action (cf. Section1.2).

En pratique, beaucoup de SMR n'ont pas un contrôle strictement centralisé oustrictementdistribuéetutilisentdes architecturesdecontrôlehybrides centra-lisées/distribuéespour bénécierdesavantagesdesdeux approches. Parexemple, dans [Beard 01], [Das 02], [Feddema 02], [Stilwell 05], des robotspourtant auto-nomes, sontsoumis à un planicateurcentral.

Modules Architecture centralisée Architecture distribuée Perception et

localisation

L'unité centrale utilise des capteurs centralisés et cal-cule la localisation abso-luedans l'environnementde chaque robot.Lesrobots ne connaissent pas leur envi-ronnement.

Les robots utilisent leurs capteurs embarqués et se localisent de façon rela-tive par rapport à leurs consignes.

Décision L'unité centrale décide, cal-cule et génère directement des variables de commande (vitesses) qu'elle envoie aux robots.

Les robots génèrent leurs propres consignes de type chemin, trajectoire, points de passages, etc.

Action Les entités robotiques ap-pliquent directement les va-riables de commande calcu-lées par l'unité centrale à leurs moteurs.

Les robots assurent le res-pectdesconsignes qu'ilsont généréesàtraversdesloisde commandeavec un asservis-sementenboucleferméesur ces consignes.

Table1.1 Architecture centralisée versus distribuée.

La classicationdes architectures de contrôle peut alors être illustrée comme dans lagure 1.13. Cettegure sera mise à jouravec les nouvelles classications qu'on verra dans les prochains paragraphes, an de résumer les travaux réalisés dans ce domaine et pouvoir positionner les contributions apportées dans cette thèse.

(36)

Hybride

Architectures de contrôle

Distribuées

Centralisées

Contrôle

Organisation

Figure1.13 Classicationdes architecturesde contrôleselonleur organisation centralisée ou distribuée.

1.5 Classication des architecture de contrôle

dis-tribuées : cognitives, réactives

On a vu les deux approches principales utilisées pour la coordination et le contrôle d'un SMR, en l'occurrence les architectures de contrôle centralisées et distribuées.Nousverronsdans leschapitressuivantsquenouscherchons àrendre l'architecture de contrôleproposée laplusdistribuée possible.En eet,nous sou-haitonsqueleSMRsoitexibleausensqu'ondoittoujoursêtreenmesured'a jou-ter autant de nouvelles entités qu'on lesouhaite (cf. Section 1.3.3), ce qu'un su-perviseur central ne tolère pas forcément (cf. Section 1.4.3). Pour cette raison, nous allons nous focaliser sur les architectures de contrôle distribuées.

Ces dernières sont classées à leur tour en fonction de larelation entre la per-ception, la décision (planication), et l'action à l'intérieur de l'architecture de contrôle. On trouve ainsi principalement deux catégories d'architectures : cogni-tivesetréactives.Ladiérenceprincipaleentrelesdeux approchessetrouvedans lamanièredontleSMRgère une situationimprévisible: dansles approches cog-nitives, les actions des robots sont exclusivement le résultat d'un raisonnement intelligentissu decouchesdécisionnellesetexécutivessupérieuresconnaissant cettesituation,tandisquedanslesapprochesréactives,lesactionneursdesrobots réagissentdirectementauxstimulide l'environnement(informationsrelevées par lescapteurs) entemps réel. Desarchitectures de contrôle hybrides réactives/cog-nitivesconstituentlàaussiunetroisièmesolutiondontl'objectifestde rassembler lesbienfaits de ces deux types que nousallons décrire plus en détail dans les pa-ragraphes suivants.

1.5.1 Architectures de contrôle cognitives

Cette approche repose sur une décomposition fonctionnelle des diérentes tâches à exécuter. Cette décomposition suit la structure représentée dans la

(37)

-gure 1.14. Dans ce type d'architectures, il est impératif d'avoir une phase de planication basée sur un modèle de l'environnement. Ce modèle, généralement stocké dans la mémoire du robot, est alimenté à l'aide de capteurs et permet de planier la tâche désirée avant d'appliquer une quelconque action à ses mo-teurs [Grassi Junior 06]. Pour satisfaire à ces exigences, des moyens sophistiqués doivent être intégrés dans le robot utilisé. On trouvealors au moins :

une mémoire pour stocker la carte de l'environnement. Le robot doit aussi êtreen mesurede mettreàjources informations.Atitre d'exemple,l'ajout d'un élément dans l'environnement (un objet encombrant, un autre robot, etc) implique la mise à jour de la carte stockée dans la mémoire du robot an de prendre en compte cet élément dans laplanication de la tâche. une unité de calcul assez puissante pour répondre à la planication et/ou

replanicationdes trajectoires.

Pour lecas des SMR, une modélisationde l'environnement peut exister mais n'est pas impératif [Iocchi 01]. Dans ce cas, d'autres contraintes sont imposées aucomportement globaldu SMR.Ces contraintes fontque lesentitésrobotiques doiventcontinuellementtraiterungranduxd'informationséchangéesentreelles, via des protocoles de communicationévolués [Brian02].

Actionneurs

Capteurs

p

e

rc

e

p

ti

o

n

m

o

d

é

lis

a

ti

o

n

d

e

l

’e

n

v

ir

o

n

e

m

e

n

t

p

la

n

if

ic

a

ti

o

n

e

x

é

c

u

ti

o

n

d

e

l

a

t

â

c

h

e

c

o

m

a

n

d

e

d

e

s

m

o

te

u

rs

Figure 1.14 Décomposition classique des architectures de contrôle cognitives.

1.5.2 Architectures de contrôle réactives

Ce type d'architectures de contrôle est venu s'opposer aux architectures de contrôle cognitives dans le but d'obtenir un robot ou un SMR qui répond en tempsréelauxchangementsimprévisiblesde l'environnementsans recouriràune planicationpréalable.Lesconceptsdemodélisationdel'environnementetde rai-sonnementutilisés dans lesarchitectures de contrôle cognitives sont abandonnés au prot d'un contrôle complètement distribué sur les entités robotiques et une stratégiede stimuli-réponses(perception-action).Celasigniequ'ilyaunlien di-rect entre lesinformationsfournies par lescapteurs etlesactionsappliquées aux moteurs. Pour unSMR,chacun doitrépondreindividuellementauxchangements

(38)

qui peuvent l'aecter sans passer par un niveau décisionnel supérieur engageant une réorganisationcomplète du système.

Les travaux menés dans le contrôle réactif des robots mobiles doivent une grande partie de leur développement aux sociétés vivantes comme celles d'in-sectes. Ces derniers n'ont pas une grandecapacité de raisonnement. Cependant, ilsarriventàreproduiredescomportementscomplexesàpartirde lacoordination d'un ensemble de comportements élémentaires de base [Anderson 90].

Brooks[Brooks 85]est certainementl'un des premiersà avoirintroduit cette notion de réactivité au contrôle des robots mobiles. Contrairement aux archi-tectures de contrôle cognitives décomposées classiquement en blocs fonctionnels verticaux (cf. Figure 1.14), il propose de dénir l'architecture en blocs horizon-taux(cf.Figure1.15)appeléscomportements.Chaquecomportementtraduitune tâche élémentaire qui constitue une partie de la tâche globale désirée du robot. Cette approche ascendante, consistantà assembler plusieurscomportements élé-mentaires an de réaliser des tâches plus complexes, permet de rendre le SMR apte à accomplir de nouvelles missions en incrémentant simplement le bloc de comportements existant avec les nouveaux correspondant aux nouvelles tâches désirées.

Cette structure permettant une mise à jour incrémentale est souhaitable de-vant lacomplexité grandissante des missions accompliespar lesrobots. En eet, en revoyant les compétences exigées du SMR à la hausse, il ne sera plus né-cessaire de reconstruire entièrement une nouvelle architecture à chaque fois que la tâche à réaliser devient plus complexe. Il sura alors d'ajouter les nouveaux comportements désirés.

Comme l'un des objectifs de nos travaux est d'avoir une architecture de contrôle ouverte, c'est à dire que l'on peut mettre à jour en incrémentant de nouveaux comportements, il est proposé d'explorer plus loin les travaux sur les approches comportementales an d'en tirer prot (cf. Section1.6.2).

Explorer l’environnement

Naviguer sans objectif précis

Eviter les obstacles

Capteurs

Actionneurs

Figure1.15 Décompositionhorizontale des architectures de contrôle.

Une autreillustrationélégante du contrôle réactif est l'enveloppeZVD (Zone Virtuelle Déformable entourant le robot) proposée par Zapata [Zapata 94] et

(39)

permettantd'éviter des obstacles. On retrouve leliendirect entre lescapteurs et les actionneurs dans la mesure où les commandes sont générées en cherchant à minimiserlesdéformationsdelaZVDprovoquéesparlesobstacles.Cetteméthode sera exposée plus en détail dans la section2.3.2 (cf. page 72).

1.5.3 Approches cognitive versus réactive

Commenouspouvonsleconstater,chaqueécoleprésenteàtraversses spécici-tésdescaractéristiquesintéressantes.L'avantageprincipaldel'approchecognitive est qu'elle peut intégrer plusieurs principesde haut niveau : raisonnement, com-municationdehautniveau,etc.etelles'appuiesurunemodélisationde l'environ-nement lui permettant de prendre des décisions optimales avant d'entreprendre une quelconque action.Cependant, ces avantages sont rattrapés par certains in-convénients :

lesprincipes de haut niveau nécessitent des temps de calculsimportantset des moyens à coûts élevés,

l'environnement d'évolution doit être modélisable. En eet, un environne-mentfortementdynamiquenécessitedesmisesàjourfréquentes cequipeut devenir rapidementingérable.

Ilreste quelesdéveloppementsréaliséssur leplantechnologiqueontengendré des avancéesintéressantes pour lesapproches cognitives, ce qui aide àsurmonter certains inconvénients liés au temps de calcul grâce à la puissance actuelle des machines. Cependant, les environnements dynamiques sont synonymes de mise à jour régulière de leurs cartes et de replanication de la nouvelle tâche du ro-botdans lenouvelenvironnement.Lareplanicationde chemins des robotsdans les problèmes de navigation est un bon exemple [Fraichard 99]. Dans les envi-ronnements fortement dynamiques, et même si certains travaux réclament avoir nettement alléger le temps de calcul [Van den Berg 05], ce dernier reste directe-mentlié àla fréquence de replanication.

Les architectures de contrôle réactives permettent d'avoir une réponse plus rapide grâce à un lien direct capteurs-actionneurs. Disposer des comportements élémentairesdans lecasdes approchescomportementalespermetde lestester in-dividuellementjusqu'àcequ'ilssoientadaptésàleurstâches(trouverlesmeilleurs gains de commande,vérier leur stabilité,etc.). La mise à jour sefait alors sim-plement en les ajoutant auxcomportementsdéjà existants.

En contrepartie, l'absence d'une représentation explicite de l'environnement et de raisonnement de haut niveau limitentleurs applicationsdans des cas com-plexes.

(40)

La gure1.16 [Arkin98], [Adouane05]compare lescaractéristiques des deux types d'architectures de contrôle. La gure 1.13 peut alors être mise à jour en rajoutant un niveau déterminant la classication des architectures de contrôle selon leur degré d'intelligence (cf.Figure 1.17).

COGNITIVE

Symbolique

REACTIVE

Réflexive

Modélisation explicite de

l’environnement

Vitesse de réponse relativement lente

dans certains environnements

Haut niveau d’intelligence

Planification sophistiquée et préalable

de la tâche

Peut tenir compte de son passé

Absence d’une modélisation explicite

Fonctionne en temps réel

Peu ou pas d’intelligence

Fonctionnement en stimulus-réponse

Pas de mémoire de son historique

Dépendance à la précision, modèle du monde complet

Vitesse de la réponse

Capacités prédictives

Figure 1.16 Contrôle cognitif versus réactif.

Architectures de contrôle

Distribuées

Centralisées

Contrôle

Organisation

Intelligence

Cognitives

Réactives

Hybride

Figure 1.17 Classication des architectures de contrôle selon leur degré d'in-telligence.

(41)

Lesavantagesdesunesetdesautresontpoussécertainsroboticiensàcombiner les deux approches : une bonne illustration des approches hybrides peut-être montréepar lestravauxréalisés dans[Ranganathan03]pour un casmono-robot, oùune architecture de contrôle combinantnavigation réactive etplanicationde trajectoire (cognitive)est présentée. Lebut est de diminuerlesinconvénientsdes deux approches. Ainsi,l'architecturetendà utiliserlaplanicationde trajectoire lemoins de tempspossible,uniquementquand le robotest incapable d'atteindre sa destination en un temps déterminé (cf. Figure 1.18). Le fonctionnement de cette architecture se faitselon 3 modes :

1. d'abord le robot fonctionne avec une approche réactive : il se déplace vers un objectif en évitantles obstacles qu'il détecte par ses capteurs,

2. si lerobotn'arrive pas àson objectif aubout d'un certaintemps PERSIS-TENCE, cela veut dire qu'il ne progresse pas. Le planicateur intervient alorsetmetenplaceunetrajectoireàsuivreetdontleboutest unpointde transitionà atteindre (une sorte d'objectif intermédiaire).Le déplacement vers cet objectif virtuel sefait en mode réactif (mode 1),

3. si les deux modes précédents échouent dans l'acheminement du robot vers sonobjectif:unplanicateurdetrajectoireplaniealorsaurobotlechemin à suivre jusqu'àl'objectif nal.

Cette méthode a donné de bons résultats: elleengage moins de moyens que l'utilisation d'une approche cognitive pure, et réussit là où l'approche réactive échoue. Si on reprend la gure (1.18), une navigation réactive pure laisse le ro-bot bloqué dans le canyon. L'ouverture est assez limitée pour être correctement détectée par ses capteurs. L'utilisationd'une navigation purement cognitive est une solutionplausible,cependant ellesera inutile endehors ducanyonvuqu'une simple navigation réactive surait pour atteindre l'objectif nal. Une planica-tion est alors entreprise uniquement pour faire sortir le robot du canyon, avant que lanavigation réactivene prenne le relais.

Beaucoup d'autres architectures ont été développées dans ce sens [Kim 03b], [Paquier 03]. Néanmoins, ilest aussi utilede bien étudierleproblème de savoirà quelmomentilfautengager uncontrôleréactifouun contrôle cognitif[Firby87], [Arkin 89], [Gat 97].

D'après ce qui précède, on a vu que les architectures de contrôle peuvent être centralisées,oudistribuées.Enfonctiondu cahierdes charges quenousnous sommes imposé (cf. Introduction générale), nous nous intéressons à la tâche de la navigation en formation de robots mobiles. Nous souhaitons une architecture de contrôle qui soit la plus distribuée possible. Aussi, le maintien de formation se ferade façon réactive. Eneet, l'architecture proposée permettra d'accomplir cette tâche sans recourir à un contrôle cognitif gourmand en calcul. Ces choix sont justiés plus en détail dans la section1.7.

(42)

Canyon disposant d’un espace

limité pour la sortie du robot

Position initiale

du robot

Navigation réactive

Navigation cognitive (planifiée)

Objectif final

Objectif virtuel intermédiaire

Figure1.18 Utilisationd'un contrôle hybride cognitif/réactifpour fairesortir lerobot du canyon.

Dans ce qui suit, nous allons alorscompléter notre état de l'art en nous inté-ressant plus précisément aux diérentes stratégies existantes dans la littérature pour accomplircette tâche de maintiende formation.

1.6 Tâche de navigation en formation : stratégies

de contrôle

Avec un champ d'application large, la tâche de la navigation en formation attire depuis quelques années de plus en plus de roboticiens et fait l'objet de cette thèse.

Est appelée navigation en formation, la tâche accomplie par un ensemble de robots mobiles consistant à se déplacer en un seul groupe tout en maintenant unepositionetuneorientationrelativeentre lesentités robotiques.Cespositions et orientations dénissent la formation géométrique souhaitée (voir gure 1.19 parexemple)selon l'applicationdésirée.Nousnousintéressons iciauxdiérentes approches traitant le problème de la navigation en formation pour des robots mobiles à roues qui s'inscrivent dans le cadre réactif. Les travaux réalisés dans ledomaineconvergentprincipalementdanstroisapproches diérentes :approche hiérarchique, approche comportementale, etméthode de la structure virtuelle.

1.6.1 Approche hiérarchique

Dans cette approche, un ou plusieurs robots de la formation sont considérés commedesrobotsguidesquimènentlerestedesrobotsappeléssuiveurs. Généra-lement,leguide évolue sur une trajectoire prédénie tandisqueles autresrobots suiveurslesuiventavec unecertaine posture(distanceetorientation)relative(cf.

(43)

d

i

Suiveur

i

d

j

Suiveur

j

O

X

Y

Guide

v

L

Suiveur

k

d

k

ψ

Lj

ψ

Li

ψLk

v

k

v

j

v

i

Figure1.19 Formationcomposée d'un guideL et de trois suiveurs.

Figure 1.19) [Das 02], [Tanner 04], [Léchevin 06], [Gustavi 08]. Ainsi, quand le guide suit satrajectoire, lessuiveurs utilisentsa positionet son orientationpour calculerleurs propres consignes.

Lesdiérentes techniquesproposéesdans cetteapproche pour des robots mo-biles à roues,et qu'on trouve dans [Fierro01], [Das 02], [Spletzer 01], sont:

1.6.1.1 Contrôle par séparation-orientation (CSO)

Dans ce cas, le robotsuiveur

j

suit le guide

i

avec une distance (séparation)

d

ij

etune orientation

ψ

ij

désirées (cf.Figure 1.20).

1.6.1.2 Contrôle par séparation-séparation (CSS)

Le robot suiveur

k

suit deux robots guides

i

et

j

(ou plus), chacun avec des distances désirées

d

ik

et

d

jk

respectivement (cf. Figure1.21).

1.6.1.3 Contrôle par séparation-séparation de l'obstacle (CSSO)

Le contrôle d'un suiveur

j

est déni en suivant le guide

i

avec une distance désirée

d

ij

. De plus, un robot virtuel évoluant sur la bordure de l'obstacle est