Implémentation et modification de lois de commande pour le contrôle d’une flotte de robots mobiles en milieux naturels

(1)

HAL Id: hal-02597621

https://hal.inrae.fr/hal-02597621

Submitted on 15 May 2020

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

pour le contrôle d’une flotte de robots mobiles en

milieux naturels

J.B. Braconnier

To cite this version:

J.B. Braconnier. Implémentation et modification de lois de commande pour le contrôle d’une flotte de robots mobiles en milieux naturels. Sciences de l’environnement. 2012. �hal-02597621�

(2)

Rapport de Projet de Fin d’´Etudes

–

Impl´

ementation et modification de

lois de commande pour le contrˆ

ole

d’une flotte de robots mobiles en

milieux naturels

Jean-Baptiste Braconnier

3

eme`

ann´

ee – Pˆ

ole MMS – M´

ecatronique

7 septembre 2012 Entreprise : IRSTEA Tuteur Entreprise : Roland LENAIN Tuteur IFMA : Nicolas BOUTON Date : du 26 mars 2012 au 26 septembre 2012

Institut nationale de Recherche en Sciences et Technologie pour l’Environement et l’Agriculture

Campus Universitaire des C´ezeaux

24 Avenue des landais 63172 Aubi`ere

Institut Français de Mécanique Avancée

Campus de Clermont-Ferrand - Les C´ezeaux 63175 Aubi`ere Cedex - France Tel. +33 (0)4 73 28 80 00 - Fax +33 (0)4 73 28 81 00 [email protected] -www.ifma.fr

(3)

(4)

TITRE DU RAPPORT :

Rapport de Projet de Fin d’´Etudes

AUTEUR(S) : Jean-Baptiste Braconnier MMS – M´ecatronique

Date du document Nb pages R´ef´erence du document

7 septembre 2012 89 RapportIFMA.pdf

R´ESUM´E :

Le projet vise à développer des stratégies de commande pour contrôler et asservir une flotte de robots mobiles

Les plateformes permettant de tester ces lois de commandes sont aux nombre de trois : RobuFAST, Arroco, et un tracteur Massey Fergusson.

Lors de ce PIFE, mes missions ont été d’établir et de simuler la commande prédictive en vitesse des robots de la flotte, puis de travailler sur la méthode de positionnement des robots.

Mots-cl´e : Robotique mobile,commande

ABSTRACT :

The aims of my end of study project is to develop strategies of command to control and enslave a fleet of mobile robots

Platforms allowing to test these laws of commands are in number of three: RobuFAST, Arroco, and a Massey Fergusson tractor.

During this PIFE, my missions were to establish and to simulate the predictive speed command for robots of the fleet, then to work on the method of positioning of robots

(5)

(6)

Table des mati`

eres

Avant-propos 7

Introduction 9

1 Pr´esentation de l’IRSTEA 11

1.1 L’IRSTEA en France . . . 12

1.1.1 Les diff´erents centres en France . . . 12

1.1.2 Les diff´erents d´epartements . . . 12

1.1.3 Les produits de l’IRSTEA . . . 13

1.2 L’IRSTEA en Auvergne - Limousin . . . 14

1.2.1 Sp´ecificit´es et missions . . . 14

1.2.2 Les unit´es de recherche . . . 14

2 D´emonstrateur, instrumentation et commandes existantes 17 2.1 D´emonstrateurs et instrumentation . . . 18

2.1.1 Robots utilis´es . . . 18

2.1.2 Instrumentation . . . 19

2.2 Mod´elisation du robot et lois de commandes . . . 21

2.2.1 Modèle cinématique étendu . . . 21

2.2.2 Lois de commandes non lin´eaires de l’angle de braquage . . . 22

2.3 Conclusion sur la commande pour le suivi de trajectoires . . . 25

3 Lois de commandes d’une flotte de robots mobiles 27 3.1 Mod´elisation du probl`eme . . . 28

3.2 Lois de commande longitudinale et lat´erale . . . 29

3.2.1 Loi de commande longitudinale . . . 29

3.2.2 Loi de commande lat´eral . . . 30

3.3 Loi de commande longitudinale pr´edictive . . . 31

3.3.1 D´ecomposition de la loi de commande . . . 32

3.3.2 Mod´elisation du bas niveau . . . 32

3.3.3 Application de la commande prédictive au terme attaché à la tra-jectoire . . . 33

3.3.4 Simulation et r´esultats . . . 35

3.4 R´esultats en test r´eel . . . 37

3.5 Conclusion sur le convoi de robots . . . 38

4 Navigation inertielle 39 4.1 Positionnement hybrid´e . . . 40

4.2 Les différents repères d’étude et matrices de passage . . . 40

(7)

4.3.1 Initialisation de l’attitude : . . . 43

4.3.2 M´ethode de calcul d’attitude : . . . 43

4.4 Calculs de la position . . . 44

4.4.1 Utilisation des donn´ees inertielles seules . . . 44

4.4.2 utilisation des capteurs de vitesse des roues . . . 46

4.4.3 Estimation de βr avec les donn´ees inertielles . . . 50

4.5 R´esultats test r´eel . . . 53

4.5.1 Positionnement calcul´e sans hybridation . . . 53

4.5.2 Positionnement calcul´e avec hybridation . . . 54

4.5.3 Suivi de trajectoire en utilisant le positionnement calcul´e par hy-bridation . . . 56

4.5.4 Suivi de trajectoire en utilisant le positionnement calcul´e par hy-bridation avec une perte GPS pendant le suivi . . . 57

4.6 Conclusion sur le positionnement `a haute vitesse . . . 58

5 Conclusion sur mon stage et travaux futurs 59 A Principe de la commande prédictive 61 B Les différents modèles sous matlab/simulink 63 B.1 Modéle simulink de suivi de trajectoire d’un robot seul . . . 63

B.2 Mod´ele simulink du convoi de deux robots sans pr´ediction sur la commande en vitesse . . . 65

B.3 Mod`ele simulink du convoi de deux robots avec pr´ediction sur la commande en vitesse . . . 65

C Résultats des tests en conditions réelles de la commande prédictive en vitesse 67 C.1 Écart latéral à 2 m, écart longitudinal à 9 m . . . 68

C.1.1 Sans pr´ediction . . . 68

C.1.2 Horizon de pr´ediction 1.1 s . . . 69

C.1.4 Horizon de pr´ediction 2 s . . . 71

C.1.5 Comparaison des diff´erentes courbes . . . 72

C.2 Écart latéral à 3 m, écart longitudinal à 9 m . . . 73

C.2.1 Sans pr´ediction . . . 73

C.2.4 Comparaison des diff´erentes courbes . . . 76

D Programmes et algorithmes 77 D.1 Algorithme pour la commande pr´edictive en vitesse . . . 77

D.2 Classe Estimpos (hpp et cpp) permettant le calcul de position `a haute fr´equence . . . 78

D.2.1 Fichier header (Estimpos.hpp) . . . 78

(8)

Avant Propos

Ce rapport et le fruit de mon stage de fin d’étude de 6 mois à l’Institut nationale de Recherche en Sciences et Technologie pour l’Environnement et l’Agriculture, au sein de l’équipe TEAM (Technologies pour l’Épandage, les Agro-équipements, la Mobilité)

Je tiens `_{a remercier mon tuteur IRSTEA, Roland Lenain, ainsi que mon tuteur IFMA,}

Nicolas Bouton qui m’ont permis de travailler dans le domaine de la robotique et qui m’ont encadr´e tout au long de ce stage.

Je remercie ´_{egalement Michel Berducat qui m’a accueilli au sein de son équipe, ainsi} que Pierre Cartade avec qui j’ai travaillé, et partagé mon bureau durant toute la duré de ce stage.

(9)

(10)

Introduction

Aujourd’hui la robotique mobile repr´esente un domaine de recherche majeur pour un

certain nombre de secteurs, et notamment celui de l’agriculture.

De par la capacité des robots à effectuer des tâches pénibles pour l’homme, à accéder `

a des zones difficiles, et grâce à une certaine répétabilité qu’ils peuvent apporter dans le travail , ceux-ci représentent une réponse cohérente aux enjeux actuels du secteur agricole (augmentation des surfaces à exploiter, de la qualité ,des rendements. . .).

Ainsi depuis quelques ann´ees des travaux de recherche sont effectu´es au sein de l’IRSTEA (Institut nationale de Recherche en Sciences et Technologie pour l’Environnement et

l’A-griculture) dans le domaine de la robotique mobile, en particulier au sein de l’´equipe

TEAM (Technologies pour l’Épandage, les Agro-équipements, la Mobilité) dans laquelle j’ai effectué mon stage.

Ces recherches sont ax´ees principalement le d´eplacement autonome de robots mobiles

en milieux accident´es (un champ par exemple). Afin de pouvoir proposer une strat´egie

globale de commande pour l’asservissement des syst`emes soumis `a une dynamique

incer-taine, plusieurs axes de recherche sont présents au sein de l’équipe TEAM. On peut en dégager trois principaux :

• La commande des d´eplacements :

Il s’agit ici de proposer des lois de commande permettant le suivi de trajectoire précis, tout en tenant compte des différentes problématiques liées à l’environnement de déplacement et des différences des plateformes robotiques (glissement, utilisation de plusieurs trains directeurs, présence d’une remorque. . .).

Je présenterai les travaux effectués dans ce domaine dans le chapitre 2. • Le déplacement de flotte de robots en formation :

Ici il s’agit de reprendre les lois de commandes des déplacements des robots et de permettre à ceux-ci de se déplacer en formation. Pour cela il est nécessaire de leurs permettre d’échanger des informations, et comme nous le verrons dans le chapitre 3 de mettre en place une commande sur la vitesse des robots de la flotte par rapport `

a un robot leader.

• Le maintien de l’int´egrit´e des robots :

Au travers de cet axe, on cherche à mettre en place des lois assurant l’intégrité du véhicule. Pour cela des systèmes permettant par exemple la détection du ren-versement d’un véhicule puis la prédiction de celui-ci en fonction de sa dynamique ont était mis en place, ainsi que la possibilité de reconstruire le profil du terrain environnant à l’aide de radars par exemple, afin de générer par la suite des trajec-toires d’évitement des obstacles mis en évidences compatibles avec la dynamique du véhicule.

Suite à ces différentes recherches les lois de commandes pour le suivi de trajectoire d’un robot sont fonctionnelles (au moins à vitesse modérée). Ainsi le thème du suivi précis de trajectoire étant traité, il a été proposé au travers du projet SafePlatoon et de la thèse de Pierre Cartade, étudier la problématique des convois de véhicules autonomes. Mon stage s’inscrit également dans cet axe de recherche et j’ai donc était amené à travailler en collaboration avec Pierre.

(11)

Les objectifs de mon stage ´etaient donc les suivants :

• Dans un premier temps, il m’a fallu prendre en main les lois de commandes existantes sur le logiciel de simulation (matlab/simulink), afin de me familiariser avec celles-ci, et comprendre les strat´egies utilis´ees pour le suivi de trajectoire.

• Dans un second temps, j’ai traité la partie collaboration de véhicule (en collabora-tion avec Pierre Cartade), en m’intéressant particulièrement à l’asservissement de la vitesse d’un robot suiveur par rapport au leader. Ainsi en reprenant les travaux déjà effectués, j’ai réalisé l’asservissement en vitesse sous matlab/simulink. Mon travail a ensuite été repris par Pierre qui a implémenté la commande en vitesse au sein du programme du robot, afin de le tester en conditions réelles

• Enfin, il m’a était demandé de trouver une solution tirant parti des données des cap-teurs disponibles (centrales inertielles et autres capcap-teurs) sur les robots, dans le but de répondre à la problématique de positionnement à haute fréquence, ou pendant une perte de signal GPS.

Mon rapport s’articule donc de la fa¸con suivante : tout d’abord je ferrai une brève présentation de l’IRSTEA, ensuite je présenterai dans le chapitre 2 les différentes plate-formes robotiques, leurs instrumentations, et les lois de commandes pour le suivi de trajec-toires (Ce chapitre représentant la première phase de mon stage). Le chapitre 3 présentera mon travail effectué sur le déplacement en formation des robots. Enfin au sein du chapitre 4 je présenterai mon travail sur le positionnement à haute fréquence d’un robot.

(12)

(13)

1.1 L’IRSTEA en France

L’IRSTEA est l’Institut nationale de Recherche en Sciences et Technologie pour l’En-vironnement et l’Agriculture.

Cr´e´e en 1981 par la fusion entre le CNEEMA1 _{et le CTGREF}2_{, cet ´}_{Etablissement}

Public à caractère Scientifique et Technologique (EPST) est placé sous la double tutelle

du ministre de l’´Education Nationale, de la Recherche et de la Technologie, et du

min-istre de l’Agriculture et de la Pèche. Ses recherches sont axées sur la contribution au développement durable des territoires. Outre la participation au progrès des connais-sances, l’IRSTEA contribue aussi à l’élaboration de moyens de contrôle et de diagnostic. L’IRSTEA est composé de 900 personnes dont 450 ingénieurs et chercheurs, il accueille en moyenne 200 doctorants, 23 postdoctorants et 250 stagiaires.

1.1.1 Les diff´erents centres en France

Figure 1.1 – IRSTEA en France

La figure 1.1 représente la disposition des différents centres IRSTEA en France. En plus des villes apparaissant sur la carte, il faut rajouter le centre présent en Martinique. Chaque site comporte une ou plusieurs unités de recherche et traite différents thèmes suivant l’environnement dans lequel il est implanté.

1.1.2 Les diff´erents d´epartements

L’IRSTEA est un centre de recherches pluridisciplinaires axées sur l’agriculture, l’a-groalimentaire et l’étude des milieux aquatiques, il est divisé en 4 grandes orientations :

• Ressources en eau, usages et risques :

Les th`emes de recherche dans ce domaine permettent de d´evelopper des outils

pour gérer les besoins en eau ainsi qu’une gestion efficace des déchets pour prévenir

des risques naturels. Les unit´es de recherche fournissent des moyens aux acteurs

publics ou privés afin d’améliorer leurs équipements : ouvrage, réseau ou équipements hydrauliques.

Le département est lui-même scindé en deux unités : – Gestion de l’eau et des services publics associés. – Risques liés l’eau.

1. CNEEMA : Centre National d’ Étude et d’Expérimentations du Machinisme Agricole 2. CTGREF : Centre Technique du Génie Rural des Eaux et Forts

(14)

• Milieux aquatiques, qualit´e et rejets :

Ce département s’occupe de développer des outils afin d’améliorer la gestion des milieux aquatiques. Il apporte aux décideurs une vision globale des paramètres à

prendre en compte en appréhendant simultanément les enjeux liés l’eau dans la

société et le fonctionnement des systèmes aquatiques. Il se compose de deux unités :

– Technologies et procédés de l’eau et des déchets. – Qualité des systèmes écologiques aquatiques. • Gestion des territoires :

Il s’occupe de la gestion des espaces à dominante rurale et apporte une aide à la décision, la conception et la mise en œuvre des politiques publiques : agricoles, forestières, environnementales. Le département apporte son expertise et son appui

technique aux gestionnaires d’espaces naturels et acteurs du d´eveloppement et de

l’aménagement du territoire. Il se compose de deux unités : – Systèmes écologiques terrestres.

– Agriculture multifonctionnelle et nouvelle ruralité. • Écotechnologies et agrosystèmes :

Il s’agit du département de l’IRSTEA qui étudie les procédés technologiques utilisés en agriculture et agroalimentaire afin de les améliorer. A partir de ces résultats thématiques,les unités développent des innovations technologiques, réalisent des es-sais et des actions de normalisation.

Le département est scindé en deux unités :

– Technologies pour des syst`emes agricoles durables.

– Technologies et procédés physiques pour la sûreté des aliments.

1.1.3 Les produits de l’IRSTEA

L’IRSTEA n’a pas pour vocation la construction de machines, d’´equipements ou autres

en grandes s´eries puisqu’il s’agit d’un laboratoire de recherche. L’essentiel des produits propos´es par le centre est donc les suivants : 850 publications/an, 530 participations/an `

a des colloques, expertises et conseils aux services publics, 7 logiciels professionnels com-mercialis´es, 5 000 heures de cours, etc.

Après avoir présenté de manière synthétique la composition et l’organisation de l’IRSTEA en France, il convient maintenant de présenter plus particulièrement le centre présent en Auvergne au sein duquel j’ai effectué mon stage.

(15)

1.2 L’IRSTEA en Auvergne - Limousin

1.2.1 Sp´ecificit´es et missions

La région Auvergne-Limousin comporte deux sites situés à Aubière sur le campus des Cézeaux Clermont-Ferrand pour l’un et à Montoldre dans l’Allier pour l’autre (voir figure 1.2(a) et 1.2(b)).

(a) Site de Clermont-Ferrand (b) Site de Montoldre

Figure 1.2 – Les sites de l’IRSTEA en Auvergne-Limousin

Nich´e au cœur du Massif Central, l’IRSTEA en Auvergne centre ses recherches en

faveur du développement d’innovations technologiques pour l’agriculture et les territoires. Il est en relation directe avec tous les acteurs du développement régional de l’aménagement du territoire afin de les aider et de les conseiller sur le devenir des territoires ruraux. Le budget est d’environ 3 M d’euros. Les deux départements écotechnologies et agrosystèmes et Gestion des territoires sont représentés à l’IRSTEA de Clermont-Ferrand.

1.2.2 Les unit´es de recherche

Le groupement de Clermont-Ferrand compte au total 100 personnes (ingénieurs, thésards) et environ 25 stagiaires qui sont répartis dans 3 unités de recherche (représentants ainsi les deux départements cités dans la partie précédente) dont voici une description :

• L’unité de recherche Laboratoire d’ingénierie pour les Systèmes Complexes (LISC) qui développe des méthodes de modélisations génériques utilisables dans les domaines de l’IRSTEA.

• L’unit´e mixte de recherche Mtafort3 _cr´_{ee au 1er janvier 2005, rassemble une}

cinquan-taine de personnes de quatre organismes : IRSTEA, ENGREF4_{, ENITA- Clermont}5_,

INRA6_{. Cette unit´}_{e a pour objectif de contribuer `}_{a la compr´}_{ehension des} transfor-mations en cours dans les territoires ruraux et de participer `a l’accompagnement des acteurs qui les produisent.

• L’unité de recherche TSCF réalise des études sur le développement de nouveaux outils pour l’agriculture et la transformation alimentaire afin d’améliorer la qualité, 3. Mtafort : Mutations des activités, des espaces et des formes d’organisation dans les territoires ruraux

4. ENGREF : École Nationale du Génie Rural des Eaux et Forts 5. ENITA : École Nationale d’Ingénieur Technique Agronome 6. INRA : Institut National de Recherche en Agronomie

(16)

la sécurité et la tra¸cabilité des produits alimentaires, et de mesurer et réduire effi-cacement les impacts sur l’environnement. L’unité de recherche TSCF est basée sur les deux sites d’Aubière et de Montoldre et se divisait début 2009 en quatre équipes avec les thèmes de recherche (TR) suivants :

– Équipe Mobitech : TR MOST (Technologies pour la mobilité et la sécurité des agroéquipements)

– Équipe Capsol : TR CASYS (Technologies pour la caractérisation des éco et

agrosyst`emes)

– ´Equipe Gepand : TR TECHPROPRE (Technologies et r´eduction des pollutions

d’origine agricole)

– Équipe Copain : TR SYNERGIE (Systèmes d’information et représentations pour

la gestion int`egre de l’environnement).

Mon stage s’est déroulé au sein de l’équipe TEAM, dirigée par Monsieur Michel

(17)

(18)

D´

emonstrateur, instrumentation et

commandes existantes

Dans cette partie je présenterai tout d’abord les démonstrateurs (2 plateformes robo-tiques) utilisés au sein d’IRSTEA sur lesquels j’ai été amené à travailler, ainsi que leurs instrumentations.

Dans un deuxième temps, je présenterai la modélisation du système et les lois de commandes retenues pour le suivi de trajectoires d’un robot mobiles. Celles-ci seront par la suite réutilisées lors du convoi de véhicules.

Afin de me familiariser avec cette partie de la commande, durant la première période de mon stage, j’ai réimplémenté ces lois au sein d’un simulateur sous Matlab/Simulink. Le modèle utilisé sous Simulink d’où seront tirée les résultats que je présenterai au sein de ce chapitre est présenté en annexe (B.1).

(19)

2.1 D´

emonstrateurs et instrumentation

Afin de pouvoir valider les lois de commandes développées au sein d’IRSTEA et de les tester en conditions réelles, plusieurs plateformes robotiques instrumentées sont utilisées.

2.1.1 Robots utilis´es

Arroco

Arroco (présenté sur la figure 2.1), a été con¸cu par la société RoboSoft. Il est complètement ´

electrique, doté de 4 roues directrices et motrices indépendante. Il peut évoluer sur des pentes jusqu’à 35˚ avec une vitesse maximale de 4 m/s.

Figure 2.1 – Robot Arroco

Ses caract´eristiques principales sont donn´ees dans le tableau 2.1

Masse (m) 600kg

Empattement (L) 1.2m

Angle de braquage maximal 25˚

Temps de r´eponse angle de braquage 0.6s

Vitesse maximale 4m/s

Table 2.1 – Caract´eristique du Robot Arroco

RobuFAST

Le RobuFAST (présenté sur la figure 2.2), a aussi été con¸cu par la société RoboSoft. Sa conception est identique à celle d’Arroco au niveau du châssis et des mobilités, ce qui permet de faciliter la portabilité des algorithmes entre les deux robots. Cependant le RobuFAST a re¸cu des modifications lui permettant d’atteindre la vitesse de 8 m/s.

(20)

Figure 2.2 – Robot RobuFAST

Ses caractéristiques principales sont données dans le tableau 2.2. Ce robot permet de tester les algorithmes à plus haute vitesse.

Masse (m) 420kg

Empattement (L) 1.2m

Angle de braquage maximal 20˚

Temps de r´eponse angle de braquage 0.4s

Vitesse maximale 8m/s

Table 2.2 – Caract´eristique du Robot RobuFAST

2.1.2 Instrumentation

Afin de pouvoir commander les robots, plusieurs capteurs sont mis en place sur ces derniers. Ceux-ci permettent de mesurer les variables qui alimente les observateurs et donc les algorithmes de commandes pr´esent´es dans la section suivante (2.2).

La figure 2.3 explicite les capteurs embarqués sur les robots (ici RobuFAST), lorsque ceux ci sont équipées le plus complètement.

Figure 2.3 – Capteurs embarqu´ees (exemple sur RobuFAST)

(21)

GPS cin´ematique temps r´eel - GPS-RTK

Le principe du GPS RTK, est d’utiliser une basse auxiliaire permettant de corriger les erreurs des signaux GPS (retard et autres) ce qui permet d’augmenter la pr´ecision de celui-ci.

Le GPS nous fournit de l’information ext´eroceptive. Il fournit la position du robot `a

une pr´ecision de ±2cm en longitude et latitude et ±5cm en altitude. De plus il donne

´

egalement la vitesse absolue du robot, ainsi que son cap. `A partir de ces informations

l’état du robot par rapport à la trajectoire de référence est connu, ainsi que sa vitesse. Ces données sont essentielles et permettent ainsi de réaliser l’asservissement en alimentant les lois de commandes.

Centrale inertielle XSens MTi

La centrale inertielle (figure 2.4) et une centrale d’attitude. Elle est compos´ee de 9 capteurs :

– 3 accéléromètres – 3 gyroscopes – 3 magnétomètres

L’environnement de la centrale étant fortement pourvu en outils électriques, les données des magnétomètres ne seront pas utilisées, car faussées par les interférences existantes. Cependant les accélérations ainsi que les vitesses de rotation vont être utiles pour alimenter

les algorithmes permettant la commande du robot. De plus les donn´ees sont transmises

`

a une fréquence de 100 Hz, ce qui sera utile lors de l’élaboration d’un algorithme de positionnement du robot à haute fréquence (chapitre 4).

Figure 2.4 – Centrale inertielle XSens MTI

Module de communication sans fil

Afin de pouvoir réaliser le contrôle en formation d’une flotte de robots, il faut nécessairement que ceux-ci puissent échanger des informations. Cette communication est donc réalisé à l’aide de modules WIFI qui peuvent être embarqués sur l’ensemble des robots.

Autres capteurs

En plus de ces capteurs on a également accès à la vitesse et à l’angle de braquage de chacune des roues du robot ce qui est essentiel pour la commande de celui-ci.

(22)

2.2 Mod´

elisation du robot et lois de commandes

2.2.1 Modèle cinématique étendu

Le modèle cinématique étendue proposé dans [5],est celui utilisé au sein de l’IRSTEA. Il repose sur le modèle bicyclette simple (on considère uniquement les vecteurs vitesses en négligeant la dynamique du robot), auquel on rajoute la prise en compte des glissements du véhicule.

Chaque train (avant et arrière) étant vu comme une roue unique, le vecteur vitesse de chacune d’entre elles est porté par la direction de la roue, à laquelle s’ajoute l’angle de dérive dû à la non-condition de roulement sans glissement (ces angles sont estimés grâce `

a un observateur).

Figure 2.5 – Modèle cinématique étendu aux angles de dérives

Les notations correspondant `a la figure 2.5 sont les suivantes : – Γ est la trajectoire `a suivre.

– F et R sont respectivement le centre des roues virtuelles avant et arrière.R est le point à contrôler.

– L est l’empattement du v´ehicule.

– v est la vitesse linéaire du véhicule au point R, supposée strictement positive et

command´ee manuellement.

– δF et δR sont les angles de braquages des roues virtuelles avant et arri`ere. Ils con-stituent les deux variables de commandes.

– βF et βRsont les angles de d´erives des roues virtuelles avant et arri`ere. Il faut mettre en place un observateur pour connaitre leurs valeurs.

– M est le point de Γ le plus proche de R. M est suppos´e unique. – s est l’abscisse curviligne du point M le long de Γ.

– c(s) est la courbure de la trajectoire au point M.

– y et θ sont respectivement les écarts latéral et angulaire du véhicule par rapport à Γ.

(23)

Ainsi le modèle est régi par le système d’équations 2.1.          ˙s = vcos(˜θ+δR2) 1−c(s)y ˙ y = v sin(˜θ + δR2) ˙˜

θ = v[cos(δR2)tan(δF 2)−tan(δ_L R2) − c(s) cos(˜_1−c(s)yθ+δR2)]

(2.1)

avec : δR2 = δR+ βR et δF 2= δF + βF

Ce modèle présente une singularité lorsque y = _c(s)1 , c’est-à-dire lorsque les points A et R sont superposés. En pratique ce cas n’est jamais rencontré car on considère les rayons de courbures des trajectoires à suivre toujours grands comparés aux écarts y à la trajectoire.

On pose donc l’hypoth`ese suivante : |y| < 1

|c(s)| =⇒ 1 − c(s)y > 0 (2.2)

Ainsi les variables de commandes du syst`eme sont les angles de braquages βR, βF, et la vitesse lin´eaires du robot v. Les objectifs de la commande pour le suivi de trajectoire sont donc les suivants :

– Asservissement de l’écart latéral vers une consigne ; – Asservissement de l’écart angulaire vers une consigne ; – Asservissement de la vitesse.

Le modèle 2.1 peut être transformé en un système chainé (forme linéaire) par

change-ment de variable en l’´etat et la commande. Cela nous permet d’obtenir une loi de

com-mande non linéaire pour le suivi de trajectoire et dont les performances sont théoriquement indépendantes de la vitesse.

Bien que ce modèle permette de préserver la précision d’un suivi de trajectoire pour un robot mobile évoluant en milieu naturel. On néglige toujours les phénomènes dynamiques. Cela a pour conséquence un certain manque de réactivité dans l’observation des angles de dérives à haute vitesse, et la non pris en compte des phénomènes de basculement et renversement du robot.

L’observation des angles de dérives est présenté également dans [5] selon deux méthodes : cinématique (pour des faibles vitesses) et dynamiques (pour les vitesses plus élevées).

2.2.2 Lois de commandes non lin´eaires de l’angle de braquage

Commande adaptative

Lors du suivi de trajectoires par un robot seul, seule la commande de l’angle de braquage avant est considérée pour asservir les déplacements du robot sur la trajectoire prédéfinie avec une consigne d’écart yd potentiellement variable. La vitesse v ainsi que l’angle de braquages arrière δR sont considérés comme des paramètres du système. De plus les angles de dérives (δR, δF) sont connus grâce à une estimation en ligne issue d’un observateur (cf [5]).

Ainsi le modèle cinématique 2.1 peut être exploité pour la commande et être mis sous forme linéaire exacte en utilisant les systèmes chainés.

(24)

δF = arctan{tan(δR+ βR) + L cos(δR+ βR) (c(s) cos ˜θ2 k + A cos3θ˜2 k2 )} − βF (2.3) avec :                  ˜ θ2 = θ + δ˜ R+ βR k = 1 − c(s) y A = −Kpy− Kdk η + c(s) k tan2θ˜2 η = (tan ˜θ2− ˙ yd v cos ˜θ2) y _{= y − y}d (2.4)

Kd et Kp étant des gains permettant de spécifier une distance de réponse au lieu d’un temps de réponse (dut à la mise sous forme chainée). En pratique on prend Kp =

K2 d

4 afin d’obtenir un amortissement critique.

Avec la commande 2.3, l’´ecart lat´eral y converge vers yd et ˜θ2 converge vers 0. On

obtient donc une commande permettant d’obtenir de bons r´esultats dans le suivi de

tra-jectoire mˆeme en pr´esence de glissement. Cependant comme on peut le constater sur la

figure 2.6, qui montre l’erreur de suivi du robot par rapport à la trajectoire de référence lors d’une simulation sous matlab. On constate que l’écart latéral augmente en entrée et en sortie de virage. Cela est dû aux temps de réponse des actionneurs. Afin de corriger ces ´

ecarts, on dispose d’une commande plus ´elabor´ee qui va permettre d’anticiper la courbure de la trajectoire.

(a) trajectoire `a suivre (b) Erreur de suivi

Figure 2.6 – R´esultats de simulation matlab avec commande adaptative sur un robot `a un train directeur

Commande pr´edictive

Afin de remédier au problème souligné dans la partie précédente, à savoir qu’en régime

transitoire (variation importante de la courbure) le temps de r´eponse des actionneurs

introduit un écart non négligeable dans le suivi de trajectoires. Une loi de commande prédictive a été formulé.

Ainsi en en reprenant la loi de commande (2.3) du train avant, et en gardant comme considération que v et δRsont des paramètres mesurés, il est possible de décomposer cette expression en deux termes :

(25)

     δF = δT raj + δDeviation δT raj = arctan(up) δDeviation = arctan(_1+v_pv_up_p_+u2 p) (2.5) avec :    up = _cos(δL R+βR)c(s) cos ˜θ2 k vp = _cos(δL R+βR)A cos3_θ˜₂ k2 + tan(δR+ βR) (2.6)

Ainsi dans cette d´ecomposition (2.5) de la loi de commande, le rˆole de chacun des deux termes δT raj et δDeviation sont les suivants :

– δDeviation est le terme prenant en compte les erreurs de suivi et de glissement ceux-ci n’étant pas prévisibles il est inutile de l’intégrer dans un algorithme prédictif et restera donc inchangé.

– δT raj ce terme dépend de la courbure de la trajectoire de référence, il est responsable de l’égalité entre la courbure de la trajectoire de référence et celle du déplacement du robot. Or la trajectoire de référence étant parfaitement connu, c’est ce terme qui sera remplacé par l’algorithme de prédiction.

L’élaboration de la commande s’effectue donc suivant le principe représenté sur la figure 2.7.

Figure 2.7 – Algorithme de suivi avec pr´ediction et glissement

Ainsi une fois l’algorithme de prédiction utilisé (le principe est détaillé dans [4] et à l’annexe A, et sera repris en détail dans la section 3.3.3), on obtient finalement le terme δpred_{T raj}, qui est le terme de la commande asservissant la courbure du robot par rapport à celle de la trajectoire qui remplacera δT raj.

La commande finale envoy´ee au robot est donc la suivante :

δF = δT rajpred + δDeviation (2.7)

Cette loi de commande permet donc de réduire les erreurs de suivi constatées précédemment avec la commande adaptative seule, comme on peut le constater sur la figure 2.8, qui

reprend les mˆemes conditions de simulation sous Matlab que pour les r´esultats de la

(26)

(a) trajectoire `a suivre (b) Erreur de suivi

Figure 2.8 – Résultats de simulation matlab avec commande adaptative et prédictive sur un robot à un train directeur

2.3 Conclusion sur la commande pour le suivi de trajectoires

Dans ce chapitre, on a ´etabli la commande permettant un suivi de trajectoire pr´ecis en milieu naturel.

Par prise en compte des glissements dans le mod`ele, puis mise en place d’une partie

pr´edictive modifiant la commande adaptative, on obtient finalement une loi de commande

permettant d’effectuer un suivi de trajectoire avec un écart latéral de ±20cm, ce qui est très satisfaisant pour les applications envisagées.

Ayant maintenant une commande pour le suivi de trajectoire fonctionnelle pour un véhicule, nous allons nous intéresser à la possibilité de commander une flotte de robot mobile.

(27)

(28)

Lois de commandes d’une flotte de

robots mobiles

Dans ce chapitre je vais présenter le travail effectué sur la commande des robots se dépla¸cant en formation.

L’intérêt de la recherche dans ce domaine est d’augmenter les espaces couverts par les robots, sans pour autant utiliser de grandes machines qui provoquent un important compactage des sols. On peut également envisager l’utilisation d’une flotte de robots pour des applications comme l’exploration, la surveillance, ect.

L’objectif ici, est de permettre à deux robots (pour ensuite généraliser à n robots) de suivre une trajectoire de référence avec un écart latéral prédéfini (soit ce qui est fait avec la commande présentée dans le chapitre précédent). Mais en plus, on veut que le robot que l’on considèrera comme le suiveur (l’autre étant le leader) respect une distance longitudinale entre lui et le leader (distance le long de la trajectoire à suivre).

Ainsi il apparaˆıt n´ecessaire d’asservir l’abscisse curviligne du suiveur par rapport au leader, ce qui dans les faits revient `a asservir la vitesse du suiveur en fonction de la vitesse du leader.

Au sein de ce chapitre je présenterai tout d’abord l’aspect théorique de mon travail, puis les résultats obtenus sous Matlab/Simulink une fois la commande en vitesse implémentée. Enfin je présenterai les résultats obtenus en conditions réels après implémentation de la commande (par Pierre Cartade) dans les programmes des robots.

(29)

La commande d’une flotte de robots mobiles va prendre en compte la trajectoire de référence, qui sera utilisée pour le positionnement latéral et longitudinal de chaque robot. L’objectif et d’assurer un mouvement précis des robots dans une configuration désirée mais potentiellement variable le long de cette trajectoire.

Ainsi la modélisation du problème, dans le cas de deux robots, est représenté à la figure 3.1.

Figure 3.1 – Mod`ele longitudinale d’une flotte de robots

Dans cette représentation chaque robot est modélisé selon le modèle d’Ackermann déjà présenté à la section 2.2.1.Cependant on considère ici que la roue arrière est fixe donc δR est nul pour tous les robots. On a ainsi pour le ieme` _{robot :}

– Γ est la trajectoire à suivre (identique pour chaque robot). – Oi est le centre de l’axe arrière du ième robot .

– si est l’abscisse curviligne du point le plus proche de Oi sur la trajectoire. C’est la distance parcourue par le robot i le long de Γ.

– c(si) est la courbure de la trajectoire Γ en si.

– ˜θi indique l’écart angulaire du ième robot par rapport à Γ. – yi indique l’écart latéral du ième robot par rapport à Γ. – δi est l’angle de braquage du ième robot .

– l est l’empattement du robot.

– vi est la vitesse lin´eaire du ieme` robot au point Oi. – βF

i et βiR indiquent les angles de glissement (avant et arri`ere) du ieme` robot.

Avec ces notations les ´equations du mouvement de l’expression ( :modci deviennent

pour le i`eme robot

         ˙ si = vi cos(˜θi+βR_i) 1−c(s)iyi ˙ yi = visin(˜θi+ βiR) ˙˜ θi = vi[cos(βiR) tan(δi+β_iF)−tan(β_iR) l − c(s)icos(˜θi+β_iR) 1−c(s)iyi ] (3.1)

Ce modèle étant le même que dans la section 2.2.1 la commande de l’angle de braquage δi est la même qu’a l’expression (2.7) pour la partie latérale du suivi de trajectoire.

Nous pouvons donc maintenant nous int´eresser `a la partie asservissement longitudinal de la commande.

(30)

Dans le contexte d’une flotte de robots mobiles suivant une trajectoire de référence, ceux-ci doivent communiquer entre eux afin de s’échanger leurs positions, leurs vitesses, et d’autres informations en rapport avec le suivi de la trajectoire (écart latéral, angula ire. . .). Cette communication sera assurée par le biais via une communication sans fil.

3.2.1 Loi de commande longitudinale

Le principe de la loi de commande pour asservir l’´ecart longitudinal entre les deux

robots est proposé dans [10] et [1] repose sur le fait que l’on désire un écart d entre l’abscisse curviligne du robot i et du robot i + 1. En prenant ici l’exemple de deux robots et en prenant le robot l leader et le robot s suiveur on peut réécrire la condition précédente de la fa¸con suivante :

e = sl− ss− d (3.2)

Pour que la distance entre les deux robots soit égale à d on cherche à ce que la valeur de e tende vers zéro. Ainsi on peut écrire :

˙e = −λe (3.3)

or

˙e = ˙sl− ˙ss (3.4)

car d étant constant. Donc en utilisant les expressions de slet ssexprimés précédemment (3.1) on obtient : vl cos(˜θl+ βlR) 1 − c(s)lyl − vs cos(˜θs+ βsR) 1 − c(s)sys = −λe (3.5)

Ainsi on peut isoler la vitesse du suiveur dans l’expression précédente (3.5) afin d’en tirer une consigne à appliquer sur celle-ci afin de respecter l’écart longitudinal consigne d.

On obtient finalement la consigne suivante :

vs = (vl cos(˜θl+ βlR) 1 − c(s)lyl + λe) 1 − c(s)sys cos(˜θs+ βsR) (3.6)

Donc les informations provenant du leader dont le robot suiveur `a besoin sont : – L’abscisse curviligne sl.

– La courbure de la trajectoire c(sl). – L’´ecart angulaire ˜θl.

– L’écart latéral yl. – La vitesse linéaire vl.

(31)

e caractérisant le respect de l’écart longitudinal entre les deux robots. L’écart longitudinal désiré est ici de 2 m et les robots partent l’un derrière l’autre avec 3 m d’écart.On constate que cette commande est fonctionnelle et assure le respect de la distance d.

(a) Vitesse des robots (b) Variation de l’ecart longitudinal

(c) trajectoire `a suivre

Figure 3.2 – Resultats de simulation matlab pour le convoi de deux robot l’un derriere l’autre

Cette simulation est effectué avec un écart latéral nul par rapport à la courbe pour les deux robots (les deux robots se suivent). Cependant l’intérêt du convoi de robot et de pouvoir couvrir une plus grande surface donc il est intéressant de pouvoir faire parcourir le robot suiveur avec un écart latéral non nul vis-à-vis de la courbe de référence.

3.2.2 Loi de commande lat´eral

Afin de permettre au convoi de couvrir plus de surface on reprend la commande du suivi de trajectoire (2.3) établi en 2.2.2 et on fixe pour le robot suiveur un écart latéral non nul. Ici yd_{= 2m. On obtient alors les r´}_{esultats pr´}_esent´_{es `}_{a la figure 3.3}

(32)

Figure 3.3 – Résultats de simulation matlab pour le convoi de deux robot avec un écart latéral pour le suiveur de 2m

Sur la figure 3.3(b), on constate que lors de l’amorce et de la sortie du virage, la distance longitudinale entre les deux robots varie. Cela est dû au fait que le robot suiveur est à l’extérieur de la courbe et doit donc aller plus vite que le leader pour garder une distance constante entre eux deux. C’est d’ailleurs ce qu’il fait très bien comme on peut le constater sur la figure 3.3(a), mais lors d’un changement de courbure on constate une variation de e dû aux temps de réponse des actionneurs (le temps d’accélération).

Ce problème est analogue à celui rencontré lors de la commande pour le suivi de

trajectoire d’un robot seul pour l’´ecart lat´eral, nous allons donc proposer une solution

analogue : rendre une partie de la commande en vitesse pr´edictive (afin d’anticiper le

besoin d’acc´el´eration).

3.3 Loi de commande longitudinale pr´

edictive

Afin de répondre au problème soulevé dans la partie précédente, à savoir que lors d’un changement de courbure la distance entre les deux robots varie, on se propose d’effectuer une commande prédictive permettant d’atténuer ce phénomène.

En rendant une partie de la commande pr´edictive, le but est de permettre au robot

suiveur d’anticiper la courbure future de la courbe et donc d’anticiper le fait de devoir décélérer ou accélérer(en fonction de s’il se trouve à l’intérieur ou à l’extérieur de la courbe).

(33)

Comme il a ´et´e fait pour la commande du suivi de trajectoire, la commande en vitesse ´

enoncé précédemment 3.6 va être décomposé en deux parties :

         vs = vasss + verrs vtraj s = vl cos(˜θl+βlR) 1−c(s)lyl 1−c(s)sys cos(˜θs+βsR) vecart s = λe 1−c(s)sys cos(˜θs+βsR) (3.7)

Dans cette d´ecomposition (3.7) de la loi de commande, le rˆole de chacun des deux

termes v_sass et v_serr sont les suivants : – vecart

s est le terme prenant en compte la distance entre les robots, distance qui ne peut être prédite. Ce terme restera donc inchangé et ne fera pas l’objet d’un remplacement par une partie prédictive.

– vtraj

s ce terme dépend de la courbure de la trajectoire de référence, de la vitesse du leader et des positions des robots. Tous ces paramètres peuvent être estimés à l’instant suivant puisque nous connaissons la trajectoire de référence et que nous pouvons estimer l’état futur des robots. Donc cette partie pourra faire l’objet d’une commande prédictive.

3.3.2 Mod´elisation du bas niveau

Le processus bas niveau gérant la vitesse du robot peut etre considéré comme un second ordre en régime critique (ξ = 1) dont les propriétés peuvent être définies en identifiant sa réponse à un échelon de vitesse. Les performances utilisées lors de la simulation (sous Matlab/Simulink) sont reporté sur le tableau 3.1.

Propri´et´es Bas niveau simulink

Retard pur (s) 0

Temps de mont´ee (s) 1

Table 3.1 – Param`etres du bas niveau utilis´e dans le simulateur sous simulink

Les équations d’états (3.8) suivantes, définissent le second ordre reliant la consigne envoyée à l’instant n (notée V_[n]C) et la vitesse réelle en résultant (notée V_[n]R).

( XV [n] = F X[n−1]V + KV[n−1]C YV [n] = CX[n]V avec : XV [n]=    VR [n] VR [n−1] VC [n−1]   , F =    b1 b2 a2 1 0 0 0 0 0    K =    a1 0 1   , Y V [n] = CV R [n], C = h 1 0 0 i(3.8)

La période d’échantillonnage du simulateur étant de T = 0.05s et en tenant compte des valeurs numériques données au tableau 3.1, les valeurs numériques des paramètres [a1 a2 b1 b2] sont données par (3.9).

(

a1 = 1.3148 a2 = −0.4489

b1 = 0.0759 b2 = −0.0581

(34)

En utilisant le schéma de définition de la commande prédictive présenté en annexe A et en l’adaptant à notre cas, on obtient la figure 3.4 avec les notations suivantes :

– VC : la commande envoyée à l’actionneur. Ici il s’agit uniquement du terme prenant en compte la trajectoire v_straj définie par (3.7).

– VR : la valeur mesurée sur le système. C’est la variable de sortie en réponse à la commande VC. Ici la sortie du processus est uniquement la contribution de v_straj de la vitesse globale mesurée. Ainsi cette valeur est mesurée via la relation (3.10), où

VM

[n] est la mesure r´eelle de la vitesse `a l’instant n et vsecart[n] est la contribution relative `

a la distance inter robots de la loi de commande d´efinie par (3.7).

V_[n]R = V_[n]M − v_[n]ecart (3.10)

– H : L’horizon de pr´ediction. C’est le temps dans le futur sur lequel on applique

l’algorithme de prédiction.Ici le cas est discret, donc on choisit un nombre d’itérations (nH) correspondant au nombre d’itérations devant être faites dans le futur, pour minimiser le critère quadratique.

– Vobj _{: L’objectif de consigne futur. C’est la valeur de la consigne que devra atteindre} le syst`eme `a l’horizon H.

En considérant θl+ βlR et ˜θs+ βsRtrès petit dans l’expression de vtrajs définie en (3.7), on peut considérer que cos(θl+ βlR) ' 1 et cos(˜θs+ βs)'1R ce qui nous donne :

vtraj_s = vl 1 − c(s)s ys 1 − c(s)l yl =⇒ V_Nobj = vl 1 − c(s + Ns)s ys 1 − c(s + Ns)l yl (3.11)

avec Ns l’abscisse curviligne équivalente à l’itération N (N ∈ [n + 1, ..., n + n + nh]). En pratique, Ns est calculé en utilisant la vitesse curviligne Ns = ˙sN

– VRef _{: Vitesse de r´}_ef´_{erence souhait´}_{e pour rejoindre la consigne objectif V}obj

[n+nH].

Celle-ci est choisie par l’utilisateur et d´efinit la dynamique du processus. Ici on choisit un premier ordre dans la relation (3.12) o`u i ∈ [0; nH] et γ ∈ [0; 1[.

V_n+iobj− V_n+iRef = γi[V_nobj− VR

n ] (3.12)

Il est possible de définir la trajectoire de vitesse de référence en fonction de l’objectif final. Dans ce cas on obtient l’équation (3.13).

V_n+iRef = V_n+nobj

H]− γ

i_[Vobj

n+nH]− V

R

n ] (3.13)

– ˆVR_{: Sortie pr´}_{edite du processus. C’est la r´}_{eponse future du processus `}_{a une s´}_equence de commande définie, connaissant le modèle d’évolution du processus (i.e équations (3.8)).

(35)

Crit`ere `a minimiser

Le critère D(n) à minimiser représente la distance entre ˆVR et VRef, ainsi il est défini par :

D(n) = nH

X

i=0

[ ˆV_n+iR − V_n+iRef]2 (3.14)

Structuration de la commande future VC n+i

Ici on reprend la structure de la commande établie pour la prédiction sur l’angle de braquage établi dans [4], qui nous permet d’appliquer uniquement la première commande (V_nC) de la séquence ([V_nC, V_n+1C , ..., V_n+nC _H]) définie par :

V_n+iC = nB X k=1 µk(n)VBkC(i) =⇒ VnC = nB X k=1 µk(n)VBkC(0) (3.15)

Ici les fonctions {VC

Bk} sont des fonctions de bases indépendantes entre elles. L’équation (3.15) implique qu’au moins une des fonctions soit non nulle pour i = 0. On choisit alors une base polynomiale, telle que définie par l’équation (3.16), avec la convention i0 _{= 1} lorsque i = 0.

V_BkC(i) = ik−1 (3.16)

Minimisation du crit`ere D(n)

Afin de réaliser la minimisation du critère D(n), on va tout d’abord séparer la réponse prédite ( ˆVR_{) de l’actionneur en deux parties. Une partie ( ˆ}_V

F R

) correspond à la réponse forcée par la commande VC_{, et l’autre ( ˆ}_V

L R

) correspond à la partie libre de la réponse, dépendant de l’état précédent du système. On peut donc écrire à chaque instant n + i la réponse prédite du bas niveau comme décrit par la relation (3.17).

ˆ V_[n+i]R = ˆVF R [n+i]+ ˆVL R [n+i] (3.17)

(36)

Ainsi en utilisant les définitions des réponses libres et forcées (3.18) et en les réinjectant dans le critère à minimiser exprimé en (3.14). On obtient la relation (3.19).

D(n) = nH

X

i=0

[C.Fi.X_[n]V + µ(n)TVˆ_BR(i) − V_n+iRef]2 (3.19) Ainsi on peut noter :

d(n + i) = V_n+iRef − C.Fi_.XV

[n] (3.20)

Ce qui am`ene `a :

D(n) = nH

X

i=0

[µ(n)TVˆ_BR(i) − d(n + i)]2 (3.21)

Il s’agit donc de trouver le vecteur µ(n) (ou le scalaire si nB = 1) minimisant (3.21). ´

Etant donné l’expression de D(n), il admet un minimum lorsque sa dérivée partielle par rapport à µ est nul. Cette condition est exprimé en (3.22).

nH

X

i=0

[µ(n)TVˆ_BR(i) − d(n + i)] ˆV_BR(i) = 0 (3.22)

qui est ´equivalent `a :

nH X i=0 [ ˆV_BR(i) ˆV_BR(i)T] µ(n) − nH X i=0 d(n + i) ˆV_BR(i) (3.23) On pose alors R1 et R2 comme suit :

R1 = nH X i=0 d(n + i) ˆV_BR(i) , R2 = nH X i=0 [ ˆV_BR(i) ˆV_BR(i)T] (3.24) avec R1 un vecteur de dimension nB× 1 et R2 une matrice carr´ee de dimension nB. On suppose R2 inversible, et on obtient alors la solution au probl`eme de minimisation :

µopt(n) = minµ(n)[D(µ(n))] µopt(n) = R−12 R1

(3.25) Finalement, la commande appliquée au processus étant la première de la séquence de commande calculée sur l’horizon de prédiction. L’expression de la commande générale est ´ egale à (??) : V_trajpred = VC n = [µopt(n)]TV0C V_trajpred = " PnH

i=0[ ˆVBR(i) ˆVBR(i)T] −1 PnH i=0 d(n + i) ˆVR B(i) #T VC 0 (3.26) 3.3.4 Simulation et r´esultats

Maintenant que l’algorithme de prédiction est établi, nous pouvons l’implémenter dans simulink afin de voir l’influence de la nouvelle commande sur la vitesse du robot suiveur. Pour cela un nouveau modèle simulink a était mis en place (décrit à l’annexe B.3) per-mettant d’utiliser l’algorithme de prédiction (présenté à l’annexe D.1). Avec ce nouveau modèle on obtient les résultats présentés sur la figure 3.5 que l’on peut comparer avec les résultats de la figure 3.3(b), les conditions pour les deux simulations étant identiques.

(37)

Figure 3.5 – Résultats de simulation matlab pour le convoi de deux robots avec un écart latéral pour le suiveur de 2m et commande prédictive en vitesse

La figure 3.6 montre les r´esultats avec et sans pr´ediction afin de bien pouvoir les comparer.

(a) Vitesse des robots (b) Variation de l’ecart longitudinal

Figure 3.6 – Comparaison des r´esultats avec et sans pr´ediction

On constate que la commande prédictive a bien les effets escomptés sur la variation de l’écart entre les robots, en atténuant fortement les variations de l’écart en entrée et sortie de virage. De plus on constate sur la figure 3.6(a) que la vitesse du suiveur dans le cas de la simulation avec prédiction, est en avance par rapport à celle sans prédiction et que les dépassements sont atténués (le robot n’a plus besoin de rattrapé de retard).

Les résultats théoriques ayant validé l’efficacité de la commande prédictive, il faut maintenant tester cette loi en conditions réelles. Pour cela Pierre Cartade le doctorant

(38)

des tests sont pr´esent´es dans la section suivante.

3.4 R´

esultats en test r´

eel

Toutes les figures des résultats des tests en conditions réelles sont regroupées à l’annexe C. Ces courbes présentent les résultats des essais effectués par le doctorant Pierre Cartade,

et son directeur de th`ese Roland Lenain sur le site de Montoldre le 7/08/2012. Lors de

cette journée d’expérimentation, la loi de commande prédictive en vitesse a été testée selon le protocole suivant :

– Création de la trajectoire de référence par acquisition des données GPS pendant le déplacement libre du robot.

– Expérimentation de la loi de commande en vitesse non prédictive avec une interdis-tance de 9 m et un écart latéral de 2 m (figure C.1).

– Expérimentation de la loi de commande en vitesse prédictive avec une interdistance de 9 m et un écart latéral de 2 m en faisant varier le temps de prédiction (1.1, 1.5 et 2 s) (respectivement figure C.2, C.3, C.4 ).

– Expérimentation de la loi de commande en vitesse non prédictive avec une interdis-tance de 9 m et un écart latéral de 3 m (figure C.1)(figure (figure C.6).

– Expérimentation de la loi de commande en vitesse prédictive avec une interdistance de 9 m et un écart latéral de 3 m en faisant varier le temps de prédiction (1.1, 1.5) (respectivement figure C.7, C.8).

Figure 3.7 – Photo du convoi lors des exp´erimentations `a Montoldre

La trajectoire de référence qui a été enregistré, est constituée de deux parties rectilignes et d’une partie faisant un demi-tour. Les parties rectilignes se trouvent sur herbe, alors que le demi-tour se fait sur asphalte. Cela explique la présence d’un plus grand bruitage des signaux en début et fin de relevé (le déplacement sur herbe engendre plus de bruits et plus de glissements).

La première chose que l’on doit constater sur les résultats est le découplage entre les lois commandant l’écart latéral et longitudinal des robots, l’écart latéral étant le même quelles que soient les conditions d’expérimentation (¿ à 20 cm après la phase d’initialisation).

Ensuite on peut constater que les résultats sur l’écart longitudinal sont ceux attendus, c’est-à-dire que sur lors de l’expérimentation sans prédiction on constate des variations de l’écart lors de l’entrée et la sortie des virages (figure C.5(a)). Alors que lors des essais avec la loi prédictive, ces dépassements sont réduits (voire nuls). On constate que le temps de prédiction permet de converger plus rapidement vers l’écart désiré quand on augmente

(39)

On constate également que le côté prédictif de la commande fonctionne bien au niveau de la vitesse commandée du suiveur (figure C.5(c)), ainsi que sur sa vitesse réelle (figure C.5(b)). Sur ces deux figures on constate que les vitesses, réelle ou commandée, sont moins oscillantes lorsque le temps de prédiction est plus élevé (cela est flagrant entre avec et sans prédiction). Cela s’explique par le fait que la commande prévoie la vitesse future ce qui a pour effet de réduire les pics de vitesse et réduit les effets d’oscillation.

Ces constatations sont également les mêmes sur les essais avec un écart latéral de 3 m (ce qui oblige le robot suiveur à faire un chemin encore plus grand). Les figures C.9(c) et C.9(b) montrent bien que la vitesse sans prédiction est beaucoup plus oscillante ce qui provoquent sur l’écart longitudinal des oscillations (phénomène atténué grâce à la com-mande prédictive).

Les r´esultats des tests sont donc concluants et valides la commande pr´edictive en

vitesse. Avec cette commande, cela nous permet donc d’assurer la conduite d’un convoi, en respectant l’interdistance entre les robots en simultané du respect de l’écart latéral par rapport à la courbe de référence.

3.5 Conclusion sur le convoi de robots

Aujourd’hui les lois mises en place et pr´esent´ees dans ce chapitre, permettent d’assurer

le respect d’une formation par un convoi de robots. Les perspectives d’am´elioration du

convoi r´esident maintenant dans la gestion de plusieurs formations successives, et du

passage de l’une à l’autre, pour par exemple gérer les demi-tours (passage du convoi en formation aligné les uns derrière les autres), ou bien l’évitement d’obstacle (modification de l’écart latéral le temps de l’évitement de l’obstacle). Les lois doivent également être modifié afin de pouvoir établir la commande lorsque la trajectoire de référence et crée en ligne, pour par exemple permettre de conduire le robot leader avec un flotte de robot le suivant (donc sans trajectoire prédéfinie).

(40)

Navigation inertielle

Une fois la commande en vitesse fonctionnelle il m’a été demandé de travailler sur la mise en place d’un algorithme permettant de répondre à la problématique du

position-nement du robot. Comme nous avons pu le voir dans les chapitres pr´ec´edents, afin de

pouvoir établir les différentes commandes, les informations de positions des robots sont fournit par un GPS cinématique (GPS-RTK). Le plus gros défaut de ce gps est la fréquence `

a laquelle il fournie les données de positionnement (10Hz), de ce fait la commande ne peut s’effectuer à une fréquence plus élevée que celle du GPS.

Ainsi dans l’optique de pouvoir établir une commande du robot à une fréquence plus ´

elevée que celle du GPS, et également de pallier toute perte éventuelle de signal (dû par exemple à la présence d’arbres ou d’obstacles), il m’a été demandé de travailler sur l’u-tilisation des données fournies par les autres capteurs présents sur les robots (centrale inertielle et capteurs de vitesses des roues) afin de pouvoir localiser le robot entre deux tops GPS ou une fois le signal de celui-ci perdu.

Ainsi disposant d’une centrale inertielle fournissant des données à 100Hz deux ap-proches ont été proposé pour répondre à cette problématique :

– L’utilisation des données de la centrale seule pour le calcul de l’attitude et de la posi-tion (par intégration des vitesses de rotation et double intégration des accélérations). – L’utilisation des données de la centrale pour le calcul de l’attitude du robot couplé

aux donn´ees de vitesse pour le calcul de position.

Dans un premier temps les différentes approches présentées ci-dessous on été implémentées sous Matlab et testé en utilisant des jeux de données d’essai réel précédent. Une fois la meilleure approche définie celle-ci a été implémenté en c++ puis testé en condition réelle sur le robot RobuFast.

(41)

Le positionnement par GPS étant très précis (voir présentation du GPS en 2.1.2), le but n’est pas ici de remplacer ce capteur.

Le but de l’étude est de fournir des données entre celles fournies par le GPS. Ainsi quelle que soit la méthode utilisée en plus du GPS pour positionner le robot, on utilisera en aval des filtres (ici filtres de Kalman) permettant de fusionner les données qui seront d’un côté fourni par le GPS (à 10Hz) et de l’autre par la nouvelle méthode de positionnement

(à 100Hz). Cela nous permettra donc d’obtenir en sortie des données à 100Hz sans

perdre la fiabilité du GPS (dans la mesure ou celui-ci fourni des informations). Le schéma représentant le principe de fonctionnement de l’algorithme à mettre en place est présenté `

a la figure 4.1.

Figure 4.1 – Sch´ema de principe de l’hybridation des donn´ees de positionnement

Ainsi lorsque l’on a de nouvelles donn´ees GPS le positionnement se fait par

l’in-term´ediaire du filtre de Kalman. Alors qu’entre deux tops GPS ou lors d’une perte de

signal GPS le positionnement se fera par l’intermédiaire de la méthode d’estimation seule. La méthode d’estimation étant dépendante des données capteurs et de l’état précédant du robot (position, vitesse, cap...), elle se trouve recalée à chaque passage par le filtre de Kalman (la prépondérance entre les données GPS et calculées étant réglée grâce aux gains du filtre).

Ce type d’approche pour le positionnement de véhicule a été présenté dans des écrits telle que [9], [2] ou [3] qui traite des applications dans ce domaine avec des technologies bas de gamme (ce qui correspond à notre étude).

Je vais donc maintenant présenter les deux différentes méthodes envisagées pour l’es-timation de la position, ainsi que les résultats obtenus avec ceux-ci en utilisation seul, hybridé et en simulant des pertes de signal du GPS.

4.2 Les diff´

erents rep`

eres d’´

etude et matrices de passage

Avant de pouvoir exploiter les données capteurs, il est nécessaire de mettre en place les différents repères d’études et les outils mathématiques nous permettant d’exprimer toutes ces données dans un seul et même repère.

Les différents repères d’étude :

(42)

GPS.

– Le repère mobile (m). C’est le repère lié au robot ne tenant compte que de son cap (entre le repère (l) et (m) il n’y a qu’une rotation de l’angle θ autour de l’axe z). – Le repère de la centrale inertielle (c). C’est le repère lié à la centrale, dans lequel

sont exprimées les données inertielles. Il tient compte des rotations d’angle α et β autour des axes xm et ym par rapport au repère (m)

– Le repère roue (r). C’est le repère lié à la roue arrière fictive (roue utilisée par le modèle d’Ackerman).

• Les points :

– Le point O centre du rep`ere local. – Le point G centre du r´ecepteur GPS.

– Le point C centre du capteur inertiel et centre des rep`eres (c) et (m).

– Le point R centre de la roue fictive arrière (équivalant au repère (c) auquel on ajoute une rotation de δr+π₂ autour de zc).

(a) Rotations entre les rep`eres (b) Le robots dans le rep`ere local

Figure 4.2 – Rep`eres,angles et points utilis´e pour l’algorithme

Il faut noter que l’angle θgps (cap fourni par les donn´ees GPS) est l’angle entre xL et ym alors que θ est l’angle entre xL et xm donc on a la relation (4.1) entre ces deux angles.

θ = θgps− π

2 (4.1)

Les donn´ees capteurs :

Les différentes données capteurs à notre disposition ainsi que les repères dans lesquels elles sont exprimées sont les suivantes :

• Donn´ees GPS :

(43)

projection de Lambert). – La vitesse du robot Vgps.

– Le cap du robot θgps, qui repr´esente l’angle entre l’axe xL du rep`ere locale et le vecteur vitesse du robot.

• Donn´ee centrale inertielle :

Les données énumérées ci après sont exprimées dans le repère centrale inertielle (c) au point C :

– Le vecteur acc´el´eration Ac.

– Le vecteur vitesse de rotations Ωc. • Donn´ees autres :

– La vitesse de chacune des roues arrière vd,vg exprimées au centre des roues. – L’angle de braquage de la roue arrière fictive δr.

– L’angle de glissement arri`ere βr obtenu par l’algorithme mis en place pour le suivi de trajectoire.

Les matrices de passage :

En prenant comme notation Mif la matrice de passage du repère i au repère f , et Xi le vecteur exprimé dans la base i. On a donc Xi = MifXf.

´

Ecrivons tout d’abord les matrices de rotations (Rα, Rβ, Rθ) associ´ees aux trois rota-tions d’angle α autour de x, β autour de y et θ autour de z.

Rα= " ₁ ₀ ₀ 0 cos α − sin α 0 sin α cos α # Rβ= " _{cos β} ₀ _{sin β} 0 1 0 − sin β 0 cos β # Rθ= " _{cos θ} _{− sin θ} ₀ sin θ cos θ 0 0 0 1 # (4.2)

Ainsi les matrices de passages MLm , Mmc et MLc présentées ci-après (4.3), nous per-mettrons d’exprimer les vecteurs Ac et Ωc dans tous les repères d’étude.

MLm = Rθ, Mmc = Rβ∗ Rα, MLc = Rθ∗ Rβ∗ Rα MLm=    cos θ − sin θ 0 sin θ cos θ 0 0 0 1   Mmc=   

cos β sin β sin α sin β cos α

0 cos α − sin α

− sin β cos β sin α cos β cos α

   MLc =   

cos θ cos β cos θ sin β sin α − sin θ cos α cos θ sin β cos α + sin θ sin α sin θ cos β sin θ sin β sin α + cos θ cos α sin θ sin β cos α − cos θ sin α

− sin β cos β sin α cos β cos α



 (4.3)

4.3 Calcul d’attitude du robot

Afin de pouvoir exploiter les données inertielles, il faut pouvoir connaitre l’attitude du robot (valeur des angles α, β et θ), ce qui nous permettra d’alimenter les matrices de passage présentées en (4.3).

Le calcul de l’attitude du robot se fera en intégrant les vitesses angulaires données par la centrale. Il est donc nécessaire dans un premier temps, de pouvoir initialiser ces valeurs.

(44)

données de la centrale, en se servant du fait que celle-ci mesure la pesanteur. Ainsi on obtient les équations (4.4) en se basant sur le schéma 4.3.

Figure 4.3 – Sch´ema pour l’initialisation de l’attitude

Sur ce schéma les axes Xc2et Zc2sont ceux du repère (c) auxquels on a retiré la rotation alpha autour de Xc. α = Ay Az β = −Ax sin(α) tan(α)+cos(α)Az (4.4)

Avec Ax, Ay, Az les composantes du vecteur accélération (Ac) relevée par la centrale inertielle.

L’initialisation de l’angle θ se fera par le biais des donn´ees GPS et n´ecessitera donc

de mettre le robot en mouvement. Par cons´equent entre le moment o`u les angles α et β

sont initialisés et le moment ou la valeur initiale de θ sera relevée on utilisera l’algorithme permettant de calculer l’attitude à partir des données inertielles afin de garder des valeurs de α et β cohérente.

4.3.2 M´ethode de calcul d’attitude :

Afin de pouvoir calculer par intégration la valeur des angles d’attitude décrit à la figure 4.2(a), il est nécessaire de mettre en relation les vitesses de rotation données par la centrale notées p, r et y, respectivement autour de xc, yc et zc, et les vitesses de rotation ˙α, ˙β et ˙θ. Cette relation est données par l’équation (4.5) qui exprime le fait que le vecteur vitesse de rotation Ωcest la somme de chacune des vitesses de rotation ( ˙α, ˙β et ˙θ) projetées dans le repère de la centrale inertielle (c).

   p r y   =    ˙ α 0 0   + R T α    0 ˙ β 0   + (RβRα) T    0 0 ˙ θ    (4.5) Ce qui donne :    p r y   =    1 0 − sin β

0 cos α sin α cos β

0 − sin α cos α cos β

      ˙ α ˙ β ˙ θ    (4.6)

(45)

   ˙ α ˙ β ˙ θ   = 1 cos β   

cos β sin β sin α sin β cos α

0 cos α cos β − sin α cos β

0 sin α cos α       p r y    (4.7)

Finalement dans l’algorithme utilisé pour calculer l’attitude du robot, la matrice de la relation (4.7) sera alimentée avec les valeurs des angles précédents (les angles variant faiblement vis à vis de la période d’échantillonnage), puis on calcule la valeur des angles `

a l’instant k par int´egration en utilisant la relation :

anglek= anglek−1+angle ∗ T˙ (4.8)

avec T la p´eriode d’´echantillonnage.

Il suffit ensuite de réinjecter les valeurs des angles ainsi déterminées dans les matrices de passages de la relation (4.3). Ce qui va nous permettre par la suite d’exploiter les données accélérométriques de la centrale.

L’algorithme calculant l’attitude du robot est présenté en annexe D.2.2 à la ligne 220.

4.4 Calculs de la position

4.4.1 Utilisation des donn´ees inertielles seules

La centrale utilisée (MTi de Xsens) est une centrale inertielle d’attitude, et n’est donc pas destinée à servir de moyen de positionnement. Son fonctionnement ainsi qu’une étude de ses différentes caractéristiques sont présentés dans [7].

Cependant afin de calculer la position du robot, je me suis d’abord orienté vers l’intégration des accélérations fournies par la centrale afin de calculer la position du robot. Ainsi ayant `

a notre disposition les matrices de passage entre les différents repères d’étude (cf 4.3), et notamment entre le repère de la centrale (c) et le repère local (L). Cela nous permet de projeter les accélérations relevées par la centrale dans le repère local puis de les intégrer par deux fois, pour dans un premier temps calculer la vitesse du robot, puis sa position dans le repère (L).

Donc une fois le vecteur Ac projeté dans le repère (L) avec la matrice MLc on obtient le vecteur AL dont on va se servir pour l’intégration.

AL= MLc∗ Ac (4.9)

Ainsi en intégrant une première fois et en utilisant les vitesses précédentes du robot projetées dans le repère locale (L) (que l’on initialisera à l’aide du GPS), on obtient les vitesses vxL et vyL (vitesses selon xL et yL).

VxLk = VxLk−1+ AxL∗ T

VyLk = VyLk−1+ AyL∗ T

(4.10) Ces vitesses sont nécessaires afin de pouvoir réaliser la double intégration permettant de calculer la position du robot comme décrite à l’équation (4.11).

Xk = Xk−1+ vxLk−1∗ T + A_xL∗T2 2 Yk = Xk−1+ vyLk−1∗ T + A_yL∗T2 2 (4.11)