Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

D´etermination des param`etres initiaux de la trajectoire 102

Dans le document Navigation autonome en environnement dynamique : une approche par déformation de trajectoire (Page 103-111)

4.4 Génération de trajectoire par méthode variationnelle

4.5.2 D´etermination des param`etres initiaux de la trajectoire 102

u

∗

(et la trajectoire d’´etat ˜s

∗

associ´ee) garantissant que toutes les

con-traintes considérées soient respectées. Le processus de saturation est

d´ecrit en Section 4.5.3.

– Etape 2 : Mise `a jours des param`etres pet t

f

afin de converger

vers l’´etat but

Une fois qu’une trajectoire faisable ˜u

∗

est obtenue, il est possible de

v´erifier si son ´etat finals

f

(d´efini au tempst

f

) correspond `a l’´etat but

s

g

. La fonction de coûtJdéfinie lors du problème d’optimisation (4.15)

est con¸cue pour ˆetre minimale lorsque cette condition est satisfaite. Si

l’état but n’a pas encore été atteint, les variations de J par rapport

aux param`etres (p, t

f

) sont étudiées afin de la faire décroˆıtre. Une

cor-rection cor

(p,tf)

est alors calculée et appliquée sur ces paramètres (cf.

Section 4.5.4).

La convergence vers le but est atteinte lorsque la valeur de la fonction

de coût J est suffisamment faible. Si ce critère n’est pas assuré après

un nombre fixé d’itérations de l’algorithme (dans le cas où la méthode

serait tomb´ee dans un minimum local), le processus d’optimisation est

stopp´e.

4.5.2 D´etermination des param`etres initiaux de la

tra-jectoire

Au cours de la premi`ere ´etape de l’algorithme 5, un ensemble de

param`etres permettant de calculer la trajectoire initiale doit ˆetre fourni. Le

succès de la méthode d’optimisation (dû aux minima locaux) et le nombre

d’´etapes requis pour converger vers le but d´ependent fortement du choix de

ces paramètres initiaux, il ne doit donc pas être négligé.

Une solution simple consiste à déterminer ces paramètres analytiquement

à partir d’une intuition sur le contrôle à appliquer : Par exemple, en calculant

la distance approximative `a parcourir par le robot entre les ´etats initiaux et

finaux, il est possible d’´evaluer la vitesse et le temps requis pour rejoindre

l’état but et d’en déduire le contrôle à appliquer. Cette méthode a

l’avan-tage d’être rapide à calculer et de nécessiter peu de mémoire, néanmoins il

peut en règle générale s’avérer très difficile de trouver une bonne heuristique

permettant de d´eterminer ces param`etres.

CHAPITRE 4. G ´EN ´ERATION DE TRAJECTOIRES AVEC

CONTRAINTE SUR LE TEMPS FINAL 103

initiaux contenant un ´echantillonnage de l’espace d’´etats-temps ainsi que

les param`etres requis pour atteindre chaque ´etat-temps de cette base. On

détermine alors les états-temps de cette base (et les paramètres associés)

correspondant au mieux aux ´etats-temps initial et final entre lesquels une

trajectoire est générée. Une telle méthode permet en général de réduire

considérablement le nombre d’étapes de convergence nécessaires, néanmoins

sa taille en mémoire peut être considérable si la dimension de l’espace d’état

du syst`eme est importante.

Cette seconde solution a été utilisée. La Fig. 4.8 illustre la méthode de

construction d’une base de paramètres initiaux pour notre générateur de

tra-jectoires Tiji : Soit l’´etat-temps initial (s

0

, t

0

) = {s

0¹

, . . . , s

0ⁿ

, t

0

} et

l’´etat-temps final (s

g

, t

g

) = {s

g1

, . . . , s

gⁿ

, t

g

}. Nous ´echantillonnons alors chaque

caract´eristiques

i

, i∈[1;n] de ces deux ´etats afin d’obtenir un ´echantillonage

régulier de l’espace des paramètres d’entrée de l’algorithme de génération de

trajectoire 5. Afin d’essayer de d´eterminer une trajectoire (et les param`etres

permettant de la générer) pour chacune de ces valeurs d’entrées, nous

util-isons un premier ensemble de trajectoire dont nous connaissons d´ej`a les

paramètres associés. Celles-ci peuvent par exemple être calculées à partir

d’un échantillonnage sur l’espace de contrôle. Les noeuds (états-temps) de la

base les plus proches des états terminaux des trajectoires déjà calculées sont

déterminés (Fig. 4.8(a)). Tiji est alors utilisé pour calculer les paramètres

requis pour atteindre ces noeuds en partant des param`etres des trajectoires

les plus proches (Fig. 4.8(b)). Nous essayons alors d’atteindre de proche

en proche les noeuds de l’´echantillonnage sur l’espace d’´etat-temps de cette

mani`ere (Fig. 4.8(c)). Le processus s’arrˆete lorsqueTijine trouve plus aucun

noeud atteignable sur l’´echantillonnage de l’espace d’´etats-temps.

4.5.3 Calcul d’une param´etrisation admissible de la

trajectoire

A partir des param`etres d’entr´ee (p, t

f

) les diff´erents profils de la

trajec-toire de contrôle ˜u peuvent être calculés (cf. (4.12)). Etant donné un

´etat-temps initials

0

et l’expression analytique de ˜u ainsi obtenue, chaque ´etats(t)

de la trajectoire d’étatss suivie par le système robotique est alors déterminé

par l’int´egration de la dynamique du syst`eme :

s(t) = ˜s(p, t) =s

0

+

Z

t^f⁽^{p, t}⁾^dt,^∀^t ^∈^[0;^t

^f

^] ^(4.16)

Mˆeme si l’ensemble de param`etres initiaux fournit une trajectoire initiale

faisable, les corrections consécutives appliquées sur ces paramètres peuvent

104

4.5. TIJI : G ´EN ´ERATEUR DE TRAJECTOIRE AVEC CONTRAINTE

SUR LE TEMPS FINAL

(a) Initialisation (vuex×y) (b) Premi`ere it´eration (vuex×y)

(c) Seconde it´eration (vuex×y)

Figure 4.8 – Premières étapes de la construction d’une base de paramètres

permettant de déterminer les paramètres initiaux à fournir en entrée deTiji

afin de générer une trajectoire entre deux états-temps : Lors de

l’initiali-sation, un ensemble de trajectoires initiales (bas´e sur un ´echantillonage du

contrˆole d’entr´ee) est fourni. On essaie alors d’atteindre l’ensemble des noeuds

de l’échantillonnage sur l’espace d’états-temps proches des états-temps

ter-minaux des trajectoires précédemment calculées. La base de paramètres est

alors construite de proche en proche au cours des it´erations suivantes `a partir

des noeuds de l’échantillonnage sur l’espace d’états-temps déjà atteints.

CHAPITRE 4. G ´EN ´ERATION DE TRAJECTOIRES AVEC

CONTRAINTE SUR LE TEMPS FINAL 105

la rendre infaisable (les contraintes sur le mouvement ou sur le temps final

peuvent être violées). Afin d’éviter ce problème, nous proposons une

solu-tion permettant d’obtenir une trajectoire faisable quelque soit l’ensemble

de paramètres d’entrée : Pour ce faire, nous procédons à la saturation des

différents profils de contrôle et d’état ne satisfaisant pas les contraintes du

système. Les différentes étapes de ce processus de saturation sont décrites

ci-dessous.

Application de la contrainte sur le temps final

La contrainte sur le temps final est consid´er´ee en premier lieu. Elle est

très simplement prise en compte en empêchant le paramètre d’entréet

f

cor-respondant `a la dur´ee de la trajectoire de prendre une valeur en dehors de

l’intervalle de temps [t

min

;t

max

]. Un temps final appropri´e est donc obtenu

comme suit :

t

∗ f

=







t

min

sih

⁻t

(t

f

) = −t

f

+t

min

>0

t

max

sih

⁺t

(t

f

) = t

f

−t

max

>0

t

f

sinon

(4.17)

Cette nouvelle valeur du temps final t

∗

f

devient alors, durant la suite de

cette étape d’optimisation, le temps auquel sera évalué l’état final s

f

de la

trajectoire d’´etats. Il reste donc `a prendre en compte les contraintes sur

le mouvement du syst`eme robotique. La section suivante d´ecrit alors leur

int´egration.

Saturation des profils de contrˆole et d’´etat non admissibles

Etant donné les paramètres d’entrée (p, t

∗

f

) les profils des trajectoires de

contrôles et d’états peuvent être calculés à partir des Eqs. (4.12) et (4.13).

Ces fonctions peuvent cependant d´epasser les contraintes sur le mouvement

i.e.lesbornes sur le contrˆole h

u

et les bornes sur l’´etat du syst`emeh

s

sur un

ou plusieurs intervalles de temps. Nous notons alors I

U

(resp. I

S

) l’ensemble

des intervalles des temps sur lesquels les bornes sur le contrˆole (resp. bornes

sur l’état) n’ont pas été respectées. A partir de la formalisation des bornes

sur le contrôle et sur l’état données en Section 4.3.1, nous pouvons exprimer

ces intervalles comme suit :

n

I

U

=ⁿI

U 1

, . . . ,I

U k

o

|∀t∈I

U i

, i∈[1;k],

∃u

^j

(t), j ∈[1;m], u

^j

(t)< u

^j_min

or u

^j

(t)> u

^j_max

(4.18)

n

I

S

=ⁿI

S 1

, . . . ,I

S l

o

|∀t ∈I

S i

, i∈[1;l],

∃s

^j

(t), j ∈[1;n], s

^j

(t)< s

^j_min

or s

^j

(t)> s

^j_max

(4.19)

106

4.5. TIJI : G ´EN ´ERATEUR DE TRAJECTOIRE AVEC CONTRAINTE

SUR LE TEMPS FINAL

L’idée générale du processus de saturation consiste alors à déterminer ces

intervalles ainsi que les nouveaux profils de contrôle ou d’état devant y être

définis. Les bornes sur le contrôle et sur l’état sont appliquées successivement,

néanmoins les trajectoires de contrôles et d’états étant liées, un processus de

saturation en quatre étapes a été établi :

– Etape 1 : Application des bornes du contrˆole sur la trajectoire de

contrˆoles

A partir de la représentation paramétrique du contrôle donnée par

l’Eq. (4.12), une simple ´etude des variations de ces fonctions suffit `a

d´eterminer l’ensemble des intervalles I

U

sur lesquels les bornes sur le

contrôle sont dépassées.

Cet ensemble d’intervalles repr´esente simplement les intervalles de

temps au cours desquels un ou plusieurs contrôles d’entrée ont excédé

leurs bornes minimales ou maximales. Une trajectoire de contrˆole ˜u

_{u}

respectant ces limites est donn´ee par :

˜

u

{u}

(p, t) =

u

extl

(t) si t ∈I

U

˜

u(p, t) sinon ^(4.20)

o`u u

extl

(t) représente le contrôle extrême (minimal ou maximal)

appli-cable au temps t respectant les bornes sur le contrˆole. Des fonctions

paramétriques par morceaux sont donc nécessaires pour représenter ce

nouveau profil du contrôle ainsi que ceux des fonctions d’états proposées

ci-dessous.

– Etape 2 : Calcul de la trajectoire d’´etats `a partir de la trajectoire de

contrˆoles born´ee

Une trajectoire d’´etats ˜s

{u}

prenant en compte lesbornes sur le contrˆole

peut être déduite en intégrant ˜u

_{u}

`a partir de l’´etat initial s

₀

du

syst`eme :

˜

s

_{u}

(p, t) = s

₀

+

Z

t^f⁽^s

⁰

^,^u^˜

^{^u^}

⁽^{p, t}⁾^{, t}⁾^dt ^(4.21)

– Etape 3 : Application des bornes de l’´etat sur la trajectoire d’´etats

A partir de cet instant, les seules contraintes n’ayant pas ´et´e prises en

compte sont lesbornes sur l’´etat du syst`eme. Comme pour les bornes sur

le contrˆole, l’ensemble des intervallesI

S

d´epassant les bornes sur l’´etat

est déterminé en étudiant les variations de l’Eq. (4.13). La trajectoire

d’´etat ˜s

{u}

doit alors ˆetre satur´ee sur ces intervalles afin de prendre en

compte l’ensemble des contraintes souhait´ees. La trajectoire d’´etats ˜s

∗

r´esultante est donc exprim´ee par :

˜

s

∗

(p, t) =

s

extl

(t) si t ∈I

S

˜

s

_{u}

(p, t) sinon ^(4.22)

CHAPITRE 4. G ´EN ´ERATION DE TRAJECTOIRES AVEC

CONTRAINTE SUR LE TEMPS FINAL 107

o`u s

extl

(t) est la valeur extrˆeme (minimale ou maximale) de l’´etat au

temps t respectant les bornes d’´etat. La trajectoire d’´etats ˜s

∗

garantie

donc de respecter l’ensemble des toutes les contraintes sur le

mouve-ment du systèmeA et par conséquence d’être faisable.

– Etape 4 : D´erivation d’une trajectoire de contrˆoles faisable

Enfin, une trajectoire de contrˆoles faisable ˜u

∗

est d´eriv´ee de la

trajec-toire d’´etats ˜s

∗

:

˜

u

∗

(p, t) =







u

extl

(t) sit ∈I

U

−I

S

0 sit ∈I

S

˜

u(p, t) sinon

(4.23)

De la mˆeme mani`ere que pour ˜s

∗

, le mouvement d´ecrit par la trajectoire

de contrˆole ˜u

∗

appliquée à partir de l’état initials

₀

, a la garantie d’ˆetre

faisable pour le syst`eme A.

Exemple

La Fig. 4.9 illustre le processus de saturation des trajectoires d’´etats et

de contrôles présenté au cours de la section précédente. Supposez un système

1D de type double int´egrateur disposant de bornes sur sa vitesse et son

accélération. Soit le profil paramétrique initial de l’accélération du système

donné en Fig. 4.9(a). Les bornes d’accélération étant dépassées sur les

inter-vallesI

A

1

et I

A

2

, nous saturons l’acc´el´eration sur ces intervalles afin d’obtenir

un nouveau profil respectant ces contraintes (Fig. 4.9(c)). En int´egrant ce

dernier `a partir de l’´etat initial s

₀

du syst`eme, nous obtenons alors un

pro-fil de vitesse du système satisfaisant les bornes sur l’accélération, mais pas

celles sur la vitesse (Fig. 4.9(d)). Nous saturons alors celle-ci sur

l’inter-valle I

V

1

où les bornes de vitesse sont dépassées. Le nouveau profil obtenu

(Fig. 4.9(f)) satisfait donc l’ensemble des contraintes sur le mouvement. Afin

d’obtenir le contrôle d’entrée admissible correspondant à ce profil de vitesse,

nous redérivons celui-ci. La Fig. 4.9(e) présente alors le profil d’accélération

admissible pouvant être passé en entrée du système robotique.

4.5.4 Mise `a jour de la param´etrisation de la

trajec-toire

Une fois qu’une trajectoire faisable a été déterminée, son état finals

f

est

facilement obtenu comme suit :

108

4.5. TIJI : G ´EN ´ERATEUR DE TRAJECTOIRE AVEC CONTRAINTE

SUR LE TEMPS FINAL

(a) Etape 1 : Profil d’acc´el´eration

lin´eairea(t) avant saturation.

(b) Etape 1 : Profil de vitesse lin´eaire

v(t) avant saturation.

(c) Etape 2 : Profil d’acc´el´eration

lin´eaire a(t) apr`es saturation des

intervalles sur lesquelles les bornes

d’acc´el´eration minimales et maximales

sont d´epass´ees.

(d) Etape 2 : Profil de vitesse lin´eaire

v(t) prenant en compte les bornes

d’acc´el´eration. Il est obtenu par

intégration du profil d’accélération

donn´e en Fig. 4.9(c).

(e) Etape 3 : Profil d’acc´el´eration

lin´eairea(t) prenant en compte toutes les

contraintes sur le mouvement. Obtenu

par int´egration du profil de vitesse donn´e

en Fig. 4.9(f).

(f) Etape 3 : Profil de vitesse lin´eaire

v(t) apr`es saturation des intervalles

sur lesquels les bornes de vitesse sont

d´epass´ees.

Figure4.9 – Différentes étapes de calcul des profils de vitesse et accélération

lin´eaire. Les croix repr´esentent les bornes minimales et maximales sur ces

diff´erents profils.

CHAPITRE 4. G ´EN ´ERATION DE TRAJECTOIRES AVEC

CONTRAINTE SUR LE TEMPS FINAL 109

Si s

f

est suffisamment proche de l’´etat but s

g

, i.e. si J(s

0

, p, t

f

, s

g

) ≤ ε,

oùε est un seuil fixé, alors l’approche variationnelle a convergé comme nous

le souhaitions et une solution a été trouvée. Dans le cas contraire, il est

nécessaire d’appliquer une correction sur les paramètres d’entrée (p, t

f∗

) afin

d’y parvenir.

Afin de proc´eder au calcul d’une correction sur ces param`etres

permet-tant de minimiser la fonction de coˆutJ(s

0

, p, t

f

, s

g

), de nombreuses m´ethodes

d’optimisation existent (voir [NW99, Ber96] pour un r´esum´e de ces

ap-proches). Néanmoins, elle peuvent généralement être classifiées en quatre

catégories : les méthodes de relaxation (optimisation séquentielle de chaque

param`etre), les m´ethodes de descente de gradient (recherche d’une direction

descendante donnée par le gradient de la fonction de coût), les méthodes

de Newton ou assimil´ees (approximation locale au second ordre de la

fonc-tion de coût) et enfin la méthode stochastique de recuit simulé (en anglais :

simulated annealing [KGV83, GKR94]). Les principales diff´erences entre ces

diff´erentes m´ethodes tiennent au choix de la direction et du pas de descente,

et par conséquence, à leur coût de calcul. Une méthode de Newton standard

a été utilisée dans notre cas.

Un minimum local de la fonction de coût est trouvé lorsque ses dérivées

partielles^h

∂

J

∂(

p

,

t

f)

i

par rapport aux param`etres (p, t

f

) sont égales à zéro. Une

racine de ^h

∂

J

∂(

p

,

t

f)

i

peut alors être déterminée en linéarisant son expression

comme suit :

∂J

∂(p, t

f

)

≃

∂

2

J

∂(p, t

f

)

2

∆(p, t

f

) (4.25)

o`u ∆(p, t

f

) est l’erreur supposée commise sur les paramètres , et où^h

∂2

J

∂(

p

,

t

f)2

i

sont les dérivées partielles de second ordre de la fonction de coût par rapport

`a ces param`etres (matrice de dimensions (dim P+ 1)×(dimP+ 1)). Afin de

minimiser la fonction de coûtJ, une correction à appliquer sur les paramètres

(p, t

f

) est alors calcul´ee comme suit :

cor

₍p,tf)

=−τ

∂

2

J

∂(p, t

f

)

2

−1

∂J

∂(p, t

f

)

(4.26)

où τ ∈ [0; 1] est le gain de la correction. La matrice inverse des dérivées

partielles de second ordre repr´esente alors la direction de la correction, et

τ^h

∂

J

∂(

p

,

t

f)

i

le pas de descente.

La Fig. 4.10 illustre la convergence de la m´ethode apr`es application de

plusieurs corrections sur l’ensemble des paramètres définissant le contrôle

d’un v´ehicule.

Dans le document Navigation autonome en environnement dynamique : une approche par déformation de trajectoire (Page 103-111)

Télécharger maintenant "Navigation autonome en..."

Outline

Documents relatifs