• Aucun résultat trouvé

4.4 Planification de trajectoire avec ordonnancement

4.4.2 Premi` ere ´ etape de planification

L’´etape 1 permet de g´en´erer une trajectoire intuitiveqei(t, τk) en ´evitant des conflits sur des zones sp´ecifiques. Ces zones de conflits Cijb= (j, b, Iij, cdij), pr´ealablement donn´ees par le superviseur, sont repr´esent´ees par des trajectoires directes partielles qj(Iij, τk) d’autres agents j ayant un niveau de priorit´e plus haut IPj > IPi. Celles–ci sont dites partielles car uniquement la partie de la trajectoire correspondant `a l’intervalle de temps Iij 6= ∅ est fournies `a l’agent pour chaque conflit.

Comme le montre la Fig. 4.6, cette premi`ere ´etape est diff´erente si l’ordonnancement est autoris´e ou non par le superviseur.

• Si l’ordonnancement est autoris´e, i.e. schi= 1, l’agent i transportant le produit l pour l’op´eration n doit choisir une ressource b∈ Rnl. Une trajectoire intuitive doit alors ˆetre calcul´ee pour chaque ressource b tout en assurant l’´evitement des conflits d´etect´es vers chacune de ces ressources. D`es que les trajectoires intuitives sont g´en´er´ees, les temps de transport gT Tik vers chaque ressource b, obtenus en r´esolvant le probl`eme d’optimisation OPT1, sont utilis´es pour calculer les temps pour achever l’op´eration vers chacune de ces ressources :

ctnlb= τk+ gT Ti+ wb+ wpib+ optnl, b∈ Rnl (4.4.1)

o`u wb est le temps d’attente `a la ressource b et optnl est le temps de traitement de l’op´eration. Le terme wpib est un temps d’attente fictif. Il repr´esente un temps additionnel pour lequel l’agent i devra attendre que l’op´eration pour chaque agent j soit effectu´ee `a cette mˆeme ressource. Ceci permet de mieux choisir la ressource car ces autres agents j ont un niveau de priorit´e plus haut et seront n´ecessairement arriv´es `a la ressource avant l’agent i. Ce temps est estim´e de la mani`ere suivante :

wpib= X

j∈HPi:crjk=b

opt(nj)(lj) (4.4.2)

o`u opt(nj)(lj) est le temps de traitement de l’op´eration (nj) du produit (lj) transport´e par l’agent j. Il est important de noter que lorsque l’agent i est autoris´e `a ordonnancer son produit, ses voisins j∈ HPi n’ordonnancent pas leur produit au mˆeme instant de mise `a jour τk puisque cela n’a pas ´et´e permis par le superviseur, i.e. schi= 1⇒ schj = 0⇒ crjk = crj(k−1).

Ensuite, la ressource est choisie en minimisant ce temps pour achever l’op´eration,

crik = arg min

b ctnlb (4.4.3)

• Lorsque l’agent i n’est pas autoris´e `a ordonnancer son produit, c’est–`a–dire lorsque schi= 0, la ressource choisie est la mˆeme que l’instant de mise `a jour pr´ec´edent, i.e. crik = cri(k−1). L’agent n’a alors plus qu’`a g´en´erer sa trajectoire intuitive, en r´esolvant le probl`eme OPT1, vers cette ressource en ´evitant les conflits de collision d´etect´es.

Pour chaque agent i, la g´en´eration d’une trajectoire intuitiveqeib(t, τk) vers une ressource b, illustr´ee par la Fig. 4.7, se fait par la r´esolution de l’algorithme d’optimisation ci-dessous :

Figure 4.7 – Illustration d’une trajectoire intuitive qeib(t, τk) par rapport `a une trajectoire directe qib(t, τk).

OPT1 : Consid´erons le probl`eme suivant qui consiste `a d´eterminer la trajectoire intuitiveqeib(t, τk) de l’agent i `a l’instant τk vers une ressource b. Pour cela, l’id´ee est de minimiser la d´eformation entre les trajectoires intuitive qeib(t, τk) et directe qib(t, τk) `a l’aide du crit`ere

min e qib(t,τk), fT Ti Z τk+ fT Ti τk keqib(t, τk)− qib(t, τk)k · dt (4.4.4)

o`u gT Tik est le temps de transport associ´e `a la trajectoire intuitive. Notons que ce crit`ere a ´et´e choisi (`a la place d’une minimisation du temps de transport gT Tik) pour am´eliorer l’´evitement de conflits d’une mani`ere d´ecentralis´ee. En effet, si un crit`ere de minimisation du temps avait ´et´e choisi, il ne serait pas n´ecessairement assur´e que l’agent se rapprocherait au maximum de sa trajectoire directe. En effet, il peut y avoir des fluctuations dans l’´evitement de conflit comme le montre la Fig. 4.8–(A) `a l’aide des doubles fl`eches.

Ces fluctuations pourront gˆener un agent devant ´eviter le conflit avec un degr´e sup´erieur. De ce fait, s’il y a plusieurs autres agents avec des conflits de degr´es sup´erieurs, un effet de r´epercussion pourrait se produire. Il est utile de mentionner que la g´en´eration de la trajectoire intuitive est primordiale puisque la trajectoire finale est contrainte de s’en rapprocher. Par cons´equent, une minimisation de la d´eformation est pr´ef´erable, permettant de forcer l’agent `a se rapprocher de la zone de conflit sans y entrer du fait de la contrainte d’´evitement de conflit (voir 4.8–(B)). De plus, ce choix de crit`ere permet tout de mˆeme d’avoir un bon temps de transport. En effet, en se rapprochant de la trajectoire directe, le temps de transport est r´eduit car il se rapproche du temps de transport de la trajectoire directe, qui est une borne inf´erieure. Pour ce probl`eme d’optimisation, les contraintes suivantes doivent ˆetre respect´ees :

Conditions aux limites : L’agent i planifie `a partir de l’instant τk de la configuration actuelle qi avec la vitesse actuelle vi vers une des configurations cibles qb `a l’instant eTi,f in= τk+ gT Tik `a vitesse nulle, pour tout b∈ Rnl :

e qibk, τk) = qi (4.4.5) ˙ e qibk, τk) = vi (4.4.6) e qib( eTi,f in, τk) = qb, b∈ Rnl (4.4.7) ˙ e qib( eTi,f in, τk) = 0 (4.4.8)

Comportement physique de l’agent : La vitesse lin´eaire est born´ee comme suit :

˙ e qib(t, τk) ≤ vmax,∀t ∈ [τk, eTi,f in] (4.4.9)

Contraintes manufacturi`ere : Cette contrainte assure le respect du cahier des charges fourni par le niveau G.O.R.P. En effet, l’op´eration n du produit l doit ˆetre achev´ee avant l’´ech´eance oddnl, ∀b ∈ Rnl. Le temps pour achever l’op´eration ctnlb, d´efini par l’´equation (4.4.1), doit satisfaire l’in´egalit´e suivante :

ctnlb≤ oddnl, b∈ Rnl (4.4.10)

´

Evitement des zones de conflit : Cette contrainte assure que les zones de conflits d´efinies par l’ensemble CFik, fourni par le superviseur, soient ´evit´ees. Ceci s’exprime par :

keqib(t, τk)− qjc(t, τk)k > cdij · dsaf e, ∀t ∈ Iij, ∀(j, b, Iij, cdij)∈ CFik, b∈ Rnl (4.4.11)

o`u c =crejk est la ressource choisie intuitivement par l’agent j. L’ordre du conflit cdij permet de r´egler la taille de la zone `a ´eviter. Ainsi, lorsque plusieurs agents doivent ´eviter un conflit dans la mˆeme zone, ils ´evitent cette zone diff´eremment car le superviseur fait en sorte que leur degr´e de

conflit soit diff´erent. Ceci implique que chaque agent d´evie sa trajectoire directe autour de la zone de conflit d’une mani`ere diff´erente.

Notons que l’algorithme d’optimisation OPT1 n’est appliqu´e que s’il y a des conflits d´etect´es par le superviseur pour l’agent i vers la ressource b. S’il n’y a pas de conflit `a ´eviter, la trajectoire intuitive sera ´

egale `a la trajectoire directe (i.e. qeib(t, τk) = qib(t, τk)) comme le montre la Fig. 4.6 avec la condition CFik = ∅.

Remarque 4.3 Notons que les trajectoires intuitives g´en´er´ees vers chaque ressource repr´esentent approximativement les intentions de l’agent en termes d’´evitement de collision global. C’est principale-ment pour cette raison que l’ordonnanceprincipale-ment est appliqu´e durant cette premi`ere ´etape. En effet, de cette mani`ere, si un agent a beaucoup de conflits de collisions `a ´eviter vers une ressource, il pourra en choisir une autre o`u il y a peu de conflits voire aucun.

Remarque 4.4 Dans la remarque pr´ec´edente, le terme approximativement est utilis´e pour justifier que les trajectoires intuitives ne permettent que d’´eviter des trajectoire partielles. En effet, pour chaque conflit, l’intervalle d’´evitement Iij assure l’´evitement autour du conflit mais l’´evitement de collision au voisinage de cet intervalle n’est pas assur´e. De plus, chaque agent i n’a aucune connaissance sur la mani`ere dont les autres agents ont ´evit´e les conflits, ce qui peut aussi engendrer des r´epercussions en termes de collisions. Par cons´equent une seconde ´etape de planification est n´ecessaire pour assurer que la trajectoire planifi´ee par chaque agent soit sans collision.