Premi` ere ´ etape de planification - Planification de trajectoire avec ordonnancement

4.4 Planification de trajectoire avec ordonnancement

4.4.2 Premi` ere ´ etape de planification

L’étape 1 permet de générer une trajectoire intuitiveq_ei(t, τ_k) en évitant des conflits sur des zones spécifiques. Ces zones de conflits Cijb= (j, b, I_ij, cd_ij), préalablement données par le superviseur, sont représentées par des trajectoires directes partielles q^∗_j(I_ij, τ_k) d’autres agents j ayant un niveau de priorité plus haut IP_j > IP_i. Celles–ci sont dites partielles car uniquement la partie de la trajectoire correspondant à l’intervalle de temps I_ij 6= ∅ est fournies à l’agent pour chaque conflit.

Comme le montre la Fig. 4.6, cette première étape est différente si l’ordonnancement est autorisé ou non par le superviseur.

• Si l’ordonnancement est autorisé, i.e. schi= 1, l’agent i transportant le produit l pour l’opération n doit choisir une ressource b∈ Rnl. Une trajectoire intuitive doit alors être calculée pour chaque ressource b tout en assurant l’évitement des conflits détectés vers chacune de ces ressources. Dès que les trajectoires intuitives sont générées, les temps de transport gT T_ik vers chaque ressource b, obtenus en résolvant le problème d’optimisation OPT₁, sont utilisés pour calculer les temps pour achever l’opération vers chacune de ces ressources :

ct_nlb= τ_k+ gT T_i+ w_b+ wp_ib+ opt_nl, b∈ Rnl (4.4.1)

où w_b est le temps d’attente à la ressource b et opt_nl est le temps de traitement de l’opération. Le terme wp_ib est un temps d’attente fictif. Il représente un temps additionnel pour lequel l’agent i devra attendre que l’opération pour chaque agent j soit effectuée à cette même ressource. Ceci permet de mieux choisir la ressource car ces autres agents j ont un niveau de priorité plus haut et seront nécessairement arrivés à la ressource avant l’agent i. Ce temps est estimé de la manière suivante :

wp_ib= ^X

j∈HPi:crjk=b

opt_(n_j_)(l_j₎ (4.4.2)

où opt_(n_j_)(l_j₎ est le temps de traitement de l’opération (n_j) du produit (l_j) transporté par l’agent j. Il est important de noter que lorsque l’agent i est autorisé à ordonnancer son produit, ses voisins j∈ HPi n’ordonnancent pas leur produit au même instant de mise à jour τ_k puisque cela n’a pas été permis par le superviseur, i.e. sch_i= 1⇒ schj = 0⇒ crjk = cr_j(k−1).

Ensuite, la ressource est choisie en minimisant ce temps pour achever l’op´eration,

cr_ik = arg min

b ct_nlb (4.4.3)

• Lorsque l’agent i n’est pas autorisé à ordonnancer son produit, c’est–à–dire lorsque schi= 0, la ressource choisie est la même que l’instant de mise à jour précédent, i.e. cr_ik = cr_i(k−1). L’agent n’a alors plus qu’à générer sa trajectoire intuitive, en résolvant le problème OPT₁, vers cette ressource en évitant les conflits de collision détectés.

Pour chaque agent i, la génération d’une trajectoire intuitiveq_e_ib(t, τ_k) vers une ressource b, illustrée par la Fig. 4.7, se fait par la résolution de l’algorithme d’optimisation ci-dessous :

Figure 4.7 – Illustration d’une trajectoire intuitive qe_ib(t, τ_k) par rapport `a une trajectoire directe q_ib^∗(t, τ_k).

OPT₁ : Considérons le problème suivant qui consiste à déterminer la trajectoire intuitiveq_e_ib(t, τ_k) de l’agent i à l’instant τ_k vers une ressource b. Pour cela, l’idée est de minimiser la déformation entre les trajectoires intuitive q_e_ib(t, τ_k) et directe q^∗_ib(t, τ_k) à l’aide du critère

min e qib(t,τk), fT Ti Z τk+ fT Ti τk keq_ib(t, τ_k)− q^∗ib(t, τ_k)k · dt (4.4.4)

où gT T_ik est le temps de transport associé à la trajectoire intuitive. Notons que ce critère a été choisi (à la place d’une minimisation du temps de transport gT T_ik) pour améliorer l’évitement de conflits d’une manière décentralisée. En effet, si un critère de minimisation du temps avait été choisi, il ne serait pas nécessairement assuré que l’agent se rapprocherait au maximum de sa trajectoire directe. En effet, il peut y avoir des fluctuations dans l’évitement de conflit comme le montre la Fig. 4.8–(A) à l’aide des doubles flèches.

Ces fluctuations pourront gêner un agent devant éviter le conflit avec un degré supérieur. De ce fait, s’il y a plusieurs autres agents avec des conflits de degrés supérieurs, un effet de répercussion pourrait se produire. Il est utile de mentionner que la génération de la trajectoire intuitive est primordiale puisque la trajectoire finale est contrainte de s’en rapprocher. Par conséquent, une minimisation de la déformation est préférable, permettant de forcer l’agent à se rapprocher de la zone de conflit sans y entrer du fait de la contrainte d’évitement de conflit (voir 4.8–(B)). De plus, ce choix de critère permet tout de même d’avoir un bon temps de transport. En effet, en se rapprochant de la trajectoire directe, le temps de transport est réduit car il se rapproche du temps de transport de la trajectoire directe, qui est une borne inférieure. Pour ce problème d’optimisation, les contraintes suivantes doivent être respectées :

Conditions aux limites : L’agent i planifie à partir de l’instant τ_k de la configuration actuelle q_i avec la vitesse actuelle v_i vers une des configurations cibles q_b à l’instant eT_{i,f in}= τ_k+ gT T_ik à vitesse nulle, pour tout b∈ Rnl :

e q_ib(τ_k, τ_k) = q_i (4.4.5) ˙ e q_ib(τ_k, τ_k) = v_i (4.4.6) e q_ib( eT_{i,f in}, τ_k) = q_b, b∈ Rnl (4.4.7) ˙ e q_ib( eT_{i,f in}, τ_k) = 0 (4.4.8)

Comportement physique de l’agent : La vitesse lin´eaire est born´ee comme suit :

˙ e q_ib(t, τ_k) ≤ vmax,∀t ∈ [τk, eT_{i,f in}] (4.4.9)

Contraintes manufacturière : Cette contrainte assure le respect du cahier des charges fourni par le niveau G.O.R.P. En effet, l’opération n du produit l doit être achevée avant l’échéance odd_nl, ∀b ∈ Rnl. Le temps pour achever l’opération ct_nlb, défini par l’équation (4.4.1), doit satisfaire l’inégalité suivante :

ct_nlb≤ oddnl, b∈ Rnl (4.4.10)

Evitement des zones de conflit : Cette contrainte assure que les zones de conflits définies par l’ensemble CFik, fourni par le superviseur, soient évitées. Ceci s’exprime par :

keq_ib(t, τ_k)− q^∗jc(t, τ_k)k > cdij · dsaf e, ∀t ∈ Iij, ∀(j, b, Iij, cd_ij)∈ CFik, b∈ Rnl (4.4.11)

où c =cr_e_jk est la ressource choisie intuitivement par l’agent j. L’ordre du conflit cdij permet de régler la taille de la zone à éviter. Ainsi, lorsque plusieurs agents doivent éviter un conflit dans la même zone, ils évitent cette zone différemment car le superviseur fait en sorte que leur degré de

conflit soit différent. Ceci implique que chaque agent dévie sa trajectoire directe autour de la zone de conflit d’une manière différente.

Notons que l’algorithme d’optimisation OPT1 n’est appliqué que s’il y a des conflits détectés par le superviseur pour l’agent i vers la ressource b. S’il n’y a pas de conflit à éviter, la trajectoire intuitive sera ´

egale `a la trajectoire directe (i.e. q_e_ib(t, τ_k) = q_ib^∗(t, τ_k)) comme le montre la Fig. 4.6 avec la condition CFik = ∅.

Remarque 4.3 Notons que les trajectoires intuitives générées vers chaque ressource représentent approximativement les intentions de l’agent en termes d’évitement de collision global. C’est principale-ment pour cette raison que l’ordonnanceprincipale-ment est appliqué durant cette première étape. En effet, de cette manière, si un agent a beaucoup de conflits de collisions à éviter vers une ressource, il pourra en choisir une autre où il y a peu de conflits voire aucun.

Remarque 4.4 Dans la remarque précédente, le terme approximativement est utilisé pour justifier que les trajectoires intuitives ne permettent que d’éviter des trajectoire partielles. En effet, pour chaque conflit, l’intervalle d’évitement I_ij assure l’évitement autour du conflit mais l’évitement de collision au voisinage de cet intervalle n’est pas assuré. De plus, chaque agent i n’a aucune connaissance sur la manière dont les autres agents ont évité les conflits, ce qui peut aussi engendrer des répercussions en termes de collisions. Par conséquent une seconde étape de planification est nécessaire pour assurer que la trajectoire planifiée par chaque agent soit sans collision.

Dans le document Coordination et planification de systèmes multi-agents dans un environnement manufacturier (Page 93-96)