UN ALGORITHME COOPÉRATIF POUR UN PROBLÈME D ATELIER JOB SHOP MULTI-AGENT

(1)

UN ALGORITHME COOP´ ERATIF POUR UN PROBL` EME D’ATELIER JOB SHOP MULTI-AGENT

C. BRIAND^1,2, S. OURARI^1,2,3 and B. BOUZOUIA³

1 CNRS ; LAAS ; 7 avenue du colonel Roche, F-31077 Toulouse, France

2Universit´e de Toulouse ; UPS, INSA, INP, ISAE ; LAAS ; F-31077 Toulouse, France

3CDTA, lotissement du 20 aoˆut 1956, Baba Hassen, Alger, Algeria [email protected], [email protected], [email protected]

RÉSUMÉ : Cet article s’intéresse au problème d’ordonnancement de type job shop où, chaque machine étant associée à un agent ayant son autonomie décisionnelle propre, il s’agit de déterminer une solution satisfaisant, d’une part, les objectifs locaux des agents et, d’autre part, un ensemble d’exigences globales, correspondant à des règles de coopération adoptées collectivement. L’algorithme de résolution proposé est de nature distribuée, les décisions d’ordonnancement étant progressivement négociées entre les acteurs. Il permet de s’adapter de fa¸con réactive à l’évolution de la production, tout en préservant la flexibilité décisionnelle de chaque agent et en limitant la fréquence des négociations.

MOTS-CLÉS : job shop, ordonnancement multi-agent, coopération, flexibilité et robustesse, algorithme distribué.

1 INTRODUCTION

Dans un problème d’ordonnancement multi-agent, l’ensembleT desntâches à ordonnancer est distribué sur un ensemble A de m agents (m ≤n). De fa¸con classique, les tâches sont reliées entre elles par un en- sembleP de relations de précédence, où (i≺j)∈ P indique que la tâche idoit précéder la tâche j. Nous supposons en outre qu’une durée totale maximale D est imposée pour la réalisation de la totalité des tâches.

Chaque agent est supposé avoir sa propre autonomie décisionnelle et possède sa ou ses propres fonctions objectifs. La difficulté principale du problème réside dans le fait que la connaissance de l’agent est res- treinte à celle du seul sous ensemble de tâches qui lui est affecté. Les agents se communiquent des in- formations nécessaires à leur synchronisation. Ainsi, lorsque la tâchej, affectée à l’agentAu, a une relation de précédence avec la tâchei(i.e.,(i≺j)∈ P), affec- tée à l’agent Av, nous imposons alors que l’agent Av

convienne avecAud’un intervalle de fin de réalisation [C_i, Ci] pouri, dans lequel il s’engage à acheveri. La tâche i est alors ditetâche frontièreet Av est dit en amont deAu(Au est en aval deAv). Nous notonsF l’ensemble des tâches frontières.

Dans l’intervalle [C_i, Ci] , la valeur C_i correspond `a la date de fin de i dans le meilleur des cas, lorsque Av se trouve dans la situation la plus favorable. La

valeurCi correspond à la date de fin deidans le pire des cas, lorsqueAvévolue dans un contexte perturbé.

Eventuellement,´ C_i =Ci et la tâchei doit alors être terminée à une date fixe.

Le problème d’ordonnancement multi-agent considéré dans cet article consiste à déterminer, pour chaque tâche frontière i, un intervalle de fin de réalisation [C_i, Ci] (négocié entre l’agent responsable de la réa- lisation de la tâche et ses agents aval) de sorte à ce que, d’une part, les intervalles communiqués soient cohérents avec la durée totale maximaleDet, d’autre part, que les objectifs locaux des agents soient globa- lement satisfaits. Nous revenons sur cette notion de satisfaction des agents dans la suite du texte.

Figure 1 – Un exemple de probl`eme d’ordonnancement multi-agent

Un problème d’ordonnancement comportant n = 8 activités est représenté sur la figure 1 sous forme d’un graphe potentiels-tâches. Dans ce graphe, chaque sommet correspond à une tâche et chaque arc modé- lise une contrainte de précédence entre deux tâches de T ={0, . . . ,9}. Les lignes pointillées indiquent l’affec-

(2)

tation des tâches aux agents. De fa¸con assez classique, les tâches 0 et 9 sont des tâches fictives, de durée nulle, et correspondent respectivement au début de l’ordonnancement et à sa fin. Elles sont également associées

à deux agents fictifs, A0 et A4, pouvant respectivement être assimilés à l’acteur décidant du lancement de l’ordonnancement et au client final. Les tâches non fictives sont réparties sur un ensemble de trois agents A={A1, A2, A3}. Les ensembles Tu de tâches affec- tées à l’agentAusont :T1={1,3},T2={2,4,6}and T₃={5,7,8}. Les sommets correspondant aux tâches frontières sont cerclés en gras sur la figure.

Les intervalles de fin de réalisation doivent, outre être compatibles avec la durée maximale de l’ordonnancement (i.e., Ci ≤ D pour tout i ∈ F), satisfaire

´egalement l’ensemble des objectifs locaux des agents.

Dans cet article, nous supposons que la satisfaction interne d’un agent est liée à deux notions intrinsèques

`a l’agent : sonstress et lerisque d’incoh´erence. Nous explicitons ces deux notions dans les paragraphes suivants.

Le stress S_u d’un agent A_u est une caractéristique interne à son organisation. Plus l’organisation est flexible, plus l’agent a du temps pour réaliser ses tâches, et moins l’agent sera stressé. Inversement, plus les marges de réalisation se resserrent, plus l’organisation de l’agent est fragile, et plus l’agent sera dit stressé. Plus loin, nous proposons une fa¸con de mesurer le stress d’un agent basée sur la flexibilité temporelle propre à cet agent.

Le risque d’incohérence caractérise l’insensibilité de l’organisation interne d’un agent aux fluctuations de son environnement. En pratique, lorsqu’un agent Au

cherche à déterminer les dates de fin au plus tôt Cj

de ses tâches, il peut systématiquement supposer que ses agents amont finiront leurs tâches frontières au plus tard (i.e., l’inégalité (1) est respectée). Les valeurs des Cj trouvées par Au seront alors robustes aux fluctuations de performance de ses agents amont (dans la mesure où ceux-ci respectent les intervalles contractés).

Cj ≥ Ci+pj, ∀(i≺j)∈ P |i /∈ Tu∧j∈ Tu (1)

On remarque que cette stratégie est pessimiste car elle suppose que les agents finiront systématiquement leurs tâches à leur date de fin au pire. Cela conduit de plus à augmenter les dates de fin au plus tard annon- cées à son tour par l’agentAuà ses agents aval. C’est pourquoi nous supposons ici queAu a le droit d’anticiper s’il le souhaite la fin de réalisation au pire d’une tâche frontièrei, réalisée parAv(v6=u), d’une valeur

∆_i. On peut donc remplacer l’in´egalit´e (1) par (2) .

Ici, un risque d’incohérence apparaˆıt dans la mesure où Au peut prévoir de commencer j avant que isoit réellement finie, ce qui violerait alors la contrainte de précédence.

Cj ≥ Ci−∆i+pj, ∀(i≺j)∈ P |i /∈ Tu∧j∈ Tu

(2)

La variable ∆i ∈[0, Ci−C_i] permet à Au de régler l’anticipation comme il le souhaite. Plus ∆iest grand, et plusAufait confiance àAvpour finiriavant la date limite annoncée Ci, et plus aussi le risque d’incohé- rence est grand. Inversement, plus ∆i est petit, plus le risque d’incohérence est réduit, et plusAu se pro- tège contre une mauvaise performance de Av. Dans cet article, le risque d’incohérence choisi par Au est notéRu et est défini par l’équation (3).

Ru = max

{(i≺j)∈P|i /∈Tu∧j∈Tu}∆i (3)

La satisfaction de l’agentAupeut donc être exprimée par le désir de minimiser les critèresSuetRu, ceux-ci

´etant antagonistes.

En outre, pour inciter les agents à favoriser un comportement coopératif sur une tendance naturellement égo¨ıste, nous introduisons deux objectifs so- ciaux (ou globaux) supplémentaires : la minimisation de max_(u,v)∈A²(Sv−Su) et de max_(u,v)∈A²(Rv−Ru).

On remarque donc que, dans la situation où le stress et le risque d’incohérence sont également partagés entre les agents, les objectifs globaux sont optimaux (égaux à 0).

Sous ces hypothèses, un ordonnancement multi-agent est un problème d’optimisation multi-objectif dans lequel on cherche à déterminer pour chaque tâche fron- tière un intervalle de fin de réalisation [C_i, Ci] de sorte que :

• les objectifsSu,Ru,∀Au∈ A, max_(u,v)∈A²(Sv− Su) et max_(u,v)∈A²(Rv−Ru) soient minimis´es ;

• Ci≤D,∀i∈ F;

• il existe un ordonnancement réalisable pour tout agent (i.e., satisfaisant les contraintes de ressource et de temps) tel que la date fin de réali- sationCide toute tâcheisoit incluse dans [C_i, Ci].

Dans cet article, on s’intéresse au problème job shop multi-agent où chaque agent est associé à une machine et gère l’ensemble des tâches devant être exé- cutées sur cette machine. Nous proposons en particulier un algorithme distribué où l’ordonnancement est

(3)

construit par coopération entre les agents, cette co- opération mettant explicitement en jeu les concepts de stress et de risque d’incohérence précédemment définis. L’article est organisé comme suit. La partie suivante dresse un petit tour d’horizon de la problé- matique d’ordonnancement avec agents. La partie 3 formalise mathématiquement le problème job shop multi-agent. Les trois dernières parties décrivent le schéma de coopération proposé, l’algorithme distri- bué adopté et les méthodes permettant de résoudre les problèmes de décision induits au niveau de chaque agent.

2 ORDONNANCEMENT EN PR´ESENCE D’AGENTS : UN PETIT TOUR D’HORI- ZON

Tout problème d’ordonnancement de tâche impli- quant plusieurs acteurs, possédant chacun leur autonomie décisionnelle, chacun en charge de l’exécu- tion d’un sous-ensemble de tâches, peut être assimilé

à un problème d’ordonnancement multi-agent. Dans ce type d’organisation, un élément important est le caractère confidentiel des données que chaque agent manipule : seulement un ensemble restreint d’information, suffisant à la coordination des agents, est partagé entre les acteurs. Parmi les modes de coordination courants, on distingue celui où les acteurs se communiquent des propositions de dates de fin pour les tâches que chacun gère, ces valeurs étant négo- ciées jusqu’à ce qu’un compromis satisfaisant l’ensemble des acteurs soit atteint. Pour éviter une re- mise en cause trop fréquente des décisions, les acteurs peuvent se communiquer des intervalles (au lieu de date fixe) dans lesquels ils s’engagent à finir la tâche, ces intervalles pouvant s’affiner dans le temps au fur et à mesure que l’imminence de la fin de la tâche s’approche (Dudek et Stadtler 2004, Despontin et. al. 2005, Portmann et Mouloua 2007). Une fois les intervalles de fin de réalisation établis, les acteurs sont libres de s’organiser comme ils l’entendent, du moment qu’ils garantissent l’achèvement des tâches dans les intervalles contractés. Ils peuvent également, pour anticiper ou pour palier une situation d’incohé- rence, amorcer une renégociation des intervalles dans le but de les affiner ou de les déplacer.

En ordonnancement, la notion d’agent a souvent été au cœur de méthodes de résolution distribuée, ba- sées sur le paradigme des Systèmes Multi-Agents (SMA) (Ferber 1999). Dans le domaine de l’ordonnancement d’atelier, des approches heuristiques, basées SMA, sont proposées (Saadet. al.1997, Archimede et Coudert 1999) pour générer un ordonnancement réa- lisable : les agents, associés aux tâches, négocient leur intervalles d’exécution avec des agents ressources, un agent superviseur permettant d’arbitrer les situations conflictuelles. On trouve également des approches

SMA en ordonnancement multi-projets (Confessore et. al.2007, Homberger 2007) où les agents, associées aux projets, se partagent la capacité des ressources, en étant guidés par un agent médiateur.

Les travaux précédents doivent cependant être dis- tingués de la problématique d’ordonnancement multi- agent, telle que définie dans la partie précédente. En effet, nous nous intéressons ici davantage à la pro- blématique d’optimisation multi-objectif que la notion d’agent introduit, qu’à la nature distribuée, basée SMA, d’une méthode de résolution. Cette probléma- tique d’ordonnancement multi-agent, est introduite dans les travaux de (Agnetiset. al.2000, Agnetiset.

al.2004) dans lesquels les auteurs considèrent un pro- blème job shop où deux agents, détenant chacun un sous-ensemble de travaux, sont en compétition pour l’utilisation des machines, chacun tentant d’optimiser sa fonction objectif propre (la différence entre les fonctions objectifs étant ²-contrainte). Plusieurs ar- ticles (Agnetiset. al.2009, Chenget. al.2006, Cheng et. al.2008) s’intéressent au cas où l’atelier est réduit

à une machine (avec deux ou plusieurs agents) et pro- posent des résultats de complexité ainsi que des mé- thodes exactes, considérant des critères variés tels que le makespan, le retard algébrique ou le nombre pon- déré de tâches en retard. D’autres travaux concernent l’ordonnancement de grille de calcul où les agents, correspondant chacun à un cluster de calcul, négo- cient les travaux qu’ils prennent en charge, les travaux pouvant par ailleurs être eux mêmes affectés à des agents (voir par exemple (Pascual et. al. 2009) pour une approche récente).

Ainsi que proposé dans la partie précédente, de nom- breux auteurs considèrent également une fonction objectif globale, aussi appelée objectif social, que les agents doivent optimiser. Des concepts impor- tants, reliés à la théorie des jeux non coopératifs, peuvent alors être définis comme le prix de l’anar- chie (Koutsoupias et Papadimitriou 1999) (rapport entre le pire équilibre de Nash et la valeur optimale de la fonction objectif globale) ou le prix de la sta- bilité (Angelet. al. 2006) (rapport entre le meilleur

´equilibre de Nash et la valeur optimale de la fonction objectif globale).

Dans cet article, nous traitons du cas particulier du job shop multi-agent où les tâches sont associées aux agents en fonction de la machine que chaque tâche utilise. Nous formalisons ce problème et montrons comment déterminer une solution en adoptant un dé- marche distribuée où les agents négocient entre eux les fenêtres de fin de réalisation des travaux. Ce travail est le prolongement du travail amorcé dans (Briand et. al.2008).

(4)

3 LE JOB SHOP MULTI-AGENT

On considère un problème job shop àmmachines où un ensemble J den travaux doivent être ordonnan- cés. Un travail compte autant de tâches qu’il y a de machines dans l’atelier, l’ordre de passage sur les machines étant défini par la gamme opératoire du travail, supposée différente d’un travail à l’autre. La ième tâche du travail j est notée (j, i) ((j, i−1) précède donc (j, i)) et s’exécute pendant un tempspj,isur la machinemj,i. On suppose qu’un intervalle d’échéance [C_j,m+1, Cj,m+1] est associé à chaque travail j, o`u (j, m+ 1) est une opération fictive de durée nulle. Un agent étant associé à chaque machine et gérant l’ensemble des tâches devant être exécutées sur cette machine, on aTu ={(j, i)∈ T |mj,i=u}. Clairement, il n’existe pas de contraintes de précédence entre les tâches affectées au même agent. De plus, toute tâche est nécessairement frontière (i.e.,T =F).

Le probl`eme job shop est NP-difficile (Lenstra et.

al. 1977) et donc également le problème job shop multi-agent. Si on s’intéresse au problème à résoudre au niveau de chaque agentAu, les fenêtres d’achève- ment des tâches frontières étant déterminées, il s’agit d’un problème à une machine avec fenêtres de lancement et fenêtres d’échéance où l’on recherche un sé- quencement réalisable des travaux sur la machine. Ce problème est NP-complet en tant que généralisation du problème à une machine avec date de lancementrj

et date d’échéancedj, lui même NP-complet (Lenstra et. al.1977).

Les variables de décision du job shop multi-agent sont relatives à chaque tâche (j, i). Il s’agit de :C_j,i, Cj,i, Cj,i, rj,i, dj,i et ∆j,i où : [C_j,i, Cj,i] est l’intervalle de fin de réalisation contracté entre l’agent réalisant (j, i) et l’agent réalisant (j, i+ 1),Cj,iest la date de fin de (j, i), [rj,i, dj,i] est l’intervalle d’exécution de (j, i) choisie par Au ((j, i) ∈ Tu) et ∆j,i indique de combien d’unités de temps l’agent gérant l’exécution de (j, i+ 1) anticipe la fin de (j, i).

Comme indiqué dans la première partie, on désire minimiser le risque d’incohérence et le stress de l’ensemble des agents. Le risque d’incohérence est tou- jours évalué comme indiqué dans la formule (3), i.e., R_u= max_{(j,i)∈T_u_}∆_j,i.

Nous supposons que le stress Su de l’agent Au est inversement proportionnel à sa flexibilité temporelle Fu et que, minimiser Su, est équivalent à maximiser Fu. Dans la partie 6, une mesure deFu est proposée qui utilise la notion de retard algébrique.

Le problème job shop multi-agent que nous considé- rons peut être formalisé comme le problème multi- objectif suivant :

max{Fu},∀Au∈ A min{Ru},∀Au∈ A

min{max(Fu−Fv)},∀(Au, Av)∈ A² min{max(Ru−Rv)},∀(Au, Av)∈ A² s.c.

rj,i≥Cj,i−1−∆j,i−1,∀(j, i)∈ T (5)

∆j,i−1≤Cj,i−1−C_j,i−1,∀(j, i−1)∈ T (6) dj,i≤Cj,i,∀(j, i)∈ T (7)

Cj,i≤Cj,m+1,∀j∈ J (8)

Cj,i≤dj,i,∀(j, i)∈ T (9) Cj,i≥rj,i+pj,i,∀(j, i)∈ T (10) (j, i)≺(l, k)∨(l, k)≺(j, i),

∀((j, i),(l, k))∈ T_u²∧ ∀Au∈ A (11) Dans la formulation précédente, les contraintes (5)-(8) définissent les relations entre les variables C_j,i, C_j,i, r_j,i, d_j,i et ∆_j,i. La contrainte (5) impose que la date de lancement de la tâche (j, i) soit compatible avec la date d’achèvement au pire de (i, j−1), à

∆j,i−1 près (la valeur maximale de ∆j,i−1étant limi- tée par la contrainte (6)). Les contraintes de type (7) imposent que les dates échues des tâches soient anté- rieures à leur date de fin au pire, ces dernières devant

`a leur tour ˆetre compatible avec la date de fin des travaux (contrainte (8)).

Les contraintes (9)-(11) stipulent que les valeurs choisies pour les fenêtres d’exécution [rj,i, dj,i] des taches gérées par un même agentAugarantissent l’existence d’une solution réalisable pour le problème à une machine induit sur cet agent. La contrainte (11) est dis- jonctive et garantit que l’ordonnancement local de chaque agent correspond bien à une séquence, une précédence devant être choisie entre chaque paire de tâche gérée par l’agent.

A ce stade, nous remarquons que l’introduction de fe-` nêtres d’exécution [rj,i, dj,i] pour chaque tâche n’est pas nécessaire puisque nous pourrions simplement remplacer les contraintes (9) et (10) par la contrainte C_j,i≤Cj,i≤Cj,i. Cependant, ainsi que cela sera pré- cisé dans la partie 6, l’introduction de fenêtre d’exécu- tion permet de caractériser au niveau de chaque agent un ensemble flexible de solutions (et non pas une solution unique), cette flexibilité étant précieuse pour permettre à un agent de s’adapter aux incertitudes

´emanant de son environnement.

Pour finir, dans la fonction objectif de la formulation précédente, nous distinguons deux catégories d’objectifs : les objectifs locaux (Fu et Ru) et les objectifs globaux qui visent à minimiser les disparités entre les agents de sorte à ce que la solution soit la plus équi-

(5)

table possible.

4 UN SCHÉMA DE COOPÉRATION Comme dans (Despontin et. al. 2005) et (Briand et. al. 2008), on suppose que l’ordonnancement est construit de fa¸con distribuée et dynamique, par co- opération entre les agents. Dans ce cadre, la prise en compte d’objectif globaux devient délicate puisqu’il n’existe pas d’agent superviseur habilité à orienter les décision des agents de sorte à optimiser les objectifs globaux. Cependant, nous verrons comment les prendre en compte de fa¸con indirecte, en imposant certaines règles de comportement au sein de chaque agent, cela en vue de favoriser un comportement col- lectif équitable.

Nous considérons que les différentes fonctions inhé- rentes à la coopération sont la négociation, la coordination et la renégociation. Un processus de négo- ciation est initié lorsqu’un agent demande à un autre agent amont, de réaliser une nouvelle tâche sur un produit, correspondant à l’opération précédente au sens de la gamme. Une telle situation se produit au moment de l’arrivée d’un nouveau travail dans le sys- tème, ce qui nécessite de définir des fenêtres d’achè- vement pour toutes les tâches du nouveau travail. La prise en charge d’un nouveau travail j est initiale- ment sollicitée par un agent client et correspond donc

à l’occurrence d’une nouvelle commande pour un produit donné, à laquelle est associé un délai de livraison [D_j, Dj] = [C_j,m+1, Cj,m+1].

Au cours des négociations menées lors de l’inser- tion de nouvelles tâches, il peut s’avérer pertinent, pour améliorer la performance globale, de négocier

`a nouveau certains intervalles de tˆaches existantes.

On parle alors de renégociation. Notons qu’une re- négociation peut également avoir lieu si, suite à un aléa (interne à un agent), la date d’achèvement d’une tâche devient incohérente avec l’intervalle contracté.

Le processus de ren´egociation a alors pour but de re- couvrer la coh´erence.

Négociation et renégociation sont réalisées par

échange de requêtes entre paire d’agents. L’agentAu, prenant en charge la tâche (j, i+1), initie vers l’agent Av, assurant la réalisation de (j, i), une proposition d’intervalle [C_j,i, C_j,i], appelé intervalle cible. Nous supposons alors que Av émet en retour une réponse précisant le meilleur [C^∗_j,i, C^∗_j,i] que Av est capable d’assurer, étant données les valeurs courantes deFu, Fv,Ruet Rv.

Pour la détermination de [C^∗_j,i, C^∗_j,i], l’agentAv peut être amené à renégocier avec certains de ses agents amonts des intervalles d’achèvement d’autres tâches.

Il propose alors `a son tour des nouveaux intervalles cibles d’ach`evement vers ses agents amonts,

ceux-ci devant eux-mêmes déterminer une réponse la meilleure possible.

Lorsque Av détermine l’intervalle [C^∗_j,i, C^∗_j,i], en ré- ponse à une proposition de Au, on suppose qu’il a fait de son mieux et que cet intervalle devient ferme pour Au. Ce dernier n’a donc pas la possibilité de le renégocier, du moins pas tant que son état interne n’aura pas évolué (modification deSu,RuouTu).

On remarque également que lors de l’élaboration de la réponse deAv à une sollicitation deAu, les intervalles d’achèvement de l’ensemble des tâches de Tv

sont susceptibles d’être modifiés. Ces modifications doivent naturellement être transmises aux agents en aval deAv (et différents deAu), ceux-ci devant à leur tour adapter leur organisation.

En dehors de ces phases de négociation et renégocia- tion, on suppose que les agents se coordonnent en se communiquant les valeurs des dates de lancement et d’échéance de leurs tâches,rj,iet dj,i, que chacun se fixe. Ces échanges peuvent se faire périodiquement ou de fa¸con asynchrone, à l’occurrence de modifications.

Lorsqu’un agent re¸coit un message d’information, il doit v´erifier que son organisation reste coh´erente.

On distingue donc quatre types de message inter- agent :

• message R : Un agent initiateur formule une re- quête à un agent amont pour avoir le droit de commencer une tâche (j, i), déjà existante ou nouvelle, plus tôt que prévu (i.e., rj,i < C_j,i−1) : il stipule pour cela un intervalle de livraison cible [C_j,i−1, Cj,i−1] (l’agent initiateur peut éventuelle- ment être l’agent client lorsqu’il s’agit d’un nouveau travail à prendre en charge) ;

• message A : Un agent répond à la précédente re- quête d’un agent aval en indiquant un intervalle [C^∗_j,i, C^∗_j,i], correspondant à ce qu’il peut faire de mieux ;

• message I : Si, après traitement d’une requête par un agent, certaines tâches existantes voient une modification de leur dj,i ou leur rj,i, sans que cela entraˆıne une incohérence (i.e., dj,i ≤ Cj,i et rj,i≥ C_i,j−1), on en informe les agents aval (rj,i) ou amont (dj,i) ;

• message D : Si dj,i a changé mais qu’une incohé- rence est détectéedj,i> Cj,i, on informe les agents aval en définissant un nouvel intervalle cohérent [C⁰_j,i, C⁰_j,i].

La notion de processus de négociation est importante car les messages ci-dessus, hormis ceux de typeI, sont chacun liés à un processus distinct. Nous supposons que les attributs suivants caractérisent un processus : son identifiantid, l’identifiant du processus sources l’ayant initié et, s’il y a lieu, la tâche (j, i) dont l’intervalle de fin est négocié. Chacun des quatre messages

(6)

décrits plus haut portera donc les attributs du processus auquel il est rattaché, ainsi que trois attributs supplémentaires identifiant : le numéro e de l’agent

émetteur du message, l’opération (j, i) pour laquelle l’intervalle de fin de réalisation [C_j,i, Cj,i] (messages R, A et D), ou la date d’échéance dji (message I), sont proposés.

Figure 2 – Diagramme de s´equences illustrant un processus de n´egociation

En résumé, l’émission d’une requête d’intervalle cible [C_j,i, Cj,i] par un agent induit tout d’abord une phase de négociation amont (les requêtes se propagent de proche en proche, en amont dans le réseau d’agents).

Ceci est illustré sur le diagramme de séquences de la figure 2 : en réponse à la requête de Ay, concernant l’intervalle de fin de la tâche (j, i), Au décide d’émettre des requêtes vers ses propres agents amont concernant les intervalles de la tâche (j, i−1) (réali- sée par Ax) et d’une autre tâche, (k, l), réalisée par Aw. Lors de cette phase, les agents tentent d’absorber la modification de l’intervalle de fin de l’opération (j, i), sans modifier les dates d’achèvement au pire des autres tâches existantes, cela en conservant un certain niveau de flexibilité et de cohérence (cet aspect est dé- crit dans la partie 6). Une fois cette phase achevée, s’il n’était pas possible d’absorber la nouvelle tâche sans augmenter certaines dates d’achèvement au pire de tâches existantes, une propagation en aval des re- tards se produit jusqu’à retrouver une état cohérent.

Cette phase de propagation aval est également illus- trée sur la figure 2 :Aw, en réponse à la requête deAu

concernant la tâche (k, l), est contraint de retarder la fenêtre d’exécution de la tâche (a, b), prise en charge par Az. La même situation apparaˆıt lorsque Au, en réponse à la requête de Ay, retarde la fin de réalisa- tion de la tâche (c, d), gérée parA_z. Cependant, dans

cette situation, on constate queAz, ne pouvant plus assurer ses engagements de délais, initie une nouvelle phase de négociation amont avec Ax concernant la tâche (s, t).

5 COMPORTEMENT D’UN AGENT Algorithm 1Comportement d’un agentAu

1: repeat

2: msg←Getmsg() ;

3: if msg6=N ullthen

4: if msg.type=R∨msg.type=D then

5: Check←true;

6: p←CreateProcess(u) ;

7: if msg.type=R then

8: p.s←msg.s;

9: p.(j, i)←msg.(j, i) ;

10: else

11: p.s←p.id;

12: end if

13: else if msg.type=Athen

14: p←SearchProcess(msg.s) ;

15: AddAnswer(p, msg) ;

16: UpdateConstraint(msg.(j, i), msg.[C]^∗) ;

17: Check←AnswerEnd(p) ;

18: end if

19: if Checkthen

20: BackwardSolve(p, state,U) ;

21: if state6=Inf easible∧ U 6=∅ then

22: for all(j, i)∈ U do

23: Send(R, p.id, p.s, u,(j, i−1),[C]) ;

24: AddRequest(p.id,(j, i−1),[C]) ;

25: AddExtraConstraint((j, i),[C]) ;

26: end for

27: else

28: RemoveExtraConstraints(p.id) ;

29: ForwardSolve(p,U) ;

30: for all(j, i)∈ Tudo

31: if p.s6=p.idthen

32: Send(A, p.id, p.s, u, p.(j, i),[C]^∗) ;

33: else if (j, i)∈ U then

34: UpdateConstraint((j, i),[C_j,i]) ;

35: Send(D, p.id, p.s, u,(j, i),[C]⁰) ;

36: end if

37: end for

38: RemoveProcess(p) ;

39: end if

40: end if

41: end if

42: untilF alse

Dans cette partie, nous d´ecrivons le comportement d’un agent par l’algorithme 1. Le diagramme de s´e- quences de la figure 2 illustre une partie de son fonctionnement.

Cet algorithme est non bloquant. Il d´ecrit le comportement d’un agent lorsqu’il re¸coit des messages de

(7)

typeR,AouD. Pour ne pas surcharger l’algorithme, nous avons volontairement ici négliger la gestion des messages purement informatifs (de type I) qui per- mettent la coordination des agents. Comme dit plus haut, ces messages sont émis par un agent soit de fa¸con périodique, soit de fa¸con asynchrone, lorsque, lors des négociations, les valeurs des dj,i ou des rj,i

des tâches qu’il prend en charge sont modifiées, sans que cela entraˆıne une incohérence (i.e., dj,i≤Cj,iet rj,i ≥C_i,j−1). À la réception d’un message de type I, un agent doit vérifier que son état reste cohérent (utilisation de la procédure BackwardSolve) et si, tel n’est pas le cas, engager une renégociation des intervalles caractéristiques de ses tâches.

Si un nouveau message est re¸cu (ligne 3), deux cas sont distingués selon si le message est de type R ou D (ligne 4) ou alors de type A (ligne 13). Dans le premier cas les lignes 4-12 de l’algorithme décrivent les traitements faits. Tout d’abord, la variableCheck est mise à vrai car l’agent va devoir vérifier la cohé- rence de son état. Un nouveau processus de négocia- tionpest ensuite créé. Pour un message de typeR, on considère que l’initiateur p.sdu processus est l’agent ayant émis la requête et on mémorise dans p.(j, i) la tâche msg.(j, i) pour laquelle il faudra produire une réponse. Pour un message de type D, l’initiateur du processus est l’agent lui même, i.e., p.s←p.id.

Dans le cas o`u le message re¸cu est de typeA(lignes 13

à 18), il s’agit de la réponse à une requête que Au

avait précédemment émise dans le cadre d’un processus de négociation précédent. Dans ce cas, la pro- cédure SearchProcess est appelée pour retrouver le processus correspondant parmi les processus actifs.

On ajoute ensuite le message à la liste des réponses déjà re¸cues (procédure AddAnswer) par le processus.

Dans le cas où toutes les réponses correspondant aux requêtes précédemment émises en amont ont été re-

¸cues (i.e., AnswerEnd(p)=T rue), A_u va de nouveau pouvoir vérifier la cohérence de son état (et émettre si nécessaire de nouvelles requêtes).

La vérification de la cohérence de l’agent correspond aux lignes 19-40 de l’algorithme. Cette vérification se fait en deux phases : une phase de négociation amont et une phase de propagation aval. Lors de la première phase, la procédure BackwardSolve est ap- pelée (son fonctionnement est décrit dans la partie 6).

Cette procédure établit la listeUdes tâches (j, i) pour lesquelles des requêtes de modification des intervalles de fin de réalisation [C_j,i−1, Cj,i−1] doivent être en- voyées aux agents amont. L’envoi des requêtes est réa- lisé aux lignes 22-26. Pour chaque envoi, on mémorise la requête dans la liste des requêtes en cours attachée au processus (appel à AddRequest) et on impose de fa¸con temporaire que, dans les négociations futures, l’intervalle de fin de réalisation demandé à l’agent amont soit respecté (appel à AddExtraConstraint).

Cette précaution est nécessaire pour éviter une situation instable où l’agent referait, au cours d’une autre négociation, une requête pour la même tâche, avec un intervalle de fin de réalisation différent, alors qu’il n’a pas encore re¸cu la réponse à sa requête précédente. La procédure BackwardSolve doit donc permettre de respecter les intervalles de fin de réalisation de certaines tâches amont (celles pour lesquelles des requêtes sont en cours de traitement) mais est libre de violer les intervalles des autres tâches.

La phase de propagation aval est amorcée lorsque la procédure BackwardSolve ne trouve pas de solution (state = inf easible) ou lorsque la liste U est vide. Dans le premier cas, il n’est plus possible de continuer à négocier en amont en respectant les contraintes temporaires et les contraintes de positivité des variables de décision. Dans le second cas, il n’est plus nécessaire de négocier en amont puisque l’on respecte les intervalles de fin de réali- sation de toutes les tâches amont. Dans les deux cas, après avoir préalablement levé les contraintes temporaires portant sur les intervalles de fin de réalisation amont (appel à RemoveExtraConstraints), la procé- dure ForwardSolve est appelée (cf. partie 6). Celle-ci

établit la listeU des tâches (j, i) pour lesquelles des re- tards sur les intervalles de fin de réalisation [C_j,i, Cj,i] doivent être signalés auprès des agents aval. L’envoi des messages de retard est réalisé aux lignes 33-35 et on mémorise les valeurs des nouveaux intervalles. Si le processuspa été amorcé dans le cadre d’une requête d’un agent amont (p.s 6= p.id) concernant la tâche p.(j, i), on envoie à cet agent la réponse à sa requête.

Une fois la propagation aval achevée, le processus p peut alors être détruit (ligne 38).

On remarque que cet algorithme autorise d’avoir plusieurs processus de négociation en cours au niveau d’un même agent. En effet, les valeurs des intervalles de fin de réalisation indiquées dans les requêtes en amont étant provisoirement imposées pour les futures négociations, on est sûr que les prochaines requêtes

émises par l’agent seront compatibles avec celles déjà

émises. Cependant, les décisions seront dépendantes de l’ordre de traitement des requêtes re¸cues.

On peut également affirmer que l’algorithme converge nécessairement vers une solution. En effet, les intervalles de fin de réalisation étant progressivement gelés lors de la négociation amont, on est sûr qu’à un moment donné l’état où (state= Inf easible∨ U = ∅) sera atteint. Or, dans ce cas la négociation amont s’achève et on passe dans une phase où les décisions sont imposées vers l’aval sans possibilité de recours.

(8)

6 AJUSTEMENT DU RISQUE D’INCOH´E- RENCE ET DE LA FLEXIBILIT´E DE Au

Dans cette partie, nous décrivons plus précisément le fonctionnement des procédures BackwardSolve et ForwardSolve. Nous expliquons également comment sont gérés la flexibilité et le risque d’incohérence au sein de l’agent Au.

Nous supposons que l’ordonnancement local réalisé par chaque agent est un ordonnancement robuste basé sur la caractérisation d’un ensemble de solutions.

En effet, dans le cas du job shop multi-agent, dis- poser d’un ensemble robuste de solutions au niveau de chaque agent est souhaitable pour permettre de s’adapter, non seulement aux aléas internes à l’agent (variation des durées opératoires), mais aussi et sur- tout à ceux émanant de son environnement (variation des dates de fin des tâches sur les agents amont).

On utilise pour cela la technique proposée dans (Briand et. al. 2007) pour le problème à une machine qui, étant donné un ordre total entre les rj,ietdj,ides tâches, fournit un ensemble de solutions dominantes dont le retard algébrique au pire peut être calculé en temps polynomial. La propriété de dominance permet d’assurer que, quelles que soient les valeurs effectives de rj,i et dj,i respectant l’ordre total choisi, et quelles ques soient les réalisations des durées opératoires, l’ensemble des solutions contient nécessairement une solution optimale minimisant le retard algébrique Lmax = max{(j,i)∈Tu}(Cj,i−dj,i).

La performance au mieux de l’ensemble de solutions caractérisées peut donc être considérée robuste vis-à- vis d’un grand ensemble de scénarios de réalisation.

De plus, une procédure arborescente est également proposée dans (Briand et. al. 2007) qui permet d’affiner les valeurs des rj,ietdj,ide sorte à éliminer de l’ensemble des solutions celles les moins bonnes vis-à-vis du retard algébrique (on améliore ainsi la performance au pire de l’ensemble de solutions).

Pour pouvoir utiliser cette technique dans le cadre du job shop multi-agent et être capable de calculer le pire retard algébrique pour un agent Au, ∀Au ∈ A, il est nécessaire de connaˆıtre les valeurs de rj,i etdj,i

des tâches deAu. Dans notre cas, ces valeurs doivent être choisies à l’intérieur des intervalles de fin de réa- lisation des tâches contractés avec les agents amont et aval de Au, i.e., rj,i ∈ [C_j,i−1, Cj,i−1] et dj,i ∈ [C_j,i, Cj,i]. De plus, lorsque les agents se coordonnent, les agents amont communiquent àAules valeurs courantes desdj,i−1et, en aval, les valeurs desrj,i+1sont

également transmises. Ces valeurs étant nécessaire- ment cohérentes avec les intervalles contractés, on a dj,i−1 ∈ [C_j,i−1, Cj,i−1] et rj,i+1 ∈ [C_j,i, Cj,i]. On peut donc restreindre davantage les domaines de valeur derj,ietdj,ipuisque, pour assurer le respect des gammes opératoires, il faut que r_j,i∈[d_j,i−1, C_j,i−1]

etdj,i∈[C_j,i, rj,i+1].

Le choix des valeurs derj,iet dj,idoit être relié à la notion de risque d’incohérence proposée dans la partie 1. En effet, plusrj,i sera proche dedj,i−1 et plus le risque d’incohérence sera grand puisque Au sera sensible à une détérioration du délai dj,i−1. Inverse- ment, plusrj,isera proche deCj,i−1et moins le risque d’incohérence sera grand puisque l’agent réalisant la tâche (j, i−1) évitera autant qu’il peut de violer la valeurCj,i−1contractée. De fa¸con similaire, le risque est maximal lorsque la valeurdj,iest proche derj,i+1

et minimal lorsqu’elle se rapproche deC_j,i.

Ici, par analogie avec les comportements constat´es dans la pratique, nous proposons de dimensionner le risque d’incoh´erence en fonction du temps, de sorte

à ce que, plus l’instant courant sera éloigné de la fe- nêtre de réalisation d’une tâche, et plus l’agent pourra choisir un risque d’incohérence important pour cette tâche. Inversement, plus l’exécution de la tâche de- viendra imminente et plus le risque acceptable sera faible. Pour cela, nous proposons de faire varier li- néairement en fonction du temps les valeurs der_j,iet dj,iselon les formules suivantes :

½ rj,i=Cj,i−1−ε^r_j,i(Cj,i−1−dj,i−1)

dj,i=C_j,i+ε^d_j,i(rj,i+1−C_j,i) (12) où ε^r_j,i (resp.ε^d_j,i) varie progressivement de 1 (risque d’incohérence fort) vers 0 (risque d’incohérence faible) au fur et à mesure que l’instant courant t devient proche deCj,i−1(resp. deC_j,i).

Revenons à présent à la description des procédures BackwardSolve et ForwardSolve. Nous supposons que ces deux procédures déterminent préalablement les valeurs desrj,i et dj,i des tâches de Au selon la formule (12) : ainsi, selon l’instant où ces procédures sont appelées, les valeurs choisies des rj,i et dj,i va- rient (en devenant de moins en moins risquées). Les deux procédures utilisent ensuite la méthode de sépa- ration et évaluation décrite dans (Briandet. al.2007) pour déterminer un retard algébrique maximalL^max_j,i pour chaque tâche (j, i) de sorte à ce queL^max_j,i ≤L_u, Lu <0 étant le plus grand retard algébrique admis- sible par Au. C’est cette valeur de Lu que nous uti- lisons pour mesurer la flexibilité Fu d’un agent, en posant Fu = −Lu. Plus la valeur de Fu est grande et plus la marge disponible dans le pire des cas pour réaliser les opérations est importante.

La procédure BackwardSolve travaille àdj,iconstant (on essaie de respecter les intervalles de fin des tâches) et détermine quels doivent être les intervalles de fin des tâches amont permettant de satisfaire lesdj,i, en maintenant un niveau de flexibilité Fu. Lors de ce calcul, si L^max_j,i ≤ rj,i−dj,i−1, alors il est possible d’achever (j, i) dans les délais impartis, sans remettre

(9)

en cause l’intervalle de fin de la tâche (j, i−1). Sinon, on peut déduire que la tâche (j, i) appartient à l’ensemble U des tâches en retard (voir algorithme 1) pour lesquelles il va falloir renégocier l’intervalle de fin de la tâche amont. On peut par exemple proposer la valeur [C_j,i−1, Cj,i−1] = [rj,i−L^max_j,i , dj,i−pj, i].

De fa¸con inverse, la proc´edure ForwardSolve travaille

à rj,iconstant et détermine quels doivent être les intervalles de fin des tâches gérées par A_u, étant don- nées les valeurs de rj,i, cela en maintenant un niveau de flexibilité Fu. Lors de ce calcul, si L^max_j,i ≤ rj,i+1−dj,i, alors il est possible d’achever (j, i) dans les délais impartis, sans remettre en cause l’intervalle de fin de la tâche (j, i). Sinon, on peut déduire que la tâche (j, i) appartient à l’ensembleU des tâches en retard (voir algorithme 1) pour lesquelles il va falloir signaler aux agents aval un retard (message de type D). On peut par exemple propager le nouvel intervalle de fin [C⁰_j,i−1, C⁰_j,i−1] = [rj,i+pj, i, dj,i+L^max_j,i ].

On note que la valeur deFu est propre à l’agentAu. Afin d’éviter des situations de trop grande disparité entre les valeurs de flexibilité, il est nécessaire de défi- nir des règles quant à l’évaluation de cette constante.

Par exemple, lorsque Au répond à une requête d’un agent aval Av, on peut imposer que Fu ≥ F −v.

Une telle règle favorise les comportements coopéra- tifs dans la mesure où, suite à une sollicitation deAv, Au peut accepter de perdre de la flexibilité dans la limite où celle-ci ne deviendrait pas inférieure à celle de Av (on peut éventuellement tolérer un petit dé- passement). On incite donc les acteurs à adopter un comportement équitable où les valeurs de flexibilité seraient également partagées.

CONCLUSION

Dans cet article, le probl`eme job shop multi-agent a

été décrit et formalisé mathématiquement, sous forme d’un problème d’optimisation multi-objectif. On distingue des objectifs locaux et des objectifs globaux.

Les objectifs locaux visent à minimiser le stress de chaque agent et le risque d’incohérence. Les objectifs globaux visent à favoriser les solutions où stress et risque d’incohérence sont équitablement partagés entre les agents.

Pour résoudre ce problème, une méthode distribuée a été proposée où les agents négocient en amont les intervalles de fin des tâches qu’ils gèrent et se synchro- nisent. Dans cette méthode, les agents communiquent par message de fa¸con asynchrone, quatre types de message étant distingués. L’algorithme régissant le comportement de chaque agent a été décrit et les mé- thodes locales permettant de résoudre les problèmes de décisions ont été également explicitées.

La m´ethode est actuellement en cours d’impl´emen-

tation et les résultats seront décrits lors de la confé- rence. Une autre méthode permettant de résoudre le problème de fa¸con centralisée (et optimale en imposant des contraintes sur les valeurs de certains objectifs) est également en cours d’étude. L’objectif est de comparer les performances obtenues dans les cas distribué et centralisé.

REMERCIEMENTS

Ce travail a été réalisé dans le cadre du projet ANR Blanc no. 08-BLAN-0331-01 nommé “ROBOCOOP”

(cf.http://robocoop.li.univ-tours.fr).

REFERENCES

Agnetis A., Mirchandani P. B., Pacciarelli D., Pa- cifici A., 2000, “Nondominated schedules for a job-shop with two competing agents”, Compu- tational and Mathematical Organization Theory, 6(2), pp. 191-217.

Agnetis A., Mirchandani P. B., Pacciarelli D., Pacifici A., 2004, “Scheduling problems with two competing agents”, Operations Research, 52(2), pp.

229-242.

Agnetis A., de Pascale G., Pacciarelli D., 2009, “A La- grangian approach to single-machine scheduling problems with two competing agents”, Journal of Scheduling, 12(4), pp. 401-415.

Angel E, Bampis E, Pascual F, 2006, “ The price of approximate stability for a scheduling game problem”, Proceedings of Euro-Par (Lecture Notes in Computer Science), Springer : Berlin.

Archimede B., Coudert T., 2001, “Reactive scheduling using a multi-agent model : the SCEP fra- mework”, Engineering Applications of Artificial Intelligence, 14, pp. 667-683.

Briand C., La H.T., Erschler J., 2007, “A robust approach for the single machine scheduling problem”, Journal of Scheduling, 10(3), pp. 209-221.

Briand C., Ourari S., Bouzouia B., 2008, “A coopera- tive approach for job shop scheduling under un- certainties ”, International Conference on Col- laborative Decision Making (CDM’08), Collabo- rative decision making : perspectives and chal- lenges, vol 176, IOS Press, ISBN 978-1-58603- 881-6, pp. 5-15.

Cheng T. C. E., Ng C. T., Yuan J. J., 2006, “Multi- agent scheduling on a single machine to minimize total weighted number of tardy jobs”,Theoretical Computer Science, 362, pp. 273-281.

Cheng T. C. E., Ng C. T., Yuan J. J., 2006, “ Multi- agent scheduling on a single machine with max- form criteria”, European Journal of Operational Research, 188, pp. 603-609.

Confessore G., Giordani S., Rismondo S., 2007, “ A Market-based Multi-Agent System Model for De-

(10)

centralized Multi-Project Scheduling”,Annals of Operations Research, 150(1), pp. 115-135.

Despontin E., Briand. C., Esquirol P., 2005, “ Aide à la décision pour une coopération interentreprise”, Journal Européen des Systèmes Automatisés, 39, pp. 797-816.

Dudek G., Stadtler H., 2004, “ Negotiation-based col- laborative planning between supply chain part- ners”, European Journal of Op-erational Re- search, 163, pp 668-687, 2004.

Ferber J., 1999, “ Multi-Agent Systems : an Intro- duction to Distributed Artificial Intelligence”, Addison-Wesley, Reading, MA.

Homberger J., 2007, “A Multi-agent System for the Decentralized Resource-constrained Multi- project Scheduling Problem”, International Transactions in Operational Research, 14(6), pp. 565-589.

Koutsoupias E., Papadimitriou C., 1999, “Worst-case equilibria”, in Proceedings of the 16th Annual Symposium on Theoretical Aspects of Computer Science, pp. 404-413.

Lenstra , J.K., Rinnooy Kan A.H.G, Brucker P., 1977,

“Complexity of machine scheduling problems”, Annals of Discrete Mathematics, 1, pp. 343-362.

Pascual F., Rzadca K., Trystram D., 2009, “Coopera- tion in Multi-Organization Scheduling”,Concur- rency and Computation : Practice and Expe- rience, 21(7), pp. 905-921.

Portmann M.-C, Mouloua Z., 2007, “A window time negotiation approach at the scheduling level in- side supply chains, 3rd Multid-isciplinary In- ternational Conference on Scheduling : Theory and Application, MISTA’07, Paris, 28-31 august, pp410-417.

Saad, A., Kawamura, K., Biswas, G., 1997, “Perfor- mance evaluation of Contract Net-based hete- rarchical scheduling for flexible manufacturing systems”, International Journal of Automation and Soft Computing, special issue on Intelligent Manufacturing Planning andShopfloor Control, 3(3), pp. 229-248.