4.2 Présentation du modèle IDEAS
4.2.3 Processus d’engagement centré identité
La coopération fonctionne à travers l’allocation de certaines tâches par un agent à un
autre agent sollicité via une requête répondant à un engagement [Castelfranchi and
Fal-cone, 2002]. Dans le modèle BDI de base, l’agent se base sur l’applicabilité d’un plan
(unifié avec un évènement) pour décider de son engagement à le suivre. Cet
engage-ment se traduit simpleengage-ment par l’ajout de la séquence des actions du plan comme une
intention dans l’ensembleI. Une fois que l’agent est passé à l’étape de l’exécution des
intentions, le modèle de base propose plusieurs stratégies d’engagement (blind,
open-minded,single-minded, présentées dans la Section2.2.3en page15). Ces dernières sont
mises en place lorsqu’un des plans de l’agent n’aboutit pas : est-ce qu’il choisit un autre
plan pour traiter l’évènement ? ce qu’il abandonne le traitement de l’évènement ?
est-ce qu’il garde le même plan tant que l’objectif n’est pas satisfait ? Les stratégies proposées
dans le modèle BDI de base répondent à ces questions.
Dans le contexte où un agent est sollicité par d’autres agents du même SMA, on peut
comprendre qu’ils sont pré-programmés pour qu’ils s’entre-aident, et qu’ils partagent
probablement les mêmes objectifs. La gestion de conflits entre ces agents sera en grande
partie effectuée pour coordonner les actions des agents, et éviter les redondances et
la re-planification des tâches. Cependant, lorsqu’un agent est sollicité par d’autres qui
ne sont pas forcément du même SMA que lui, ou avec lesquels il n’a jamais coopéré
pour participer dans la réalisation de certaines actions ou dans l’allocation de certaines
tâches, évaluer l’applicabilité d’un plan n’est pas suffisante pour l’adopter et s’engager à
le suivre. Un agent ne doit mettre dans ses intentions que des plans n’interférant pas
né-gativement avec ses autres intentions, et des plans favorisant la cohésion de SMA. Plus
généralement, tout engagement de l’agent doit être pris de manière à ce qu’il conserve
son identité, et adapter cette dernière pour qu’elle profite des changements du contexte
physique et sociale de l’agent.
Ainsi, nous avons besoin dans notre modèle IDEAS d’un processus d’engagement
per-mettant aux agents de choisir les meilleures options qui réduisent les interférences
né-gatives entre l’exécution des actions des agents appartenant à des SMA coexistants.
Nous proposons de modéliser ce processus d’engagement en tant que DCOP (Distributed
Constraint Optimization Problem) [Modi et al.,2005]. DCOP est un formalisme pour la
ré-solution de problèmes distribués en maximisant le bien-être social d’un groupe d’agents.
Ce formalisme est appliqué dans une large gamme d’applications multi-agents, qui
par-4.2 PRÉSENTATION DU MODÈLE IDEAS 59
tagent des caractéristiques communes avec notre mécanisme d’engagement basé sur
l’identité : les agents choisissent un petit nombre de possibilités ; l’efficacité du groupe
dans son ensemble dépend des choix des agents en interaction ; chaque agent ne peut
communiquer qu’avec quelques autres agents de son voisinage local ; et le problème doit
être résolu de manière entièrement distribuée.
Distributed Constraint Satisfaction Problem Un problème d’optimisation de contraintes
distribuées (DCOP) modélise un certain nombre d’agents devant prendre certaines
déci-sions. Ces agents ont un nombre fini de choix possibles pour chaque décision. Ensuite,
les synergies entre les décisions sont capturées à l’aide de contraintes : des fonctions qui
spécifient une valeur différente pour chaque combinaison de choix d’un sous-ensemble
de décisions des agents. Par conséquent, l’objectif d’un algorithme DCOP est de trouver
le choix pour chaque décision qui maximise ou minimise la somme globale des fonctions.
Un DCOP est représenté par un tuple⟨A,X,D,C, α⟩, tel que :
— A= {A
1, ..., A
|A|} est un ensemble d’agents impliqués dans le problème ;
— X = {X
1, ..., X
n} est un ensemble de variables de décision, où chaque variable est
contrôlée par un agent de l’ensembleA;
— D= {D
X|X ∈ X} est un ensemble de domaines finis de variables, tel que chaque
variableX
iprend des valeurs dansD
Xi;
— C = {f
1, ..., f
m} est un ensemble de contraintes, où chaque contrainte est une
fonc-tion définie sur un sous-ensemble χ
i= {X
i, ..., X
j} ⊆ X. Chaque fonction f
iaffecte une valeur d’utilité pour chaque combinaison de valeurs de χ
i. Plus
for-mellement,f :D
Xi×...×D
Xj→IR∪ {−∞}.
— α : X → Aest une fonction qui fait correspondre à chaque variable de décision
son agent de contrôle. Un agent peut contrôler plusieurs variables, tandis qu’une
variable est contrôlée par un seul agent.
Une solution d’un problème DCOP est d’avoir une affectation de toutes les variables de
décision qui maximise la fonctionobjectif, qui est la fonction qui capture l’utilité agrégée
d’une instanciation complèteX
∗pour toutes les variablesX
i:
X
∗=argmax∑
mi=1