lement d’une valeur de réserve, du temps et d’un modèle de leurs pairs1 dont les agents
disposent ou qu’ils construisent ;
3. une règle d’acceptabilité qui permet à l’initiateur de décider si une offre est admissible ou non ;
4. une stratégie d’apprentissage ou une stratégie d’adaptation qui s’appuie sur un modèle d’opposant et qui influe sur les trois composants précédents.
Dans le cadre de l’approche heuristique, les fonctions de décisions introduites par [Faratin
et al. 1998] sont fondatrices. Alors que les offres reçues sont évaluées par des fonctions de coût multi-attributs, les offres générées le sont à partir d’une combinaison linéaire de fonctions simples, appelées tactiques. Une tactique calcule la valeur d’un attribut (le prix, la quantité, la qualité, etc.) d’une offre en fonction d’un critère particulier. Trois familles de tactiques sont suggérées selon les critères qu’elles considèrent :
• les tactiques temporelles qui déterminent quand un agent doit concéder ;
• les tactiques imitatives qui déterminent le comportement de l’agent en fonction de celui de son opposant ;
• les tactiques qui contraignent les offres en fonction des ressources disponibles.
Selon la fonction de concession d’une tactique temporelle, un agent débute la négociation en proposant une valeur maximale (ou minimale si l’utilité décroît avec la valeur de l’attribut) puis concède plus ou moins rapidement. On distingue deux tactiques temporelles : la tactique
Boulware qui consiste à rester sur ses positions jusqu’à la date butoir pour y proposer sa valeur
de réserve et la tactique Conceder qui consiste à concéder rapidement.
Selon la fonction de concession réciproque, l’agent reproduit proportionnellement le comporte- ment de son opposant. Cette fonction peut être raffinée pour être pseudo-aléatoire ou lissée en prenant en compte le comportement de l’opposant dans une fenêtre temporelle.
Une fonction de concession qui prend en compte les ressources est similaire à une fonction de concession temporelle. En effet, le temps peut être considéré comme une ressource dont la quantité diminue de manière continue tout au long de la négociation. L’idée est ici de rendre les agents progressivement plus conciliants à mesure que la quantité de ressources disponibles diminue. Le nombre d’agents qui négocient peut également être considéré comme une ressource : plus il y a d’agents capables de négocier, moins la pression est forte. À l’inverse, s’il ne reste qu’un agent avec qui négocier, il est important de concéder pour donner lieu à un accord.
2.3
Évaluation collective des accords
Si chaque agent évalue un accord grâce à sa fonction de coût, il est également possible d’évaluer un accord selon un point de vue collectif, c’est-à-dire de lui attribuer une valeur sociale. Il existe
plusieurs méthodes d’évaluation collective [Chevaleyre et al. 2006]. Sont décrits ici le critère de
Pareto ainsi que deux autres métriques du bien-être social.
34 Chapitre 2. Négociation multi-agents pour l’allocation de tâche
Optimalité de Pareto
Le critère de Pareto compare les alternatives du point de vue d’un groupe d’agents en conflit. Une alternative x domine au sens de Pareto une alternative y pour un groupe d’agents si x est au moins aussi bien que y pour tous les agents et qu’au moins un agent préfère strictement
x à y. Une alternative est considérée comme optimale au sens de Pareto si elle n’est dominée
par aucune autre alternative. En d’autres termes, une alternative n’est pas optimale s’il en existe une meilleure pour un agent sans qu’elle ne soit pire pour aucun des autres. Le critère de Pareto suppose un minimum d’hypothèses sur les préférences individuelles mais débouche sur un classement partiel des alternatives. En effet, même si nous sommes en mesure de comparer deux alternatives pour un agent, la satisfaction ne peut pas être comparée d’un agent à un
autre [Arrow 1951].
Bien-être social
Contrairement à l’approche de Pareto, la théorie du choix social réhabilite l’analyse des compa-
raisons interpersonnelles [Sen 1970]. Les fonctions de choix social agrègent les utilités des agents.
Plusieurs types d’agrégation existent et offrent une évaluation différente d’un même accord. Dans le cadre d’une allocation de tâches, moins le coût que représente le lot de tâches alloué à un agent
est élevé, plus cet agent est individuellement satisfait. Pour rappel, on note wi(P ) la charge de
travail que représente l’allocation de tâches P pour l’agent i.
Améliorer le bien-être utilitaire (noté swu pour utilitarian social welfare) revient à minimiser
la charge sociale utilitaire, c’est-à-dire la somme des coûts individuels des agents du système. Cette mesure représente l’insatisfaction de la société dans son ensemble.
Définition 2.1 (Contribution utilitaire).
Soit P une allocation de tâches parmi les agents de A. La contribution utilitaire que repré- sente P pour A est :
swu(P ) =
X
i∈A
wi(P ) (2.1)
Pour faire le lien avec les notions présentées dans le chapitre 1, le flowtime d’une allocation de
tâches (cf. définition1.8) est une mesure la contribution utilitaire que représente cette allocation
pour les agents du système. Une allocation qui minimise la contribution utilitaire des agents est
optimale au sens de Pareto [Delecroix 2015, Chapitre 4].
Améliorer le bien-être égalitaire (noté swepour egalitarian social welfare) revient à minimiser
la charge individuelle maximale. Améliorer le bien-être égalitaire consiste à réduire les inégalités dans la population d’agents, c’est-à-dire réduire la contribution individuelle de l’agent le plus chargé.
Définition 2.2 (Contribution égalitaire).