Évaluation collective des accords - Pépite | Négociation multi-agents pour la réallocation dyna

lement d’une valeur de réserve, du temps et d’un modèle de leurs pairs1 _{dont les agents}

disposent ou qu’ils construisent ;

3. une règle d’acceptabilité qui permet à l’initiateur de décider si une offre est admissible ou non ;

4. une stratégie d’apprentissage ou une stratégie d’adaptation qui s’appuie sur un modèle d’opposant et qui influe sur les trois composants précédents.

Dans le cadre de l’approche heuristique, les fonctions de décisions introduites par [Faratin

et al. 1998] sont fondatrices. Alors que les offres reçues sont évaluées par des fonctions de coût multi-attributs, les offres générées le sont à partir d’une combinaison linéaire de fonctions simples, appelées tactiques. Une tactique calcule la valeur d’un attribut (le prix, la quantité, la qualité, etc.) d’une offre en fonction d’un critère particulier. Trois familles de tactiques sont suggérées selon les critères qu’elles considèrent :

• les tactiques temporelles qui déterminent quand un agent doit concéder ;

• les tactiques imitatives qui déterminent le comportement de l’agent en fonction de celui de son opposant ;

• les tactiques qui contraignent les offres en fonction des ressources disponibles.

Selon la fonction de concession d’une tactique temporelle, un agent débute la négociation en proposant une valeur maximale (ou minimale si l’utilité décroît avec la valeur de l’attribut) puis concède plus ou moins rapidement. On distingue deux tactiques temporelles : la tactique

Boulware qui consiste à rester sur ses positions jusqu’à la date butoir pour y proposer sa valeur

de réserve et la tactique Conceder qui consiste à concéder rapidement.

Selon la fonction de concession réciproque, l’agent reproduit proportionnellement le comportement de son opposant. Cette fonction peut être raffinée pour être pseudo-aléatoire ou lissée en prenant en compte le comportement de l’opposant dans une fenêtre temporelle.

Une fonction de concession qui prend en compte les ressources est similaire à une fonction de concession temporelle. En effet, le temps peut être considéré comme une ressource dont la quantité diminue de manière continue tout au long de la négociation. L’idée est ici de rendre les agents progressivement plus conciliants à mesure que la quantité de ressources disponibles diminue. Le nombre d’agents qui négocient peut également être considéré comme une ressource : plus il y a d’agents capables de négocier, moins la pression est forte. À l’inverse, s’il ne reste qu’un agent avec qui négocier, il est important de concéder pour donner lieu à un accord.

2.3 Évaluation collective des accords

Si chaque agent évalue un accord grâce à sa fonction de coût, il est également possible d’évaluer un accord selon un point de vue collectif, c’est-à-dire de lui attribuer une valeur sociale. Il existe

plusieurs méthodes d’évaluation collective [Chevaleyre et al. 2006]. Sont décrits ici le critère de

Pareto ainsi que deux autres métriques du bien-être social.

34 Chapitre 2. Négociation multi-agents pour l’allocation de tâche

Optimalité de Pareto

Le critère de Pareto compare les alternatives du point de vue d’un groupe d’agents en conflit. Une alternative x domine au sens de Pareto une alternative y pour un groupe d’agents si x est au moins aussi bien que y pour tous les agents et qu’au moins un agent préfère strictement

x à y. Une alternative est considérée comme optimale au sens de Pareto si elle n’est dominée

par aucune autre alternative. En d’autres termes, une alternative n’est pas optimale s’il en existe une meilleure pour un agent sans qu’elle ne soit pire pour aucun des autres. Le critère de Pareto suppose un minimum d’hypothèses sur les préférences individuelles mais débouche sur un classement partiel des alternatives. En effet, même si nous sommes en mesure de comparer deux alternatives pour un agent, la satisfaction ne peut pas être comparée d’un agent à un

autre [Arrow 1951].

Bien-être social

Contrairement à l’approche de Pareto, la théorie du choix social réhabilite l’analyse des compa-

raisons interpersonnelles [Sen 1970]. Les fonctions de choix social agrègent les utilités des agents.

Plusieurs types d’agrégation existent et offrent une évaluation différente d’un même accord. Dans le cadre d’une allocation de tâches, moins le coût que représente le lot de tâches alloué à un agent

est élevé, plus cet agent est individuellement satisfait. Pour rappel, on note w_i(P ) la charge de

travail que représente l’allocation de tâches P pour l’agent i.

Améliorer le bien-être utilitaire (noté swu pour utilitarian social welfare) revient à minimiser

la charge sociale utilitaire, c’est-à-dire la somme des coûts individuels des agents du système. Cette mesure représente l’insatisfaction de la société dans son ensemble.

Définition 2.1 (Contribution utilitaire).

Soit P une allocation de tâches parmi les agents de A. La contribution utilitaire que repré- sente P pour A est :

swu(P ) =

i∈A

wi(P ) (2.1)

Pour faire le lien avec les notions présentées dans le chapitre 1, le flowtime d’une allocation de

tâches (cf. définition1.8) est une mesure la contribution utilitaire que représente cette allocation

pour les agents du système. Une allocation qui minimise la contribution utilitaire des agents est

optimale au sens de Pareto [Delecroix 2015, Chapitre 4].

Améliorer le bien-être égalitaire (noté sw_epour egalitarian social welfare) revient à minimiser

la charge individuelle maximale. Améliorer le bien-être égalitaire consiste à réduire les inégalités dans la population d’agents, c’est-à-dire réduire la contribution individuelle de l’agent le plus chargé.

Définition 2.2 (Contribution égalitaire).

Dans le document Pépite | Négociation multi-agents pour la réallocation dynamique de tâches et application au patron de conception MapReduce (Page 43-45)