• Aucun résultat trouvé

3.2 Probl` emes d’arbres couvrants multicrit` eres

4.1.3 Strat´ egies d’´ elicitation

a la valeur PMRi(x, y, Ωi) mais nous fournit `a la place une borne sup´erieure de cette derni`ere. Ces bornes sup´erieures peuvent ˆetre utilis´ees pour d´eriver des bornes sup´erieures sur les valeurs PMR(x, y, Ω) pour finalement obtenir une borne sup´erieure sur la valeur mMR(X , Ω). En proc´edant de la sorte, nous ob-tenons une garantie de performance qui est certes moins forte que la valeur mMR(X , Ω) exacte mais beaucoup plus facile `a calculer. Par ailleurs, dans la Section 4.1.4 d´edi´ee aux tests num´eriques, nous verrons que cette borne sup´erieure est relativement proche de la valeur r´eelle en pratique.

4.1.3 Strat´egies d’´elicitation

En fonction des ensembles Ωi, i ∈ N , `a consid´erer, il est possible que la garantie de performance quantifi´ee par la valeur mMR(X , Ω) ne soit pas suffisamment satisfaisante pour les votants. Dans ces situations, il est pr´ef´erable de r´eduire l’impr´ecision sur les jeux de poids ωi, i ∈ N, mod´elisant les pr´ef´erences de nos agents afin d’am´eliorer la qualit´e de la recommandation. Il s’agit de poser des questions aux diff´erents agents, soigneusement choisies les unes apr`es les autres, de mani`ere `a obtenir l’in´egalit´e mMR(X , Ω) ≤ δ en sollicitant les votants le moins possible, o`u δ est un seuil de tol´erance jug´e acceptable par ces derniers. Rappelons que, dans le cas o`u δ = 0, l’alternative qui sera recommand´ee est par d´efinition est gagnant n´ecessaire par la m´ethode de Borda. Pour produire une question informative `a une it´eration donn´ee, nous proposons de nous concentrer sur une paire d’alternative (x, y) ∈ X2 telle que :

x ∈ arg min

x∈XMR(x, X , Ω) y ∈ arg max

y∈X PMR(x, y, Ω)

Poser une question permettant de diminuer significativement la valeur PMR(x, y, Ω) peut en effet r´eduire aussi nettement la valeur mMR(X , Ω) courante, car nous avons mMR(X , Ω) = PMR(x, y, Ω) par d´efinition. Rappelons que cette id´ee est au cœur de la strat´egie d’´elicitation CSS (pr´esent´ee section 1.4.2) qui s’est r´ev´el´ee tr`es efficace en pratique dans le cadre de la probl´ematique de choix mono-agent. Cette derni`ere strat´egie consiste `a demander au d´ecideur de comparer directement les alternatives x et y, la r´eponse permettant de faire passer soit PMR(x, y, Ω) soit PMR(y, x, Ω) en dessous de la valeur z´ero. Dans notre contexte de d´ecision collective avec la m´ethode de Borda, la valeur PMR(x, y, Ω), pour deux alternatives x, y ∈ X quelconques, ne d´epend pas uniquement des pr´ef´erences de nos agents concernant les alternatives x et y. En particulier, nous avons vu que la donn´ee x %N eci y pour un agent i ∈ N donn´e ne suffit pas n´ecessairement `a connaˆıtre la contribution PMRi(x, y, Ω) de cet agent. Cette derni`ere valeur d´epend en r´ealit´e de la position relative de toutes les alternatives z ∈ X par rapport aux alternatives x et y, dans le classement induit par la relation de pr´ef´erence %i de l’agent i. Nous proposons ci-apr`es deux strat´egies d’´elicitation de complexit´e diff´erente, visant `a r´eduire la valeur PMR(x, y, Ω).

Multicrit`ere-CSS0 (M-CSS0). Cette strat´egie vise `a choisir une paire (agent, question) telle que la question permette de r´eduire la contribution de l’agent `a la valeur PMR(x, y, Ω). Plus pr´ecis´ement, nous commen¸cons par s´electionner un agent i ∈ N au hasard puis nous cherchons une question permettant de diminuer la valeur PMRi(x, y, Ω) (s’il en existe) en proc´edant comme d´ecrit ci-dessous :

1) Cas o`u x %N eci y (cf. figure 4.1a) : rappelons que, dans ce cas, nous avons PMRi(x, y, Ωi) = −|Mx,y|−minωi∈Ωi|{z ∈ Z1∪Z2∪Z3∪{y} :Pq

j=1ωjixj >Pq

j=1ωijzj ≥Pq

j=1ωjiyj}|. Nous distinguons alors les deux sc´enarios suivants :

• Cas o`u Z1∪ Z2∪ Z3 = ∅ : si nous avons ¬(x N ec

i y), alors nous demandons `a l’agent i s’il pr´ef`ere strictement l’alternative x `a l’alternative y. Si en revanche x N ec

i y est vraie, alors la diff´erence de scores entre l’alternative x et y pour l’agent i vaut exactement −|Mx,y| − 1. Dans ce cas, la contribution de l’agent i `a la valeur PMR(x, y, Ω) ne peut pas diminuer, et donc il est pr´ef´erable de ne pas lui poser de question `a cette ´etape. La strat´egie M-CSS0 s´electionne alors un autre agent au hasard pour l’interroger.

• Cas o`u Z1 ∪ Z2 ∪ Z3 6= ∅ : une alternative z dans Z1∪ Z2 ∪ Z3 est choisie au hasard par la proc´edure. Par d´efinition de ces ensembles, notre connaissance actuelle sur les pr´ef´erences de l’agent i ne nous permet pas de conclure si xj i z %i y est vraie ou non. Plus pr´ecis´ement, si z ∈ Z1, alors l’in´egalit´e Pq

j=1ωijxj >Pq

j=1ωijzj est v´erifi´ee pour tout ωi ∈ Ωi mais il existe au moins un jeu de poids ωi∈ Ωi tel que Pq

j=1ωi

jzj <Pq j=1ωi

jyj. Par cons´equent, si z∈ Z1, alors M-CSS0 demande `a l’agent i s’il pr´ef`ere (faiblement) z `a y pour pouvoir obtenir l’information manquante. Similairement, si z ∈ Z2, alors l’in´egalit´e Pq

j=1ωjizj ≥ Pq

j=1ωijyj est vraie pour tout ωi ∈ Ωi mais nous avonsPq

j=1ωijzj≥Pq

j=1ωijxj pour au moins un jeu de poids ωi ∈ Ωi. De ce fait, si z ∈ Z2, alors la proc´edure demande `a l’agent i s’il pr´ef`ere strictement x `a z. Dans le cas o`u z ∈ Z3, aucune des deux in´egalit´es n’est vraie pour tous les jeux de poids ωi ∈ Ωi (sinon z appartiendrait `a Z1 ou `a Z2). Par cons´equent, nous avons ici le choix entre deux questions, demander `a l’agent i s’il pr´ef`ere (faiblement) z `a y ou lui demander s’il pr´ef`ere strictement x `

a z (le choix entre ces deux questions est ici laiss´e au hasard).

2) Cas o`u ¬(x %N eci y) ∧ (y %N eci x) (cf. figures 4.1b) : commen¸cons par rappeler que dans ce cas PMRi(x, y, Ωi) = |My,x|+maxωi∈Ωi|{z ∈ Z1∪Z2∪Z3∪{x} :Pq

j=1ωjiyj >Pq

j=1ωjizj ≥Pq

j=1ωijxj}|. Nous distinguons ici aussi les deux sc´enarios suivants :

• Cas o`u Z1∪Z2∪Z3 = ∅ : si ¬(yN ec

i x), alors nous demandons `a l’agent i s’il pr´ef`ere strictement y `a x. Par contre, si y N ec

i x `a la place, alors la diff´erence de scores entre x et y pour cet agent est forc´ement ´egale `a |My,x| + 1. Dans ce cas, M-CSS0 choisit un autre agent au hasard. • Cas o`u Z1∪ Z2∪ Z3 6= ∅ : une alternative z dans Z1∪ Z2 ∪ Z3 est choisie au hasard et nous cherchons `a savoir si y i z %i x est vraie ou non. Plus pr´ecis´ement, si z ∈ Z1, alors nous demandons `a l’agent i s’il pr´ef`ere (faiblement) z `a x. Si z ∈ Z2, alors nous lui demandons si y est strictement meilleure que z. Enfin, si z ∈ Z3, alors nous choisissons au hasard une des deux questions pr´ec´edentes.

3) Cas o`u ¬(x %N eci y) ∧ ¬(y %N eci x) (cf. figure 4.1c) : dans ce cas, les alternatives x et y sont incomparables pour le syst`eme, et donc nous demandons `a l’agent i de comparer directement ces deux alternatives pour pouvoir se ramener aux cas pr´ec´edents.

Multicrit`ere-CSS1 (M-CSS1). Cette strat´egie est une adaptation de l’heuristique propos´ee par

Lu and Boutilier [2011b] `a notre contexte de d´ecision collective avec ´evaluation multicrit`ere. L’objectif est de trouver la question avec le plus grand potentiel de r´eduction de la valeur PMR(x, y, Ω). Plus pr´ecis´ement, au lieu de s´electionner l’agent i ainsi que l’alternative z ∈ Z1∪ Z2∪ Z3 au hasard (comme dans la strat´egie M-CSS0), il s’agit ici d’envisager toutes les paires (agent, question) possibles pour pouvoir d´eterminer celle qui offre la meilleure r´eduction de la valeur PMR(x, y, Ω) dans le sc´enario de r´eponse le plus favorable. Par cons´equent, cette strat´egie n´ecessite de calculer les regrets r´esultants dans tous les sc´enarios de r´eponse possibles et ce pour chaque paire (agent, question) envisageable ; cette m´ethode incr´ementale est donc plus gourmande que la strat´egie M-CSS0.

4.1.4 R´esultats exp´erimentaux

Dans cette sous-section, nous ´evaluons la pertinence des m´ethodes interactives M-CSS0 et M-CSS1 (cf. Section 4.1.3) que nous avons propos´ees pour la d´etermination du vainqueur par la m´ethode de Borda dans un contexte de vote o`u les pr´ef´erences des agents sur les alternatives multicrit`eres sont impr´ecis´ement connues. Dans nos exp´eriences, les vecteurs de performances associ´es aux alternatives du probl`eme ont ´et´e engendr´es de mani`ere al´eatoire dans [0, 1]q. Chacune de nos simulations commence avec aucune information disponible sur les pr´ef´erences des agents. `A chaque it´eration, une question est pos´ee `

a un agent i ∈ N particulier et la r´eponse de celui-ci est simul´ee `a l’aide du jeu de poids ωi que nous avons engendr´e al´eatoirement en d´ebut de simulation. Les tests ont ´et´e r´ealis´es sur un Intel Core i7 CPU 3.60GHz avec 16GB de m´emoire et les optimisations de regrets ont ´et´e effectu´ees par le solveur Gurobi depuis un programme ´ecrit en Java.

Nos premi`eres exp´eriences ont pour objectif d’estimer l’apport d’une repr´esentation compacte des pr´ef´erences sur domaine multicrit`ere. C’est pourquoi nous avons choisi de comparer ici nos strat´egies M-CSS0 et M-CSS1 `a la proc´edure d’´elicitation incr´ementale propos´ee dans Lu and Boutilier [2011b] (nomm´ee CSS1 ci-apr`es), qui ne fait aucune hypoth`ese sur la structure des pr´ef´erences de nos agents2. Dans la figure 4.2, nous reportons les valeurs mMR(X , Ω) observ´ees aux diff´erentes it´erations de ces proc´edures d’´elicitation incr´ementale. Dans cette figure, les valeurs de regrets sont exprim´ees sur une ´echelle normalis´ee, la valeur 1 correspondant `a la valeur mMR initiale (c’est-`a-dire celle obtenue sans aucune information sur les pr´ef´erences des agents). Rappelons que lorsque la valeur mMR vaut 0, la proc´edure a en r´ealit´e identifi´e un vainqueur n´ecessaire au sens de Borda.

2. Ainsi, les strat´egies CSS1 et M-CSS1 adoptent exactement la mˆeme strat´egie de s´election de questions mais, contrai-rement `a CSS1 qui utilise uniquement les donn´ees de pr´ef´erence explicitement formul´ees par les agents, la strat´egie M-CSS1 exploite la structure multicrit`ere du probl`eme pour identifier les ensembles Z1, Z2, etc., et en d´eduire les valeurs de regrets.

Figure 4.2 – Comparaison des strat´egies d’´elicitation (30 alternatives, 5 crit`eres, 10 agents, 30 tests).

Dans la figure 4.2, nous observons que la valeur mMR diminue plus lentement avec la strat´egie CSS1 qu’avec sa version multicrit`ere M-CSS1. Par exemple, apr`es 20 questions par agent en moyenne, la valeur mMR est toujours au dessus de 40% du regret initial avec la strat´egie CSS1 alors que cette valeur est en dessous des 10% avec la strat´egie M-CSS1. Par ailleurs, apr`es environ 30 questions par agent, la valeur mMR est toujours aux alentours des 40% avec la strat´egie CSS1 alors que la strat´egie M-CSS1 est capable de d´eterminer un vainqueur n´ecessaire `a ce moment l`a. Enfin, nous constatons assez ´etonnamment que l’heuristique utilis´ee par M-CSS1 n’est finalement pas plus efficace que la strat´egie M-CSS0 qui comporte une partie al´eatoire. Par cons´equent, nous utiliserons exclusivement la strat´egie M-CSS0 dans nos exp´eriences suivantes puisque M-CSS1 requiert bien plus de calculs que M-CSS0 sans se r´ev´eler plus informative.

Dans la Section 4.1.2, nous avons montr´e comment les valeurs mMR(X , Ω) pouvaient ˆetre calcul´ees de mani`ere exacte en faisant usage de la programmation lin´eaire en nombres entiers (cf. propositions33

et 34). Rappelons que la relaxation lin´eaire des programmes en nombre entiers correspondants permet de d´eduire des bornes sup´erieures des valeurs mMR(X , Ω) en des temps plus courts. C’est pourquoi les exp´eriences suivantes ont pour objectif de quantifier la perte de pr´ecision provoqu´ee par l’utilisation de la relaxation lin´eaire de ces programmes durant l’´elicitation des pr´ef´erences. Dans la figure 4.3, nous reportons `a chaque it´eration la valeur mMR(X , Ω), la borne sup´erieure de cette valeur obtenue par relaxation lin´eaire, et le regret r´eel en terme de scores de Borda ; Les regrets sont ici aussi normalis´es, la valeur 1 correspondant `a la borne sup´erieure initiale de la valeur mMR.

Figure 4.3 – Comparaison entre la valeur mMR, sa borne sup´erieure obtenue par relaxation lin´eaire et le regret r´eel, observ´es `a chaque it´eration de la strat´egie de g´en´eration de questions M-CSS0 (30 alternatives, 5 crit`eres, 10 agents, 30 tests).

Dans la figure 4.3, nous observons que les relaxations lin´eaires fournissent en pratique une borne sup´erieure relativement proche de la valeur exacte. Cette borne devient par ailleurs de plus en plus pr´ecise au fur et `a mesure des interactions. De ce fait, il semble que travailler avec cette borne sup´erieure ne nous fait pas perdre en efficacit´e d’´elicitation. Signalons aussi que la version relax´ee permet de r´eduire significativement les temps de calculs en pratique. `A titre d’exemple, sans aucune information sur les pr´ef´erences des agents, la borne sup´erieure de la valeur mMR est obtenue en seulement 1 seconde contre 30 secondes en moyenne pour l’obtention de la valeur exacte, dans des probl`emes impliquant 30 alternatives, 5 crit`eres et 10 agents. Enfin, nous voyons sur cette mˆeme figure que le regret r´eel (ici associ´e `a la recommandation de l’alternative minimisant la valeur MR approch´ee) est en pratique relativement faible en comparaison avec la borne sup´erieure fournie par le mMR.

Les exp´eriences suivantes ont pour objectif d’´evaluer le nombre de questions produites par la strat´egie M-CSS0 (avec mMR approch´ees) sur de plus grandes instances. Plus pr´ecis´ement, nous allons faire varier le nombre d’alternatives, le nombre d’agents ainsi que le nombre de crit`eres du probl`eme. Les r´esultats que nous avons obtenus sont report´es dans la figure4.4. Dans cette figure, nous voyons que, dans tous les situations consid´er´ees, la strat´egie M-CSS0 est capable de d´eterminer un gagnant n´ecessaire au sens de Borda apr`es un nombre relativement raisonnable de questions par agent. Notons toutefois que le nombre de crit`eres semble ˆetre la donn´ee ayant le plus grand impact sur le nombre de questions engendr´ees. Ce constant s’explique par le fait que ce param`etre contrˆole directement le nombre de poids ωji `a apprendre.

(a) 10 agents, 50 alternatives et 5 crit`eres. (b) 50 agents, 50 alternatives et 5 crit`eres.

(c) 10 agents, 100 alternatives et 5 crit`eres. (d) 10 agents, 50 alternatives et 7 crit`eres.

Figure 4.4 – Performances de la strat´egie M-CSS0 appliqu´ee `a la borne sup´erieure du mMR obtenue par relaxation lin´eaire (30 tests).