• Aucun résultat trouvé

1.4 Elicitation des pr´ ´ ef´ erences

1.4.1 Un aper¸cu des approches standards

a d´eterminer. Le d´ecideur nous informe que le premier crit`ere est approximativement deux fois plus important que le second crit`ere. Consid´erons alors le vecteur de poids ω = (2/3 + ε, 1/3 − ε), o`u ε est une valeur arbitrairement proche de z´ero. Avec ce vecteur de poids, nous obtenons SP(a, ω) = 50/3 − 20ε et SP(b, ω) = 50/3 + 10ε. Les deux alternatives sont donc ´equivalentes si ε = 0. Cependant, pour tout ε < 0 arbitrairement proche de z´ero, la solution a est strictement meilleure que la solution b, tandis que le contraire se produit avec ε > 0 arbitrairement proche de z´ero. Ainsi, une petite variation du vecteur de poids ω conduit ici `a une d´ecision diff´erente. Par cons´equent, dans cette situation d´ecisionnelle, il semble n´ecessaire de recueillir davantage d’informations sur les pr´ef´erences du d´ecideur avant de formuler une quelconque recommandation.

Cet exemple illustre le fait que l’´elicitation des param`etres d’un mod`ele d´ecisionnel est une tˆache d´elicate en soi, qui n´ecessite des m´ethodes automatiques permettant de produire une mod´elisation pr´ecise, en collectant des informations pertinentes sur les pr´ef´erences du d´ecideur. L’´elicitation des pr´ef´erences est en r´ealit´e une tˆache cruciale dans de nombreuses applications comme le marketing personnalis´e, le commerce ´electronique et les syst`emes de recommandation (citons par exemple Deezer pour les musiques et Netflix pour les vid´eos). Dans cette section, nous commen¸cons par pr´esenter bri`evement les approches classiques pour la probl´ematique de l’´elicitation des pr´ef´erences (cf. Section 1.4.1), avant de centrer la pr´esentation sur l’´elicitation incr´ementale fond´ee sur le concept de Minimax Regret (cf. Section 1.4.2), cette derni`ere approche constituant l’angle d’attaque principal de cette th`ese.

1.4.1 Un aper¸cu des approches standards

Dans cette sous-section, nous discutons bri`evement des avantages et des inconv´enients des approches standards pour la probl´ematique de l’´elicitation des pr´ef´erences.

´

Elicitation totale d’une fonction d’utilit´e

En pratique, l’ensemble des alternatives possibles est souvent dot´e d’une structure multidimension-nelle, les alternatives ´etant g´en´eralement ´evalu´ees selon plusieurs points de vue simultan´ement. Dans ce cas, chaque alternative est associ´ee `a un point dans un espace multi-attributs. L’approche classique en ´elicitation des pr´ef´erences vise `a d´eterminer le mod`ele de pr´ef´erences du d´ecideur sur tout l’espace multi-attributs, point par point, `a l’aide d’une s´erie de questions-r´eponses (e.g., [Fishburn, 1967,Krantz et al., 1971,Keeney and Raiffa, 1976]). Ce mod`ele, apr`es avoir ´et´e construit par des interactions avec le d´ecideur, peut ensuite ˆetre utilis´e pour formuler une recommandation personnalis´ee : l’alternative optimale au sens de ce mod`ele constitue la meilleure option pour le d´ecideur. Une fois construit, ce mod`ele peut aussi servir `

a ordonner toutes les alternatives. Cette possibilit´e est particuli`erement int´eressante lorsque le d´ecideur souhaite retenir plusieurs options ou bien lorsque celui-ci a besoin de produire un classement complet de

toutes les alternatives. Par ailleurs, le mod`ele obtenu peut aussi ˆetre exploit´e plus tard, pour r´esoudre de nouvelles instances du mˆeme probl`eme de d´ecision ; `a titre d’exemple, on peut penser `a l’ajout de nouveaux films dans la base de donn´ees d’un syst`eme de recommandation de vid´eos.

N´eanmoins, cette approche est difficile `a mettre en œuvre sur domaine combinatoire, car celle-ci devient tr`es rapidement coˆuteuse en nombre de questions. Par exemple, en d´ecision multicrit`ere, le nombre de solutions croˆıt exponentiellement avec le nombre de crit`eres consid´er´es dans le probl`eme. De ce fait, apprendre la fonction d’utilit´e du d´ecideur point par point dans le cadre de la d´ecision multicrit`ere ne semble pas ˆetre une option envisageable en pratique (sauf peut-ˆetre pour des mod`eles d´ecisionnels d´ecomposables tr`es simples). En effet, dans ces situations, il n’est pas raisonnable de penser que le d´ecideur accepte de passer des journ´ees enti`eres `a r´epondre `a un questionnaire lui permettant de prendre une d´ecision finale (`a moins que l’enjeu de la d´ecision soit d’une importance critique). Par ailleurs, cette approche n’est g´en´eralement pas `a l’abri de r´eponses contradictoires ou biais´ees (e.g., [Simon, 1955,

Tversky and Kahneman, 1975,Camerer et al., 2003]), ce qui constitue une autre difficult´e.

Optimisation interactive

L’optimisation interactive est une approche tr`es largement ´etudi´ee en d´ecision multicrit`ere, qui permet de diriger l’exploration de l’ensemble des solutions Pareto-optimales en fonction des diff´erentes interac-tions avec le d´ecideur, sans jamais avoir `a ´enum´erer toutes ces solutions (e.g., [Zionts and Wallenius, 1976,

Vanderpooten, 1989, Vanderpooten and Vincke, 1997, Miettinen, 1999, Korhonen, 2005, Greco et al., 2016]). Cette approche repose g´en´eralement sur l’utilisation d’une fonction d’agr´egation param´etr´ee dont le rˆole est de v´ehiculer les informations que le syst`eme a recueillies sur les pr´ef´erences du d´ecideur. Les fonctions d’agr´egation majoritairement utilis´ees sont la somme pond´er´ee, la norme de Tchebycheff ou encore des fonctions fond´ees sur un niveau d’aspiration (e.g., [Wierzbicki, 1986]). L’id´ee g´en´erale est d’alterner les deux ´etapes suivantes :

• Calcul : ´evaluation des solutions en utilisant une instance possible des param`etres pr´ef´erentiels. • Dialogue : pr´esentation d’un ensemble de solutions au d´ecideur, choisies soigneusement par le

syst`eme, pour que le d´ecideur lui transmette de nouvelles informations sur ses pr´ef´erences. Le processus d’´elicitation s’arrˆete d`es que le d´ecideur rencontre une solution qui lui convient. Les diff´erentes m´ethodes d’optimisation interactive se distinguent les unes des autres notamment par le type de pr´ef´erences que le d´ecideur peut exprimer. Par exemple, le d´ecideur peut sp´ecifier la solution qu’il pr´ef`ere parmi un ensemble (e.g., [Zionts and Wallenius, 1976,Steuer, 1986]) ou encore pr´eciser sur quels crit`eres il est prˆet `a faire des concessions pour am´eliorer les performances r´ealis´ees sur d’autres crit`eres (e.g., [Benayoun et al., 1971]).

Cette approche relativement g´en´erique permet de traiter tout probl`eme d’optimisation combinatoire multicrit`ere pourvu qu’il existe un algorithme de r´esolution efficace avec param`etres pr´ef´erentiels pr´ecis. En effet, pour les autres probl`emes, le temps d’attente entre chaque ´evaluation risque de conduire le d´ecideur `a interrompre les interactions. Par ailleurs, cette approche pr´esente l’avantage de pouvoir s’ac-compagner d’une interface graphique (e.g., [Korhonen and Laakso, 1986,Lewandowski and Granat, 1991,

Klimberg, 1992]), permettant au d´ecideur de visualiser les solutions possibles durant l’exploration et de le conforter (ou pas) dans ses choix. Cependant, les m´ethodes d’optimisation interactive ne permettent g´en´eralement pas de garantir que la solution finale constitue r´eellement la meilleure alternative possible pour le d´ecideur. En effet, la valeur finale des param`etres ne repr´esente pas n´ecessairement au mieux les pr´ef´erences du d´ecideur, ce dernier ayant pu choisir d’interrompre le processus d’´elicitation par lassitude apr`es avoir d´etect´e une alternative qu’il estime relativement satisfaisante. Enfin, soulignons le fait que de nouvelles interactions avec le d´ecideur peuvent ˆetre requises pour r´esoudre d’autres instances du mˆeme probl`eme (par exemple, suite `a l’ajout de nouvelles alternatives dans la base de recommandation).

Apprentissage `a partir d’une base de donn´ees

Dans la litt´erature, on retrouve aussi des m´ethodes qui consid`erent en entr´ee une base de donn´ees contenant des informations sur les pr´ef´erences du d´ecideur, et qui visent `a d´eterminer les param`etres du mod`ele qui permettent d’expliquer au mieux cette base de donn´ees. Par exemple, la m´ethode UTA ap-prend une fonction d’utilit´e additive par programmation lin´eaire `a partir d’une base de donn´ees contenant des informations ordinales (e.g., [Jacquet-Lagr`eze and Siskos, 1982, Siskos and Yannacopoulos, 1985]). Ces m´ethodes peuvent se distinguer les unes des autres par la nature des donn´ees exploit´ees. `A titre d’exemple, le d´ecideur peut ˆetre amen´e `a exprimer ses pr´ef´erences sur un petit ensemble d’alternatives (fictives ou non), de pr´eciser si certains crit`eres sont plus importants que d’autres, voire mˆeme d’accom-pagner ces informations d’intensit´es de pr´ef´erences. Ces donn´ees collect´ees sont ensuite utilis´ees pour contraindre le mod`ele d´ecisionnel de sorte `a respecter le plus possible ces pr´ef´erences observ´ees. La plu-part de ces m´ethodes se pr´esentent alors sous la forme de probl`emes d’optimisation sous contraintes. Par exemple, il a ´et´e propos´e de minimiser des erreurs d’utilit´e (e.g., [Jacquet-Lagr`eze and Siskos, 1982,

Sobrie et al., 2017a]) ou encore de minimiser un crit`ere d’erreur quadratique (e.g., [Murofushi and Mori, 1989,Grabisch et al., 1995,Meyer and Roubens, 2006,2005]) `a la mani`ere des m´ethodes classiques uti-lis´ees en apprentissage automatique. La fonction `a optimiser peut aussi servir `a discriminer entre les diff´erents param`etres compatibles avec la base de donn´ees. En effet, nous pouvons par exemple chercher `

a maximiser les ´ecarts de performance entre des solutions dont le classement relatif est connu (e.g., [Marichal and Roubens, 2000, Beuthe and Scannella, 2001, Grabisch et al., 2008]), `a minimiser la va-riance du mod`ele pour ˆetre le moins sp´ecifique possible (e.g., [Kojadinovic, 2007]) ou encore `a minimiser une entropie relative pour tenir compte des erreurs ´eventuelles dans la base (e.g., [Bous and Pirlot, 2013]). Signalons que certains logiciels d’optimisation mettent actuellement en œuvre ces techniques d’´elicitation (e.g., [Marichal et al., 2005,Hu´ed´e et al., 2006,Grabisch et al., 2008]).

L’int´erˆet principal de cette approche est que le processus d’´elicitation ne d´epend pas des alternatives du probl`eme. Ceci permet notamment de r´esoudre des probl`emes d’optimisation combinatoire apr`es avoir d´etermin´e les param`etres du mod`ele qu’il convient d’utiliser. Par ailleurs, une fois le mod`ele de pr´ef´erence construit, celui-ci peut ˆetre exploit´e pour r´esoudre de nouvelles instances du mˆeme probl`eme de d´ecision, sans n´ecessiter d’interactions suppl´ementaires. Il est toutefois important de souligner que l’efficacit´e de l’approche est fortement impact´ee par la qualit´e de la base de donn´ees : plus celle-ci est riche, mieux les

pr´ef´erences sont approch´ees. Cette observation sugg`ere de construire le mod`ele de pr´ef´erence apr`es avoir collect´e le plus de donn´ees possibles sur les pr´ef´erences du d´ecideur. Cependant, plus la taille de la base de donn´ees augmente, plus le risque de rencontrer des incoh´erences est ´elev´e. De ce fait, un syst`eme de gestion des incoh´erences est tr`es souvent indispensable en pratique pour pouvoir d´eterminer au moins une instance des param`etres compatible avec les pr´ef´erences observ´ees. De mani`ere g´en´erale, obtenir une base de donn´ees de qualit´e est une tˆache relativement difficile car le nombre d’interactions possibles avec le d´ecideur est g´en´eralement limit´e. Une autre faiblesse de cette approche r´eside dans le choix de la fonction `a optimiser (e.g., erreur quadratique, variance) qui semble parfois relativement arbitraire. Ce dernier fait a d’ailleurs conduit des chercheurs en aide `a la d´ecision `a travailler avec toutes les instances des param`etres compatibles avec les informations contenues dans la base de donn´ees (e.g., [Greco et al., 2010c,Angilella et al., 2010,Greco et al., 2014]). Soulignons toutefois que la prise en compte simultan´ee de plusieurs instances peut entraˆıner des situations d’ind´ecision, lorsque les recommandations changent en fonction de l’instance consid´er´ee.

Approche bay´esienne

Lorsque l’incertitude sur la fonction d’utilit´e du d´ecideur est quantifi´ee `a l’aide d’une distribution de probabilit´e a priori, le crit`ere de l’esp´erance d’utilit´e peut ˆetre utilis´e pour ´evaluer les diff´erentes alternatives du probl`eme. Cette distribution de probabilit´e peut par exemple avoir ´et´e obtenue `a partir de donn´ees disponibles sur des personnes ayant des goˆuts relativement similaires `a ceux du d´ecideur. Sans aucune autre information sur les pr´ef´erences du d´ecideur, il semble raisonnable de lui recommander l’alternative qui maximise l’esp´erance d’utilit´e a priori. Si en revanche des interactions avec le d´ecideur sont possibles, nous pouvons envisager de lui poser des questions afin de mettre `a jour cette distribution de probabilit´e en fonction de ses propres pr´ef´erences ; une question est g´en´eralement consid´er´ee comme informative si, en esp´erance, la r´eponse du d´ecideur conduit `a une augmentation de l’esp´erance d’utilit´e maximale. Une strat´egie d’´elicitation possible consiste `a poser progressivement des questions au d´ecideur de mani`ere `a am´eliorer l’esp´erance d’utilit´e maximale jusqu’`a satisfaire un certain crit`ere d’arrˆet (e.g., [Chajewska et al., 2000,Braziunas and Boutilier, 2006, Viappiani and Boutilier, 2010]). Afin de limiter le nombre d’interactions avec le d´ecideur, il convient bien ´evidemment de choisir, `a chaque it´eration, la question offrant la meilleure am´elioration en esp´erance. L’´evaluation d’une question devrait en th´eorie ˆetre r´ealis´ee de mani`ere s´equentielle, en consid´erant toutes les futures questions et r´eponses possibles (e.g., [Boutilier, 2002]). Cependant, pour r´eduire les temps de calcul, cette ´evaluation est souvent effectu´ee de fa¸con “myope” en pratique, autrement dit en comparant uniquement la valeur de l’esp´erance d’utilit´e maximale avant et apr`es avoir pos´e la question.

Dans de nombreux travaux, il a ´et´e observ´e que l’approche bay´esienne permet de formuler une recommandation pertinente et personnalis´ee en posant relativement peu de questions au d´ecideur en pratique (e.g., [Chajewska et al., 2000,Viappiani and Boutilier, 2010]). Par ailleurs, cette approche peut aussi ˆetre utilis´ee pour r´esoudre des probl`emes d’optimisation combinatoire, `a condition de pouvoir calculer efficacement l’esp´erance d’utilit´e maximale sur l’espace des solutions. Remarquons toutefois que

ces m´ethodes n´ecessitent de connaˆıtre la distribution de probabilit´e a priori sur les fonctions d’utilit´e, ce qui n’est pas toujours r´ealisable en pratique. En particulier, cela semble difficile dans le cadre d’une prise de d´ecision impr´evue ou sp´ecifique au d´ecideur. Enfin, une autre faiblesse de cette approche provient des crit`eres de d´ecision utilis´es qui sont g´en´eralement difficiles `a optimiser en soi (e.g., maximiser l’esp´erance d’utilit´e, minimiser l’esp´erance de perte) et qui sont par cons´equent tr`es souvent approxim´es en pratique (e.g., `a l’aide de m´ethodes de Monte-Carlo).