Fonction de coût - Pondération des utilités marginales

Apprentissage des préférences

5.2 Pondération des utilités marginales

5.2.1 Fonction de coût

Minimiser la fonction de coût doit permettre de trouver l'utilité dont la relation de préférence induite est aussi proche que possible de la relation de préférence réelle. An de nous guider dans le choix d'une fonction de coût, nous nous appuyons sur une mesure statistique de corrélation entre variables ordinales. Nous faisons un bref rappel de deux de ces mesures dans le paragraphe suivant.

Mesures de corrélation entre deux variables ordinales

On peut considérer la relation de préférence du décideur comme une variable ordinale sur l'ensemble des alternatives. De même pour la relation induite par la fonction d'utilité que l'on veut apprendre. D'un point de vue statistique, le but de l'apprentissage est de corréler autant que possible ces deux variables ordinales. Pour évaluer cette corrélation, il existe deux mesures statistiques standard : le coecient de Spearman, habituellement noté ρ et le coecient de Kendall, noté τ. Ces deux mesures varient sur l'intervalle [−1, +1] avec la signication suivante :

-1 pour deux classement exactement inverses 0 pour des classements indépendants

+1 pour des classements parfaitement identiques

Nous présentons ici les deux coecients et expliquons pourquoi le τ de Kendall est mieux adapté à notre problème. Dans la suite, on note An = {a₁, . . . , a_n} un ensemble de n alternatives et C1 : An → {1 . . . n} et C2 : An → {1 . . . n} deux ordonnancements (i.e. permutations) sur cet ensemble.

Coecient de Spearman Le coecient de corrélation de rang de Spearman, noté ρ, se calcule de la façon suivante :

ρ = 1 − ⁶ Pn

i=1(C1(ai) − C2(ai))² n (n2− 1)

On voit que le coecient de Spearman s'intéresse à la diérence des rangs. Or dans notre problématique, nous disposons uniquement d'informations d'ordre sur

des paires d'alternatives. On ne dispose donc pas de l'information nécessaire pour utiliser cette mesure comme fonction de coût.

Coecient de Kendall Le coecient de corrélation de rang de Kendall, noté τ, s'intéresse aux couples d'alternatives diéremment ordonnées. Il se calcule de la façon suivante :

Soit la fonction Φ : An× An → {0, 1} tel que ∀a, b ∈ An Φ (a, b) = 0 si    C₁(a) ≤ C₁(b) et C₂(a) ≤ C₂(b) ou C₁(a) ≥ C₁(b) et C₂(a) ≥ C₂(b) = 1 sinon

on peut alors écrire le coecient de Kendall sous la forme :

τ = 1 − 2 · n−1 P i=1 n P j=i+1 Φ (a_i, a_j) n (n − 1)

Ce qui revient à calculer la diérence entre le nombre de couples bien ordonnés et le nombre de couples mal ordonnés, normalisée par le nombre total de couples. Ne considérant que l'information sur les couples, on voit que ce calcul se prête très bien à notre problématique. Le fait de ne posséder qu'une information partielle des relations de préférence n'est pas un problème.

C'est la mesure de référence pour construire une fonction de coût dans un pro-blème d'apprentissage d'ordonnancement basé sur des comparaisons de paires.

Nous montrons dans la suite comment cette mesure peut se traduire concrète-ment, en examinant deux fonctions de coût s'y référant.

Minimiser le nombre de contraintes violées

La manière la plus naturelle de traduire le coecient de Kendall dans une fonc-tion de coût est de chercher à minimiser le nombre de couples mal ordonnés [JLS82]. Cela peut se traduire par la résolution du problème d'optimisation linéaire mixte sui-vant, grâce à l'introduction d'une variable d'ajustement booléenne ξab par décision

(a, b) ∈ D.

minimiser : ^X

(a,b)∈D

ξ_ab

sous les contraintes :

u (a) − u (b) + m · ξ_ab ≥ δ ∀ (a, b) ∈ D ξ_ab ∈ {0, 1} ∀ (a, b) ∈ D

Où δ est un petit réel strictement positif, dont l'introduction est nécessaire pour éviter la solution triviale de tous les poids égaux à zéro [JLS82].

La constante m doit vérier m ≥ δ +1 , de sorte que, la fonction d'utilité u étant normalisée sur [0, 1], une contrainte u (a) − u (b) + m · ξab≥ 0, (a, b) ∈ D est vériée si u (a) ≥ u (b) + δ ou u (a) < u (b) + δ et ξab = 1. La fonction de coût à minimiser représente donc le nombre de contraintes violées.

Utiliser cette fonction de coût pose plusieurs problèmes. D'une part, le problème d'optimisation est linéaire mixte en nombres entiers. Sa résolution est donc assez coûteuse en temps de calcul. D'autre part, la fonction d'utilité obtenue n'est pas forcément robuste, c'est-à-dire que la garantie qu'elle reète les véritables préférences du décideur sont faibles. En terme d'apprentissage, cela signie qu'elle ne minimise pas forcément le risque réel.

Plus précisément, après résolution du problème, on se trouve dans l'une des trois situations suivantes :

1. Le cas trivial : une fonction d'utilité unique vérie toutes les contraintes. C'est la situation idéale qui, en pratique, a peu de chance d'être rencontrée.

2. Cas du problème sous-contraint : lorsqu'il existe un ensemble (généralement inni) de fonctions d'utilité, vériant toutes les contraintes induites par les décisions observées3. Dans ce cas, rien ne garantit que l'utilité sélectionnée est meilleure que les autres utilités admissibles. On parle ici du problème de la robustesse de la solution obtenue.

3. Cas du problème sur-contraint : lorsqu'il n'existe aucune fonction d'utilité permettant de satisfaire toutes les contraintes en même temps. Que ce soit à cause du bruit dans les observations, d'un espace d'hypothèses trop pauvre, ou du fait d'une approximation heuristique, cette situation peut survenir assez rapidement. Dans ce cas, on distingue deux possibilités :

(a) l'utilité minimisant le nombre de contraintes est unique, ce qui ne signie pas que c'est la meilleure en terme de généralisation.

3Dans la pratique, on retrouve par exemple cette situation au départ de l'interaction du décideur avec le système de recommandation, lorsque le nombre de décisions observées est trop faible.

(b) il existe d'autres fonctions d'utilité violant exactement le même nombre de contraintes (identiques ou non), ce qui nous ramène au cas du problème sous-contraint.

Ces raisons nous amènent à examiner, dans le paragraphe suivant, une autre fonction de coût.

Maximiser les écarts

Nous introduisons ici une fonction de coût dont la minimisation conduit à la résolution d'un problème d'optimisation linéaire. Le critère d'optimalité maximise les écarts des scores d'utilité des alternatives de chaque décision observée. Pour cela, on considère à présent les variables d'ajustement réelles positives ξab ∈ R+

, ∀ (a, b) ∈ D. Le problème d'optimisation devient :

minimiser : ^X

(a,b)∈D

ξ_ab

sous les contraintes :

u (a) − u (b) + ξ_ab ≥ δ ∀ (a, b) ∈ D ξab ∈ R+

∀ (a, b) ∈ D

Comme u (a) − u (b) ∈ [−1, 1] on pose généralement δ = 1, qui est la borne inférieure des valeurs de δ permettant de prendre en compte l'ajustement de toutes les contraintes du problème, quelle que soit la valeur du terme u (a) − u (b).

Utiliser cette fonction de coût permet d'améliorer grandement le temps de calcul de la résolution. Cependant, le problème de la robustesse de l'utilité obtenue est tou-jours posé. D'une part, on peut se retrouver dans le cas du problème sous-contraint où plusieurs fonctions d'utilité ont un même score de zéro, avec la même absence de garantie sur la minimisation du risque réel de l'utilité sélectionnée. D'autre part, le cas où l'utilité optimale est unique est également à considérer. En eet, la résolu-tion de ce problème d'optimisarésolu-tion ne donne qu'une solurésolu-tion approchée au sens de la minimisation du coecient de Kendall. Par conséquent une solution présentant un score un peu moins bon peut s'avérer nalement mieux corrélée aux préférences réelles du décideur.

Ce problème a été abordé de diérentes manières par les communautés de l'ana-lyse multicritère et de l'apprentissage articiel ; mais les deux s'accordent pour sou-ligner son importance fondamentale.

1. l'agrégation de plusieurs utilités potentiellement intéressantes 2. l'ajout d'un critère supplémentaire de sélection de l'utilité optimale Ces deux types d'approches sont examinés dans les sections suivantes.

Dans le document Modélisation et apprentissage des préférences appliqués à la recommandation dans les systèmes d'impression (Page 127-131)