• Aucun résultat trouvé

4.2 M´ethodes d’agr´egation

4.2.3 Optimisation par m´ethode ´evolutionniste

Bien que n’´etant pas une m´ethode d’agr´egation, je vais bri`evement pr´esenter le fonctionnement g´en´eral des m´ethodes ´evolutionnistes d’opti- misations. Dans le cadre de ce travail, ce type de m´ethode sera employ´e pour optimiser les coefficients d’une moyenne pond´er´ee.

Cette technique d’optimisation est une m´etaheuristique ayant pour ob- jectif d’approcher la solution `a un probl`eme d’optimisation en un temps raisonnable quand ceci n’est pas possible par des m´ethodes exactes. Cette strat´egie proc`ede par analogie avec la s´election naturelle. Ainsi, les solu- tions (e.g. des jeux de coefficients de moyenne pond´er´ee) sont repr´esent´es par des individus poss´edant des g`enes (e.g. un coefficient) formant un chro- mosome (une suite ordonn´ee de g`enes). Ces individus sont amen´es `a ´evoluer puis `a ˆetre s´electionn´es en fonction d’une mesure d’adaptation. Les indi- vidus qui subissent ce cycle ´evolution-s´election forment une ”g´en´eration”. On construit ainsi un grand nombre de g´en´erations successives qui sont sens´ees s’approcher de plus en plus de la solution.

Plus pr´ecis´ement, on commence par initialiser au hasard un certain nombre d’individus (e.g. tirer au hasard des jeux de coefficients) qui formeront la premi`ere g´en´eration et sera soumise `a un premier cycle ´evolution-s´election.

Lors des cycles, chaque g`ene a une certaine probabilit´e de subir un ”´ev´enement ´evolutif”. Classiquement les deux ´ev´enements ´evolutifs utilis´es sont la mu- tation et la recombinaison. La mutation est une modification al´eatoire d’un g`ene (e.g. tirage au hasard d’un nouveau coefficient). La recombinaison est la r´eassociation des g`enes de deux chromosomes d’individus diff´erents. Les chromosomes sont scind´es en deux al´eatoirement et chaque partie est r´eassembl´ee avec une partie du chromosome partenaire.

Une fois cette phase d’´evolution effectu´ee, les individus subissent une phase de s´election. La mesure d’adaptation (e.g. le score ROC du classement des candidats apr`es agr´egation), est utilis´ee pour ne conserver qu’un nombre n d’individus destin´es `a passer `a la g´en´eration suivante. Cette s´election peut s’op´erer de plusieurs fa¸cons :

– par rang, i.e. les n meilleurs individus sont s´electionn´es

– au hasard, i.e. n individus sont tir´e au hasard pour devenir la g´en´eration suivante

– par tournois, i.e. k g`enes sont tir´es aux hasard et les p plus adapt´es du point de vue du crit`ere de s´election sont retenus

– par ”roulette” i.e. on tire au hasard sur une ”roue de la fortune” les individus `a conserver, sachant que chaque individu est repr´esent´e proportionnellement `a son adaptation et donc qu’il a d’autant plus de chances d’ˆetre s´electionn´e qu’il est adapt´e.

Actuellement, les modes de s´election par tournois et par roulette sont les plus pris´es. On peut s’´etonner que le mode de s´election par rang, o`u le hasard n’intervient pas, ne soit pas favoris´e d’autant qu’il semble le plus efficace pour atteindre un optimum. La raison est que, comme dans la na- ture, il est plus int´eressant de maintenir une certaine diversit´e, y compris en gardant des individus moins bien adapt´es, pour augmenter les possibi- lit´es d’´evolution de la population. Ceci permet d’atteindre l’optimum en ´evitant des solutions sous-optimales.

L’algorithme peut s’arrˆeter sous plusieurs conditions : soit lorsqu’il converge, i.e. que l’adaptation moyenne de la population n’´evolue plus, soit apr`es un

4.2. M ´ETHODES D’AGR ´EGATION 157

nombre d´etermin´e d’it´erations, soit apr`es qu’un individu ait atteint une valeur pr´ed´etermin´ee (e.g. un score ROC de 0.95). Le g`ene le plus adapt´e, e.g. les coefficients obtenant la meilleure agr´egation, est alors s´electionn´e comme solution. La figure 4.3 illustre les diff´erentes ´etapes d’un algorithme g´en´etique.

Fig. 4.3 – Sch´ema d’un algorithme g´en´etique

M´etaSVM

L’id´ee d’un op´erateur d’agr´egation bas´e sur un SVM est assez intuitive. En utilisant comme caract´eristique les scores obtenus par des classifieurs, on peut construire un classifieur qui discriminerait les n´egatifs des posi- tifs en tra¸cant une fronti`ere entre les vecteurs de scores des classifieurs individuels. Les SVM ont ´et´e plus amplement d´ecrits en 2.2 (p 83). Dans le cas d’un m´etaSVM, le vecteur est constitu´e des probabilit´es d’apparte- nance `a la classe des cytokines du candidat pour chaque classifieur. Il est donc d’une taille ´egale au nombre de classifieurs. La figure 4.4 sch´ematise le fonctionnement d’un m´etaSVM. Cette m´ethode pr´esente tous les avantages des SVM en terme de capacit´e de s´election des dimensions et des donn´ees int´eressantes (les vecteur-support), ainsi qu’en terme de g´en´eralisation.

Fig. 4.4 – Fonctionnement g´en´eral d’un m´etaSVM : les scores des classifieurs sont utilis´es comme composante du vecteur du m´etaSVM qui renvoie lui-mˆeme un score sous forme d’une probabilit´e d’appartenance `a la classe d’int´erˆet

Comme tout SVM, le m´etaSVM peut renvoyer une probabilit´e d’appar- tenance `a la classe, utilisable pour ordonner les candidats.

Int´egrale de Choquet

D´evelopp´ee par le math´ematicien Gustave Choquet dans les ann´ees 50, l’int´egrale de Choquet est un op´erateur d’agr´egation peu connu mais ayant d´ej`a fait ses preuves dans le domaine de la d´ecision multicrit`ere. Une des- cription plus pr´ecise de cette m´ethode est pr´esent´ee dans les r´ef´erences suivantes : [38] et [19]. L’int´egrale de Choquet est bas´ee sur le principe de capacit´e, qui peut ˆetre vu comme une g´en´eralisation de la notion de vecteur de poids [38]. La capacit´e se d´efinie de la fa¸con suivante : soit N un ensemble de crit`eres N = 1, . . . , n la fonction µ : P (N ) → R est une capacit´e si

µ(∅) = 0, µ(N ) = 1; ∀S, T ⊆ N, T ⊆ S ⇒ µ(T ) ≤ µ(S)

µ(S) et µ(T ) peuvent ˆetre consid´er´es comme les poids des sous-ensembles de N , S et T respectivement. En utilisant cette d´efinition de la capacit´e, on

4.2. M ´ETHODES D’AGR ´EGATION 159

calcule l’int´egrale de Choquet de X = 1 . . . , n, ∈ Rn de la fa¸con suivante :

Cµ(X) = n

X

i=1

Xσ(i)[µ(Aσ(i)) − µ(Aσ(i + 1))]

o`u σ est une permutation sur N telle que Xσ(1) < Xσ(n) et

Aσ(i) = σ(i), . . . , σ(n), ∀i ∈ N, Aσ(n + 1) = ∅

Il y a plusieurs degr´es de complexit´e `a l’int´egrale de Choquet. A son niveau le plus simple, l’int´egrale de Choquet revient `a une moyenne pond´er´ee. A des degr´es plus ´elev´es, elle peut prendre en compte certaines propri´et´es des crit`eres telles que :

– la redondance des crit`eres,

– l’interaction entre crit`eres i.e. des crit`eres dont les valeurs croissent et d´ecroissent dans le mˆeme sens ou dans des sens oppos´es,

– les pref´erences du d´ecideur.

qui sont ignor´es par des op´erateurs plus classiques tels que la moyenne arithm´etique. Concernant les pr´ef´erences du d´ecideur, il est possible de les mod´eliser via une fonction d’utilit´e telle que

x ≺ y ⇔ U (x) ≤ U (y)∀x, y ∈ X

O`u X r´epr´esentent l’ensemble des crit`eres (notes, scores . . .) du d´ecideur, x et y deux crit`eres et U (x) et U (y) les fonctions d’utilit´e des crit`eres x et y respectivement. On dit que si x est pr´ef´er´e `a y (x ≺ y) alors U (x) sera sup´erieur `a U (y).

On d´etermine alors la capacit´e par optimisation sous contrainte [51] des fonctions d’utilit´e. Cette phase utilise un jeu ”d’apprentissage” sur lequel l’optimisation est op´er´ee. Le calcul de l’int´egrale de Choquet est alors ef- fectu´e en tenant compte de la capacit´e et retourne un score qui permet d’ordonner les candidats.

de Choquet sont particuli`erement int´eressantes. La premi`ere est la gestion de la redondance entre les crit`eres. Parmi les classifieurs, deux d’entre eux se basent sur la composition en acides amin´es de la s´equence candidate et les trois autres sur des scores de similarit´e. On sait, par le calcul des taux de Kendall (2.6.3 et 3.4.4), que les classifieurs pr´esentent une certaine corr´elation, la capacit´e de l’int´egrale de Choquet `a ´evaluer et limiter cette redondance est donc ici tr`es int´eressante.

La possibilit´e de tenir compte des interactions entre crit`eres apporte ´egalement un plus car cette derni`ere n’a pas ´et´e ´evalu´ee chez les classifieurs et les ex- perts or il est possible que de telles relations existent, par exemple entre la similarit´e de s´equences et la similarit´e de structures.

L’int´egrale de Choquet s’av`ere donc un outil performant, disposant de pro- pri´et´es int´eressantes dans le traitement des crit`eres, particuli`erement en ce qui concerne leur possible biais.