Bien que nous ne soyons pas soumis aux contraintes biologiques limitant ` a deux le nombre d’individus participant ` a un croisement, nous avons choisi des op´erateurs de croisement utilisant

a des solutions partielles optimales et de les associer, par le jeu des croisements entre individus,

afin de constituer des solutions compl`etes optimales. Un bon codage doit donc encourager la

formation de BB en veillant à ce que les gènes qui contribuent de manière jointe à la maximisation

de la fonction de performance soient proches les uns des autres au sein du g´enome. Cela doit

permettre de les identifier et de les r´eassocier plus efficacement, le risque lors d’un croisement

´etant de ₍₍casser₎₎des BB. Cela arrive lorsque seule une fraction des g`enes virtuels composant

une BB est échangée entre deux individus parents. Dans les problèmes d’optimisation complexes,

il arrive cependant que les interactions entre g`enes virtuels soient `a la fois trop nombreuses et

trop importantes pour qu’il soit possible de ranger les gènes virtuels correspondant côte à côte

au sein d’un chromosome.

5.1.3.2 Mutation

L’op´erateur de mutation modifie al´eatoirement un individu pour en former un autre qui le

remplacera. La plupart des mutations modifient un individu de telle fa¸con que le r´esultat de la

transformation lui soit proche. De cette fa¸con, l’op´erateur assure une recherche locale al´eatoire

autour de chaque individu. Dans cet ordre d’idée, la mutation peut améliorer considérablement

la qualit´e des solutions d´ecouvertes. En effet, le croisement perd de son importance lorsqu’une

grande partie de la population est localis´ee dans les voisinages des maxima de la fonction de

performance. Dans ce cas, les individus situ´es sur un mˆeme maximum sont souvent identiques

par le jeu de la reproduction et ne subissent aucune modification, ou alors, s’ils appartiennent

`

a des maxima différents, les descendants montreront généralement de faibles performances. En

revanche, la recherche al´eatoire locale due aux mutations donne une chance `a chaque individu

de s’approcher des positions exactes des maxima.

La mutation avec un taux suffisamment élevé participe au maintien de la diversité utile à une

bonne exploration de l’espace de recherche. Cet op´erateur peut combattre les effets n´egatifs d’une

forte pression de sélection ou d’une forte dérive génétique, phénomènes qui tendent à réduire la

variance de la distribution des individus dans l’espace de recherche.

Si le taux de mutation est trop ´elev´e et que la mutation est si forte que l’individu produit

est quasiment indépendant de celui qui l’a engendré, l’évolution des individus de la population

équivaut à une marche aléatoire dans l’espace de recherche et l’algorithme évolutionnaire mettra

un temps excessif pour converger.

Classiquement, l’op´erateur de mutation sur des chaˆınes binaires modifie al´eatoirement les

symboles d’un génotype avec une faible probabilité, typiquement de 0,1 à 0,001 par individu,

égale au taux de mutation. Il existe plusieurs variétés de mutations. L’une des plus classiques est

la mutation bit-flip avec laquelle chaque bit peut ˆetre invers´e (un 1 devient un 0 et vice versa)

indépendamment des autres avec une faible probabilité. Si le taux de mutation est trop élevé

avec un grand nombre de bits mut´es par individu, l’´evolution des individus de la population

équivaut à une marche au hasard dans l’espace de recherche et l’algorithme génétique perd son

efficacit´e.

5.1.3.3 Croisement

Bien que nous ne soyons pas soumis aux contraintes biologiques limitant `a deux le nombre

d’individus participant `a un croisement, nous avons choisi des op´erateurs de croisement utilisant

deux parents pour former deux descendants. Un opérateur de croisement est généralement

sto-chastique dans la mesure où le croisement répété d’un même couple de parents distincts donnera

119 Troisième partie Apprentissage évolutionnaire des réseaux Bayésiens

A1 A2 A3 A4 A5 A6 A7 A8 A9 B4 B5 B6 B7 B8 B9 A4 A5 A6 A7 A8 A9

enfants parents enfants

Recombinaison Recombinaison un point uniforme Chromosomes Chromosomes Chromosomes A1 A2 A1 A3 A6 A7 A8 A2 A4 A5 A9 B9 B8 B7 B6 B4 B3 B2 B1 B1 B2 B3 A3 B2 B4 B5 B9 B8 B7 B6 B3 B1 B5

Fig. 5.1 – Exemple de recombinaison uniforme et un point.

des descendants différents. Il respecte généralement les propriétés suivantes :

– le croisement de deux parents identiques donnera des descendants identiques aux parents ;

– par extension, un indice de proximité dépendant de la représentation choisie étant défini

dans l’espace de recherche, deux parents proches l’un de l’autre dans l’espace de recherche

engendreront des descendants qui leur seront proches.

Pour une repr´esentation binaire ou discr`ete, il existe trois variantes de croisement classiques

respectant les propriétés énoncées ci-dessus :

– le croisement un point;

– le croisement deux points;

– le croisement uniforme.

Les croisements un point et deux points Après avoir sélectionné un couple d’individus

au sein de la population, le croisement un point se d´eroule en deux ´etapes :

– choix al´eatoire d’un point de coupure identique sur les deux chaˆınes binaires ;

– coupure des deux chaˆınes et ´echange des deux fragments situ´es au-dessous.

Ce processus produit deux descendants `a partir de deux parents. Le croisement un point est le

plus simple et le plus classique pour des codages utilisant un alphabet `a faible cardinalit´e comme

le codage binaire. Une généralisation immédiate de cet opérateur consiste à multiplier les points

de coupure sur chaque chaˆıne. Pour C points de coupure, on produit ainsi C+ 1 sous-chaˆınes,

la moitié d’entre elles étant échangées entre les deux parents. Par exemple, pour un croisement

4 points, on produit 5 fragments de chromosome et on échange la deuxième et la quatrième

sous-chaˆıne.

En pratique, les croisements un point et deux points sont couramment employ´es pour leur

simplicit´e et leur bonne efficacit´e. Selon de Jong [DJ75], le croisement deux points constitue

une am´elioration notable du croisement un point. Dans le mˆeme temps, il avance que le fait

d’augmenter le nombre de points de cassure diminue les performances de l’algorithme. Une

explication à ce phénomène est que l’augmentation du nombre de points de coupure augmente

la probabilit´e de casser des briques de base. Pour leur part, les tests que nous avons effectu´es

n’ont montr´e aucune diff´erence significative entre les croisements un point et deux points. C’est

pourquoi par la suite, nous n’´evoquons que le croisement un point, le croisement deux points

nous ´etant apparu comme redondant.

Algorithmes ´evolutionnaires pour l’apprentissage de structure Chapitre 5

Le croisement uniforme Le croisement uniforme peut ˆetre vu comme un croisement

multi-points dont le nombre de coupures est ind´etermin´ea priori. Pratiquement, on utilise un masque

de croisement, qui est un mot binaire de mˆeme longueur que les individus. Un 0 `a lan

position

du masque laisse inchang´es les symboles `a la n

position des deux chaˆınes. Un 1 d´eclenche

un échange des symboles correspondants. Le masque est engendré aléatoirement pour chaque

couple d’individus. Les valeurs 0 ou 1 des éléments du masque sont généralement tirées avec une

probabilit´e 0,5.

Il est difficile d’argumenter en faveur de l’une ou de l’autre des m´ethodes de recombinaison

que nous venons de pr´esenter [ECS89]. Selon Syswerda [Sys89], la recombinaison uniforme est

plus efficace, notamment parce qu’elle est moins d´ependante que les recombinaisons un ou deux

points de la structure des chromosomes. En effet, les performances de ces deux m´ethodes chutent

considérablement lorsque les recommandations que nous avons énoncées concernant les BB ne

sont pas respectées [BBM93]. À l’inverse, la recombinaison uniforme continue à bien se

compor-ter. Bien qu’ils estiment que les recombinaisons un et deux points sont optimales, Spears et de

Jong [SD91] remarquent que ces dernières ne parviennent plus à générer de nouvelles solutions

candidates — et donc `a ´echantillonner de nouveaux points dans l’espace de recherche — lorsque

l’algorithme converge. La recombinaison uniforme semble plus `a mˆeme de produire des nouvelles

solutions `a partir de parents similaires. Toujours selon Spears et de Jong [JS91], la recombinaison

deux points est la plus efficace pour de grandes populations mais la recombinaison uniforme est

plus indiquée quand la taille de la population est faible par rapport à la complexité du problème.

5.2 Un algorithme évolutionnaire pour les réseaux Bayésiens

Nous présentons à présent les différents éléments que nous avons souhaité utiliser pour

élaborer notre algorithme évolutionnaire. Nous présentons les méthodes de sélection retenues

ainsi que les réprésentations et les méthodes de recombinaison que nous testons dans le chapitre

suivant. Enfin, nous introduisons les méthodes de spéciation qui nous semblent être un point

fondamental dans la construction d’un algorithme ´evolutionnaire. Pour finir, nous r´ecapitulons

nos choix et nous pr´esentons une vue d’ensemble de l’algorithme que nous allons utiliser.

5.2.1 Op´erateurs de s´election

Dans ces travaux, les individus participant `a la reproduction sont choisis al´eatoirement.

Cela permet de laisser libre cours à l’algorithme pour recombiner des individus très différents,

qui peuvent avoir des écarts de performance importants, afin de produire une grande variété

de solutions candidates. Il est cependant n´ecessaire d’assurer un biais en faveur des meilleures

solutions à l’issue de chaque génération. Nous appliquons donc la sélection lors de la phase

de remplacement. Pour cela, nous avons considéré une stratégie de remplacement stationnaire,

elle-même fondée sur une approche élitiste.

5.2.1.1 Remplacement stationnaire

`

A chaque génération, un certain nombre de descendants sont engendrés. Ils remplacent un

nombre inférieur ou égal de parents, pour former la population à la génération suivante.

Histo-riquement, la plupart des travaux ont considéré un remplacement ₍₍générationnel₎₎ consistant

`

a remplacer l’ensemble des individus de la population par leurs descendants. Par la suite une

approche diamétralement opposée s’est développée : à chaque génération, seulement un petit

121 Troisième partie Apprentissage évolutionnaire des réseaux Bayésiens

nombre (typiquement 2) d’individus sont remplac´es. Cette approche, appel´eeremplacement

sta-tionnaire, donne en règle générale de meilleurs résultats. Les algorithmes utilisant cette approche

Dans le document Approches évolutionnaires pour la reconstruction de réseaux de régulation génétique par apprentissage de réseaux bayésiens. (Page 132-135)