• Aucun résultat trouvé

Pour faire face aux critiques formul´ees `a l’encontre de l’op´erateur de croi- sement utilis´e de fa¸con standard en PG, des auteurs ont pr´econis´es l’usage de nouveaux op´erateurs de croisement plus “homologues”, c’est-`a-dire garan- tissant que certaines caract´eristiques communes aux parents soient conserv´es lors d’une recombinaison. Diff´erentes tentatives avaient d´ej`a ´et´e r´ealis´ees dans ce sens, avec des crit`eres d’homologie vari´es, portant par exemple sur la taille,

0 0.02 0.04 0.06 0.08 0.1 CGCGCTCGTCCCGTGGCTTCCAAGACCTTATCGGCGTCATTAGTGA S (x, i)

Fig.2.12 – Le processus d’alignement modifie la probabilit´e du choix site de croisement dans x. 0 0.02 0.04 0.06 0.08 0.1 C A T C T G A T G A A A C G C G T G A A A G A C C T T A T A C C T C A A A S (y ,i )

Fig.2.13 – Le processus d’alignement modifie la probabilit´e du choix site de croisement dans y.

la forme, la position ou bien la fonction du mat´eriel g´en´etique ´echang´e. Dans ce chapitre, nous avons d´efini un nouvel op´erateur de croisement pour la PGL, le Croisement par Maximum d’Homologie (CMH), o`u le crit`ere d’homologie retenu est la similarit´e de s´equences des programmes, mesur´ee par la distance d’´edition. Lors d’une recombinaison CMH, nous avons la garantie qu’une des plus longues sous-s´equences communes aux deux parents sera conserv´ee chez les enfants. De plus, nous avons vu que dans la mesure du possible le produit du croisement ne sera pas une simple recopie des parents. Nous esp´erons qu’en d´efinissant l’homologie au plus bas niveau possible, c’est- `a-dire au niveau g´en´etique, le CMH pourra `a la fois conserver la taille, la position et la fonction du mat´eriel g´en´etique ´echang´e et qu’ainsi, la brutalit´e de la recombinaison en PG, i.e. ses effets d´el´et`eres sur la fitness (cf Section 1.2.3), pourra ˆetre ´evit´ee.

Notons enfin que l’op´erateur CMH, tel que nous l’avons d´efini, peut ˆetre utilis´e pour recombiner toutes formes de repr´esentation lin´eaire de taille va- riable utilis´ees en ´Evolution Artificielle.

Homologie, neutralit´e et

difficult´e dans les paysages de

fitness

Dans ce chapitre, nous r´ealisons des ´etudes pr´eliminaires pour l’utilisation op´erationnelle du CMH. Une des principales inconnues dans ce domaine est le r´eglage du taux de croisement optimal du CMH et sa capacit´e `a fonctionner conjointement avec l’op´erateur de mutation. En effet, le fonctionnement du CMH diff`ere largement de celui de l’op´erateur de croisement standard et nous avons d´ej`a not´e, en dehors de toute notion de performance, diverses influences sur la taille et la nature des programmes recombin´es.

L’utilisation de probl`emes dits synth´etiques pour caract´eriser les perfor- mances d’un algorithme, ou d’un op´erateur, est devenue classique en EA. Cette d´emarche s’inscrit dans la probl´ematique plus g´en´erale des algorithmes d’optimisation pour lesquels la n´ecessit´e de caract´eriser et de classer les pro- bl`emes `a optimiser est av´er´ee. En effet, les No Free Lunch Theorems [105] impliquent que si un algorithme est plus performant que la recherche al´eatoire pour une classe de probl`emes donn´ee alors il existe une classe de probl`emes pour laquelle il le sera moins, et que donc, il n’existe pas d’algorithme univer- sel qui soit toujours efficace. C’est pourquoi, une connaissance approfondie des relations entre la performance d’un algorithme et les propri´et´es des pro- bl`emes trait´es est n´ecessaire. Un probl`eme synth´etique poss`ede l’avantage d’ˆetre, par construction, bien connu et permet souvent, de part la simplicit´e

de l’´evaluation d’un individu, d’effectuer des exp´erimentations plus pouss´ees. Par exemple, un parcours exhaustif de l’espace de recherche est parfois r´ea- lisable ce qui rend possible l’´enum´eration des optima globaux. En outre, il poss`ede g´en´eralement un nombre r´eduit de param`etres permettant d’ajuster ces propri´et´es (taille, neutralit´e, difficult´e, ´epistasie, . . . ) et ainsi de mieux caract´eriser leurs relations avec un op´erateur donn´e.

Cependant, les travaux existants dans le domaine de la synth`ese de pro- bl`emes traitent rarement de l’ ´Evolution Artificielle d’individus de Tailles Va- riables (EA-TV) comme c’est le cas en PG ou avec les Messy-GA, une ex- ception serait par exemple [23]. Or il existe des probl´ematiques sp´ecifiques `a l’EA-TV. L’identification des g`enes, par exemple, qui, dans le cas des AG, est triviale et li´ee `a la position dans le g´enotype, est beaucoup plus complexe en EA-TV, puisqu’un g`ene sera reconnu par sa forme (combinaison d’instruc- tions) ou bien par sa fonction. Une autre sp´ecificit´e de l’EA-TV est que la neutralit´e des probl`emes `a optimiser est g´en´eralement beaucoup plus forte1.

Ceci peut s’expliquer d’une part parce qu’un g`ene peut se trouver `a diff´e- rentes positions dans le g´enotype alors que sa position n’influe pas durant l’´evaluation de la performance (neutralit´e positionnelle), d’autre part par une tr`es grande quantit´e d’introns (neutralit´e fonctionnelle), li´ee aux m´ecanismes d’´evaluation par exemple. Derni`ere particularit´e : la taille variable des in- dividus peut ˆetre consid´er´ee comme une nouvelle dimension dans l’espace de recherche qui peut n´ecessiter une exploration sp´ecifique et, par la mˆeme, imposer l’utilisation d’op´erateurs idoines.

Largement inspir´es par les travaux r´ealis´es dans le domaine des AG, nous introduisons trois probl`emes synth´etiques pour l’EA-TV : le probl`eme de la Fitness Guid´ee par l’Homologie, le probl`eme des Routes Royales et celui des Routes ´Epistatiques. Pour caract´eriser leurs propri´et´es respectives, nous utilisons la m´etaphore des paysages de fitness et un ensemble de mesures sur ces paysages.

1

On parle de forte neutralit´e quand la proportion de g´enotypes poss´edant la mˆeme valeur de fitness est ´elev´ee.

Documents relatifs