• Aucun résultat trouvé

Techniques de sélection des caractéristiques

4. Revue sur quelques méthodes de sélection des caractéristiques

4.2. Minimum-Redundancy-Maximum-Relevance (mRMR)

4.5.1. Algorithmes évolutionnaires

4.3.1.1. Les Algorithmes Génétiques

Les algorithmes génétiques (AG) sont des algorithmes évolutifs qui utilisent des opérateurs de sélection, de croisement et de mutation. Les AGs ont été proposés pour la première fois par [Holland 1975] et s'inspirent de l'évolution Darwinienne et de la génétique Mendélienne [Salman 1999]. Les AGs sont l'un des algorithmes évolutifs les plus populaires et ont été largement utilisés dans la sélection de sous-ensemble de caractéristiques [Tsai 2013 ; Lu 2016 ; Das 2017]. Les individus dans les AGs sont appelés chromosomes. Chaque chromosome se compose d'une chaîne de cellules appelée gènes. La valeur de chaque gène s'appelle allèle [Holland 1975].

Un cycle AG typique est illustré par la figure 2.5. Premièrement, la population initiale est générée ; cette population comprend un groupe de chromosomes dont les candidats peuvent être sélectionnés pour résoudre un problème.

Figure 2.5. Cycle typique d’un algorithme génétique. [Tang 1996]

Population (Chromosomes) Accouplement (Parents) Sous-Population (Enfant) Fonction Objective Phénotype Fitness Opération Génétique Sélection Fitness Phénotype Remplacement

La population initiale est générée de façon aléatoire, et chacun des chromosomes représente des variables en cascade. Une fois la génération initiale est créée, certains schémas de sélection sont utilisés pour évaluer l'état de chaque chromosome. Il existe un certain nombre de méthodes connues sous le nom de techniques d'évaluation ou techniques de fitness, qui servent à calculer la valeur objective. Les valeurs de fitness de tous les chromosomes sont évaluées en calculant la fonction objective. Ensuite, un groupe particulier de chromosomes (parents) est choisi parmi la population pour générer les enfants par les opérations génétiques définies. Avec un schéma de sélection parental qui est un opérateur de reproduction, des chromosomes plus appropriés sont choisis parmi la population pour d'autres améliorations génétiques. L'aptitude de l’enfant est évaluée d'une manière similaire à celle de ses parents. Les chromosomes de la population actuelle sont ensuite remplacés par leurs enfants, utilisant un opérateur de remplacement. Le cycle d’AG est répété jusqu'à ce qu'un critère d’arrêt souhaité soit atteint. Si tout se passe bien tout au long de ce processus d'évolution simulée, les meilleurs chromosomes de la population finale seront des solutions très développées au problème.

a) Représentation des chromosomes

La représentation binaire est souvent utilisée dans les AGs où chaque gène a une valeur de 0 ou 1. D'autres représentations ont été proposées, par exemple, des représentations en virgule flottante [Janikow 1991], des représentations entières [Bramlette 1991], des représentations codées en gris [Whitley 1998] et la représentation matricielle [Michalewicz 1996]. On trouve plus de détails sur les schémas de représentation dans [Goldberg 1989]. Généralement, les représentations non binaires nécessitent des opérateurs évolutifs différents pour chaque représentation tandis que des opérateurs uniformes peuvent être utilisés avec une représentation binaire pour n'importe quel problème [Van den Bergh 2002].

b) La fonction Objective

Un élément clé dans les AGs est la sélection d'une fonction objective qui quantifie précisément la qualité des solutions candidates. Une bonne fonction objective permet aux chromosomes de résoudre efficacement un problème spécifique. La fonction objective et la représentation du chromosome sont des paramètres dépendants du problème. Une mauvaise sélection de ces deux paramètres affectera la performance des AGs.

c) La sélection

Un autre élément clé de l'algorithme génétique est l'opérateur de sélection qui est utilisé pour sélectionner les chromosomes (appelés parents) pour l'accouplement afin de générer de

nouveaux chromosomes (appelés enfants). Les méthodes de sélection sont utilisées comme mécanismes pour focaliser la recherche sur des régions apparemment plus rentables dans l'espace de recherche [Angeline 1998]. Des exemples de méthodes de sélection les plus connues sont les suivantes :

- Sélection à la roulette : Les chromosomes parents sont sélectionnés de façon probabiliste en fonction de leur valeur de fitness. Le chromosome avec une valeur de fitness supérieure, a plus de probabilité qu'il soit choisi pour l'accouplement [Archetti 1984]. Prenons l’exemple de roulette de casino sur laquelle sont placés tous les chromosomes de la population, la place accordée à chacun des chromosomes étant en relation avec sa valeur d'adaptation. Ensuite, la bille est lancée et s'arrête sur un chromosome. Les meilleurs chromosomes peuvent ainsi être tirés plusieurs fois et les plus mauvais ne seront jamais sélectionnés

- Sélection par classement : La sélection à la roulette souffre du problème que les individus hautement adaptés peuvent dominer dans le processus de sélection, ce qui peut entrainer une convergence prématurée du processus de sélection. Pour réduire ce problème, la sélection par classement trie les chromosomes selon leur fonction objective et leur sélection se base sur l'ordre de rang des chromosomes, et non sur les valeurs de la fonction objective absolue. Le chromosome le plus mauvais (c'est-à-dire le moins adapté) a le rang 1, le deuxième pire chromosome a un rang 2, et ainsi de suite. La sélection par classement préfère toujours les meilleurs chromosomes. Par conséquent, en utilisant cette approche, tous les chromosomes auront de bonnes chances d'être sélectionnés. Cependant, cette approche peut avoir un taux de convergence plus lent que l'approche de la roulette [Omran 2004].

- La sélection par tournoi : Dans cette approche plus couramment utilisée [Goldberg 1989], un ensemble de chromosomes est choisi au hasard. Le chromosome le plus puissant de l'ensemble est ensuite placé dans un ensemble d'accouplement. Ce processus est répété jusqu'à ce que l’ensemble d'accouplement contiennent un nombre suffisant de chromosomes pour commencer le processus d'accouplement.

d) Le croisement

Le croisement (Crossover) est un opérateur de recombinaison qui combine des sous-parties de deux chromosomes parents pour produire des descendants qui contiennent des parties du matériel génétique de ces deux parents. De nombreux praticiens de l'AG estiment que l'opération de croisement est le facteur déterminant qui distingue l'AG de tous les autres algorithmes. Le croisement se produit avec une probabilité spécifiée par l'utilisateur, appelée

probabilité de croisement 𝑝𝑐. 𝑝𝑐 est dépendante du problème avec des valeurs typiques comprises entre 0,4 et 0,8 [Omran 2004]. Les quatre principaux opérateurs de croisement sont: - Croisement à 1-point : Dans cette approche, une position est sélectionnée au hasard à laquelle les parents sont divisés en deux parties. Les parties des deux parents sont ensuite échangées pour générer deux nouveaux enfants.Un exemple est illustré dans la figure 2.6.

Figure 2.6. Le croisement à 1-point.

- Croisement à multipoints points : Dans cette approche, deux ou plusieurs positions sont sélectionnées au hasard. Les parties intermédiaires des deux parents sont ensuite échangées pour générer deux nouvelles enfants (Figure 2.7).

Figure 2.7. Le croisement à deux points

- Croisement Uniforme : Dans cette approche, les allèles sont copiés à partir du premier parent ou du second parent avec une certaine probabilité.

Figure 2.8. Le croisement uniforme

1 1 0 0 1 0 1 0 1 1 0 0 1 0 1 1 0 1 1 1 0 0 1 1 0 1 1 1 0 0 1 0 1 1 0 0 1 0 1 0 1 1 1 1 0 0 1 0 0 1 1 1 0 0 1 1 0 1 0 0 1 0 1 1 1 1 1 1 0 0 1 0 1 1 0 0 1 0 1 0 0 1 0 0 1 0 1 1 0 1 1 1 0 0 1 1 Parent 1 Parent 2 Enfant 1 Enfant 2 Point de Coupure Parent 1 Parent 2 Enfant 1 Enfant 2 Points de coupure Parent 1 Parent 2 Enfant 1 Enfant 2

e) La mutation

Dans les AGs, la mutation est un opérateur qui introduit des variations dans les chromosomes, cette variation peut être globale ou locale. Principalement, la mutation est utilisée pour explorer des nouvelles zones dans l'espace de recherche et pour ajouter de la diversité à la population des chromosomes afin d'éviter d'être piégée dans un optimum local. La mutation est appliquée aux chromosomes enfants après la réalisation du croisement. Dans un AG codé en binaire, la mutation se fait en inversant la valeur de chaque gène dans le chromosome selon une probabilité spécifiée par l'utilisateur, appelée probabilité de mutation, 𝑝𝑚.Cette probabilité dépend du problème à résoudre [Omran 2004].

f) Le remplacement

Le remplacement concerne toute la population. L’objectif de cet opérateur est de diminuer la diversité. Les chromosomes de la population actuelle sont ensuite remplacés par leurs enfants, utilisant une stratégie de remplacement. Parmi les stratégies de remplacement discutées dans la littérature, deux stratégies sont les plus utilisées : le remplacement stationnaire et le remplacement élitiste [Layeb, 2010].