Algorithme LDC-AIS - Catégorisation Locale de Base de données (LDC-AIS)

4.3 Catégorisation Locale de Base de données (LDC-AIS)

4.3.2 Algorithme LDC-AIS

Dans cette partie, on donnera les diﬀérents détails et principes de l’approche que l’on propose. Le but principal de ce travail est l’accélération de l’apprentissage des algorithmes de sélection clonale en réduisant le nombre de calculs eﬀectués, le deuxième objectif est celui de conserver ou améliorer leur précision. L’algorithme de Catégorisation locale de

Base de données, Local Database Categorization en anglais (LDC-AIS) est composé de deux phases principales : la phase d’initialisation et la phase d’apprentissage du SIA.

4.3.2.1 Initialisation

La phase d’initialisation dans un algorithme permet de préparer les données pour ga-rantir un bon apprentissage, et dans notre travail, un apprentissage rapide et eﬃcace. Dans les algorithmes de sélection clonale, l’initialisation consiste à construire une population de cellules mémoires initiales pour chaque classe. Cela est fait généralement en sélectionnant des exemples aléatoirement à partir des données d’apprentissage. Dans notre approche, l’initialisation comprends trois étapes :

a) Création des cellules mémoires initiales :

La première étape est la création des cellules mémoires initiales. On a vu dans le chapitre précédent que le choix de ces cellules à une importante inﬂuence sur la pertinence de l’apprentissage, car c’est à partir de ces cellules initiales que vont naître les cellules mémoires ﬁnales. La création des cellules mémoires initiales pour chaque classe est faite en appliquant la méthode décrite dans le chapitre 2 (Section 3.3.1 ), c’est à dire par moyennes de sous-groupes locaux.

b) Catégorisation par K-means :

On a expliqué dans la section précédente que le système immunitaire naturel répond rapidement aux antigènes, car seules les cellules spéciﬁques à ce dernier sont activées pour déclencher une réponse immunitaire. Pour réduire le nombre de calculs eﬀectués par chaque exemple d’apprentissage pour sélectionner la cellule à cloner, la deuxième étape de l’initialisation consiste à partitionner les ensembles de cellules mémoires initiales créées à l’étape précédente .

En eﬀet, en appliquant le même principe que le système immunitaire naturel, on assurera une importante réduction du temps de calcul. Pour cela, les cellules mémoires initiales de chaque classe sont partitionnées en plusieurs catégories selon leurs similarités en utilisant l’algorithme K-Means. Le choix du nombre de catégories de chaque classe est expliqué dans la section 4.4.1.

c) Apprentissage des catégories par RBF :

La dernière étape de l’initialisation est l’apprentissage des catégories. Un modèle RBF est construit pour chaque classe d’apprentissage (dans notre cas un modèle RBF pour la classe bénigne et un autre pour la classe maligne). Les catégories sont apprises par le réseau adéquat comme catégories spécifiques à des antigènes de la même classe. Le rôle du classifieur RBF est de mémoriser chaque catégorie de cellules mémoires pour pouvoir décider pendant l’apprentissage du SIA à laquelle appartient l’antigène, afin d’éviter de le comparer à la totalité des cellules mémoires de la même classe.

Figure 4.3 – Schéma de l’étape d’initialisation de l’algorithme LDC-AIS composé de : a) création des cellules mémoires initiales, b) catégorisation par K-means et c) apprentissage des catégories par le réseau de neurones RBF.

A la ﬁn de l’initialisation, on dispose de populations de cellules mémoires initiales dont chacune est partitionnée en plusieurs catégories apprises par un réseau RBF, pour répondre spéciﬁquement et plus rapidement aux antigènes.

4.3.2.2 Apprentissage du Système Immunitaire Artificiel

L’apprentissage du SIA commence après l’initialisation des données. Les étapes de l’apprentissage de l’algorithme LDC-AIS sont illustrées dans la ﬁgure 4.4. Chacune de ces étapes (de 1 à 4) est exécutée pour un nombre déﬁnit de générations (NBGen) et pour chaque exemple d’apprentissage (de chaque classe) :

1. Test par RBF :

Chaque exemple d’apprentissage est testé par le modèle RBF correspondant à sa classe, le but étant de déterminer à quelle catégorie il appartient.

2. Évaluation de la similarité et sélection :

Après avoir déterminé la catégorie de l’exemple d’apprentissage, l’évaluation de ce dernier est eﬀectuée en calculant sa similarité avec les cellules appartenant à la même catégorie seulement, au lieu de le comparer à tout l’ensemble des cellules mémoires de la même classe. Après l’évaluation des cellules mémoires, nous avons appliqué deux méthodes de sélection :

i) La première consiste à sélectionner une seule cellule mémoire maximisant la valeur de similarité avec l’exemple d’apprentissage pour passer à l’étape 4.3.2.2.

ii) La seconde méthode de sélection suit le principe de l’approche AC-CLONALG pro-posée au chapitre 3 (section 3.3.3). Au lieu de choisir une seule cellule pour le clonage,

Figure 4.4 – Schéma de l’apprentissage de l’algorithme LDC-AIS composé de : 1) test de la catégorie de l’exemple d’apprentissage par RBF, 2) évaluation de la similarité et sélection de la cellule à cloner, 3) clonage et mutation, et 4) Re-sélection des meilleurs clones par le réseau RBF et ajout aux cellules mémoires.

l’exploration de la population des cellules mémoires est eﬀectuée. P cellules mémoires ayant les plus grandes similarités sont sélectionnées, et une cellule moyenne est créée à partir de ces dernières. Comme nous l’avons détaillé au chapitre précédent, la cel-lule moyenne n’est sélectionnée pour le clonage que si elle présente une meilleure similarité avec l’antigène que la cellule mémoire la plus proche de ce dernier.

Mais dans cette approche, une autre condition est ajoutée. En eﬀet, la cellule moyenne est prise en compte si elle réussit le test par RBF. Si le réseau RBF classe la cellule moyenne dans une autre catégorie que celle de l’exemple d’apprentissage, elle est automatiquement rejetée. Sinon elle est sélectionnée pour passer à l’étape suivante. Si la classe d’apprentissage comprend X exemples (antigènes) et Y cellules mémoires, cette procédure diminue le nombre de comparaisons de cette étape de X.Y.[(k − 1)/k] pour chaque génération. Ce qui nous conduit en tout à une réduction de G.X.Y.[(k −1)/k] comparaisons pour la totalité des générations. Cela implique une réduction importante du temps de calcul pour chaque classe d’apprentissage.

3. Clonage et mutation :

La cellule sélectionnée à l’étape précédente (cellule mémoire ou cellule moyenne) est clonée proportionnellement à sa valeur de similarité. Le nombre de clones de chaque cellule est relatif à cette valeur, c’est-à-dire plus la similarité est grande plus on crée des clones. Tous les clones vont subir au processus de mutation. La mutation est réalisée de manière inverse à la valeur de similarité, c’est à dire plus grande est la similarité moins on mute les clones et vice versa. C’est un changement aléatoire d’une ou plusieurs valeurs des descripteurs du clone. Les processus de clonage et de mutation permettent de générer de nouvelles cellules qui peuvent être plus eﬃcaces dans les prochaines générations.

4. Re-sélection des meilleurs clones par RBF :

La similarité entre les clones mutés et l’exemple d’apprentissage est calculée et com-parée à celle de la cellule mémoire d’origine (sélectionné à l’étape 2 de l’apprentissage du SIA). Si la valeur de similarité du clone est plus faible que celle de la cellule mémoire, le clone est automatiquement rejeté. Tous les clones mutés restants sont présentés au ré-seau RBF correspondant à la même classe. Si un clone appartient à la même catégorie de sa cellule mémoire d’origine, il est ajouté à l’ensemble de cellules mémoires directement à la catégorie à laquelle il appartient, sinon il est rejeté. A la fin de l’apprentissage les différentes catégories de cellules mémoires obtenues pour chaque classe sont fusionnées pour être utilisés dans la classification. Le diagramme intégral de l’approche LDC-AIS est donné dans la figure 4.5.

créaation des Cellules mémoires Initiales (B/M) Catégorisation par K-Means Modèle RBF spécifique (B/M) Evaluation et Sélection Clonage + Mutation Exemple d’Apprentis-sage (B/M) Apprentissage Test Test Ajout Initialisation Apprentissage-AIS LDC-AIS 1 2 3 4 5

Figure 4.5 – Diagramme de LDC-AIS composé de l’étape d’initialisation (créatation des cellules mémoires initiales, Catégorisation par k-means, Apprentissage des catégories par RBF) et l’étape d’apprentissage du SIA (1.Test par RBF , 2.Evaluation et Sélection, 3.Clonage et Mutation, 4.Test des clones mutés par RBF et 5.Ajout des meilleurs clones aux cellules mémoires ﬁnales).

Dans le document Classification du cancer du sein par des approches basées sur les systèmes immunitaires artificiels (Page 83-88)