Les réseaux de neurones artificiels (ANN)

Chapitre 1.2: Les sites contaminés en éléments traces et les différentes techniques de remédiation

II. Modélisation mathématique appliquée aux sols

II.4. Les réseaux de neurones artificiels (ANN)

Un réseau de neurones artificiels (ANN) est un modèle de calcul dont la conception est très schématiquement inspirée du fonctionnement du cerveau et du système nerveux humain. Un ANN ‗apprend’ lors d‘une phase d‘apprentissage à associer des sorties à des entrées issues de résultats d‘expériences (Corsi et Noël, 1990; Putter et Smeets, 1989; Sejnowski et Tesauro, 1989; Behrens et al., 2005; Gandhimathi and Meenambal, 2012). Il construit ainsi un ‗savoir‘ sous forme d‘un modèle mathématique sous forme de connexions entre un certain nombre de neurones artificiels. Les entrées circulent dans des calculs intégrant les facteurs les plus influants. Il sera capable par la suite de prédire le comportement du système (sorties) pour des

combinaisons d‘entrées non présentées lors de l‘apprentissage (Römkens and Salomons, 1998; Tiktak et al., 1998; Schaap and Lei, 1998; Elzinga et al., 1999; Sarmadian and Taghizadeh Mehrjardi, 2008).

II.4.1. Structure d’un ANN

La famille de réseaux des neurones la plus utilisée est le perceptron multi-couches (PMC). L'architecture de cette famille d‘ANN est composée (Fig. 16) (Bishop, 1995; Haykin 1996; Thiria et al., 1993):

 un certain nombre de couches cachées prenant leurs entrées sur les neurones de la couche précédente

et une couche de sortie(s) (contenant les variables de sortie(s) ) dans les connexions vers l'avant.

Chaque neurone dans la couche d'entrée représente un seul paramètre d'entrée. Puis cette couche transfert ces valeurs aux couche suivantes cachées ; finalement les neurones de la dernière couche représentent les sorties ANN. La « couche » d‘entrée n‘est pas une réelle couche de neurones car elle se contente de coder les variables d‘observation. La couche de sortie code la variable de discrimination. Les valeurs d‘activité des neurones sont propagées dans le réseau, de l‘entrée vers la sortie, sans retour arrière. La présence d‘une couche cachée permet de modéliser des relations non linéaires entre les entrées et la sortie. Les neurones sont reliés entre eux par l‘intermédiaire de poids synaptiques, notés .

Cependant l‘utilisation d‘un ANN se fait en trois phases (Haykin, 2009): (i)une phase d‘apprentissage

(ii)une phase de validation (iii)une phase d‘utilisation.

Figure 16. Architecture d‘un réseau de neurones composé de 4 entrées, deux couches cachées et une couche de sortie. Exemple de modélisation de la phytoextraction : concentration d‘As dans les feuilles de haricot (sortie) en

fonction des caractéristiques principales du sol contaminé en As p (entrées).

Malgré la supériorité des ANN par rapport aux MLR et RSM, peu d‘études existent dans la littérature mettant en œuvre la méthode des ANN pour modéliser des réponses relatives à des problématique de sols contaminés à partir de paramètres facilement mesurables telles que le pH, la granulométrie (teneur en sable, de limon et d'argile), la teneur en matière organique, la densité apparente et la porosité. Les articles suivant ce chapitre contiennent chacun une étude bibliographique sur le sujet.

II.4.2. L’apprentissage

L‘apprentissage d‘un réseau de neurones artificiels est induit par une procédure itérative d‘ajustement de ses paramètres internes (poids synaptiques et nombres de neurones). Ces ajustements sont décrits par un algorithme d‘apprentissage.

Il existe deux types d‘apprentissage, supervisé et non supervisé. Dans le domaine de modélisation/prédiction par ANN, l‘apprentissage supervisé est le plus couramment utilisé.

Le processus de l'apprentissage de l‘ANN consiste à présenter un ensemble d'exemples (entrées avec des sorties connues résultats d‘essais par exemple) (Jenkins, 1997; Rafiq et al., 2001, Hambli et al., 2006, Hambli, 2009). La phase d‘apprentissage est chargée d‘ajuster les valeurs des poids de connexions du réseau ( ). L‘algorithme d‘apprentissage aura pour tâche d‘évaluer ces poids en fonctions des données présentées lors de la phase d‘apprentissage. Lors de cette phase, l‘objectif principal de l‘ANN est de trouver d‘une façon itérative la meilleur configuration de l‘ANN en minimisant l‘erreur entre les valeurs des sorties présentées lors de l‘apprentissage et les valeurs des mêmes sorties prédites lors des boucles d‘apprentissage. Ce savoir est stocké sous forme de poids de connexions ( ) entre les différentes couches de neurones (entrées-cachées-sorties). Une fois le cycle d‘apprentissage (epochs) terminé, l‘architecture de l‘ANN garde et utilise les poids ( ) ayant assurés l‘erreur minimale entre prédictions/mesures lors de l‘apprentissage.

A chaque itération une entrée est présentée au réseau, il propage ces valeurs vers les neurones de sortie. Cette sortie calculée est comparée avec la réponse désirée, s‘il y a des déférences, le système utilise ces différences pour adapter les paramètres du réseau interne de façon à corriger son comportement et donner les valeurs désirées en conséquence. Cette altération des connexions est obtenue par l‘algorithme de "rétro propagation" du gradient d‘erreur. Ce calcul est chargé de rétro propager dans le réseau les erreurs constatées sur les sorties. Finalement cette connaissance est représentée et stockée par la force (poids) des connexions entre les neurones (Fig. 17).

Figure 17. Illustration de la phase d'apprentissage qui consiste à ajuster les poids de connexion entre les neurones à l‘aide d‘un algorithme de rétro-propagation. L'apprentissage est répété un certaine nombre de cycle

64 Il existe plusieurs algorithmes d‘apprentissage pour ANN. Les plus utilisés sont basés sur des algorithmes de rétro-propagation de type Levenberg-Marquardt (Jenkins, 1997; Rafiq et al., 2001 ; Hambli et al., 2006 ; Hambli, 2009).

Dans l‘apprentissage non supervisé, l'utilisateur du réseau ne détermine pas de variables de sortie et n‘interviens pas dans la fonctionnalité du système. Le réseau s‘auto-organise de façon à découvrir des formes récurrentes dans les informations qu'il reçoit, mais en manière indépendante sans aide extérieures. Cet apprentissage est destiné à l‘élaboration d‘une représentation interne de l‘espace des données d‘entrée en identifiant la structure statistique sous-jacente des variables d‘entrée sous une forme plus simple ou plus explicite.

II.4.3. Validation d’un modèle ANN

Une fois l‘apprentissage terminé, il faut vérifier que le modèle ANN modélise/prédit correctement les réponses. La validation consiste à présenter des résultats d‘essais (entrées-sorties) non présentés lors de la phase d‘apprentissage et de vérifier si la prédiction du ANN est en proche des valeurs mesurées.

II.4.4. Utilisation du modèle ANN

Une fois le modèle validé, on peut utiliser l‘ANN comme outil de prédiction où l‘on présente au réseau de nouvelles combinaisons d‘entrées et l‘ANN prédit en retour les sorties.

Dans le document Ecodynamique des éléments traces et caractérisation de l’exposition des sols contaminés : expérimentation et modélisation par les réseaux de neurones artificiels (Page 62-65)