• Aucun résultat trouvé

3. Création de Données Synthétiques

3.5. Analyse par cartes auto-adaptatives de Kohonen

Les cartes auto-adaptatives, ou Self-Organising Maps (SOM) en anglais, sont des méthodes neuronales d'analyse qui permettent de représenter des données multidimensionnelles dans un espace dimensionnel plus petit, généralement une ou deux dimensions, tout en gardant les relations topologiques entre les données [Kohonen (2001)]. Les relations topologiques sont ici les relations qui existent entre les profils.

Les SOM sont composées d’un ensemble de nœuds totalement connectés à la couche d’entrée: tous les nœuds ont une liaison pour chaque composante du vecteur d'entrée. Dans notre cas le vecteur d'entrée est le profil d'humidité représenté par un vecteur de 22 composantes. Chacune des 22 composantes étant à un niveau de pression donné. Les 22 niveaux considérés sont ceux de la Figure 16. Le principe est illustré par le schéma de la Figure 18, avec une carte bidimensionnelle de 3x3 éléments et pour un vecteur d'entrée de dimension n.

Figure 18: Diagramme d'une carte auto-adaptative de 3x3 avec une entrée bidimensionnelle. W1,1, W1,2,...,W1,n correspondent aux poids synaptiques entre le vecteur d'entrée et la carte.

Le but des cartes auto-organisatrices est de projeter des données avec une grande dimensionnalité dans un espace dimensionnel réduit qui permet une meilleure compréhension de l'ensemble de données. Pour y parvenir on procède à la minimisation d'une fonction coût qui respecte l'ordre topologique induit par la carte. La fonction coût utilisée est:

(7)

et désigne la distance discrète entre un neurone de la carte et l'indice du neurone associé à . La distance euclidienne entre un profil d'humidité ( ) à son référent sur la carte ( ) est remplacée par une mesure appelée "Distance Généralisée" qui fait intervenir tous les neurones de la carte via la fonction . Grâce à cette fonction paramétrée par terme de température, noté , la contrainte de voisinage introduite par la topologie de la carte pourra être

d'autant plus forte que deux neurones sont proches sur la carte, mais elle peut également se faire sentir même pour des neurones éloignés. C'est l'utilisation de la fonction de voisinage qui introduit les contraintes topologiques dans la représentation finale. En fin d'apprentissage, les poids de chaque neurone convergent vers des valeurs telles qu'un neurone ne sera plus actif que pour un sous-ensemble d'observations bien déterminé. Le vecteur référent W peut être considéré comme une observation moyenne qui résume le sous-ensemble des observations d'apprentissage affectées au neurone c.

La Figure 19 illustre l'évolution de la notion de voisinage au cours de l'apprentissage introduite par la fonction dans la définition de la distance généralisée.

Figure 19: Ampleur du voisinage initial (a) et après "t" itérations (b).

Des cartes de dimension 10x10 ont été apprises sur l'ensemble des 22 niveaux des profils d'humidité relative des radiosondes présentés au Chapitre 2 (océanique et continental). Pour chacune des situations une partition est ainsi réalisée et les Figure 20 et Figure 21 représentent, niveau par niveau, les 100 vecteurs référents (ou prototypes) ainsi obtenus. Chacun des 100 référents correspond à un groupe de profils ayant des caractéristiques similaires. Ces référents sont également caractérisés par un vecteur poids de 22 composantes correspondant aux 22 niveaux de pression. Dans les cartes de la Figure 20 (cas océanique) on peut ainsi observer une évolution progressive de l'humidité relative par rapport à la pression sauf pour le niveau de surface qui se distingue nettement des autres niveaux. On observe également que les niveaux les plus bas sont les plus humides (rouge) et que ceux correspondants à des altitudes élevées sont généralement plus secs. Pour les cartes 900 hPa et 955 hPa la plus part des référents ont une humidité relative supérieure à 80% (rouge) alors que pour les cartes 275 hPa à 584 hPa la grande majorité des référents ont une humidité relative inferieure à 40% (bleu). Pour chaque niveau, le référent en haut à gauche correspond aux situations les plus sèches quelque soit le niveau de pression considéré, excepté pour les niveaux entre 525 hPa et 661 hPa. A l'opposé le référent en bas à droite correspond à des profils particulièrement humides pour les niveaux au dessus de 380 hPa alors que le référent en haut à droite représente les situations dans lesquelles une importante quantité d'humidité se situe entre 160 et 340 hPa. Ce comportement renvoie aux résultats obtenus par la matrice de corrélation: les niveaux consécutifs de chacun des référents ont des humidités semblables que nous pouvons grouper en couches consécutives, en dehors du niveau de surface qui semble devoir être considéré indépendamment.

Figure 20: Diagrammes de composants pour chaque niveau de pression, cas océanique. La palette des couleurs correspond aux valeurs d'humidité relative.

Il est vrai aussi que les frontières entre les différentes couches ne sont pas évidentes, mais on peut être guidé par l'apparition ou la disparition de certaines caractéristiques. Par exemple, nous pouvons dire que l'apparition d'humidité plus importante au coin bas-droit au niveau 131 hPa est un indicateur de la nouvelle couche. Cette couche est caractérisée par des pics d'humidité, au coin haut-droit, que nous pouvons observer aussi dans la Figure 16 aux niveaux 161 et 200 hPa. La frontière de la couche suivante est liée à la localisation des cellules très humides au coin haut-droit de la grille et à l'apparition de valeurs d'humidité élevées au coin bas-droit de la grille. La couche suivante est caractérisée par la disparition totale des cellules humides du coin haut-droit et une augmentation progressive des valeurs d'humidité relative du coin bas-droit. La quatrième couche est caractérisée par l'augmentation des cellules humides au coin bas-droit et l'apparition d'un groupe de cellules légèrement humides au coin haut-gauche de la grille. Dans la cinquième couche le groupe de cellules légèrement humides a disparu et les cellules fortement humides deviennent de plus en plus nombreuses. La sixième couche est composée des deux niveaux les plus humides du profil vertical. Une dernière réflexion sur le niveau à 1013 hPa est liée à son apparente homogénéité (un écart de 15% entre le référent le plus humide et le plus sec), qui suggère l'existence d'une couche très homogène proche de la surface.

Pour le cas continental, présenté dans la Figure 21, on observe un comportement proche du cas océanique en ce qui concerne à l'évolution de l'humidité relative par rapport à la pression. Néanmoins, la variabilité du niveau à 1013 hPa est plus forte par rapport au cas océanique et est plus proche des caractéristiques des niveaux supérieurs, ce qui peut s’expliquer par une évaporation de l’humidité des sols moins importante que pour les surfaces océaniques tropicales.

Figure 21: Même chose que la Figure 20, pour le cas continental.

Pour conclure, nous avons observé que la variabilité verticale du champ de vapeur d’eau est faible pour des niveaux successifs et que cette homogénéité nous permet construire des couches qui regroupent les niveaux successifs les plus semblables entre eux sans dégrader leurs caractéristiques physiques ou dynamiques, ce qui nous permet de réduire la dimensionnalité et, en conséquence, simplifier nos modèles. Par ailleurs cette représentation synthétique de nos données nous permettra ultérieurement (Figure 26) de projeter les erreurs des modèles développés afin d’étudier l’erreur obtenue pour chacun des profils référents et d’analyser ainsi la variabilité de l’erreur en fonction des caractéristiques des profils.

Documents relatifs