• Aucun résultat trouvé

Configuration des restitutions

Nous allons effectuer des restitutions de profils atmosphériques de température et de vapeur d’eau. L’objectif est de montrer à la fois la synergie entre les mesures des instru-ments satellitaires (comme on l’a fait au Chapitre5, page121), mais également de montrer l’importance de la prise en compte des informations de surface dans la restitution. Pour cela, nous avons légèrement complexifié le schéma de restitution utilisé au-dessus des océans, en y rajoutant les informations de surface en entrée (voir Schéma7.1).

Température de brillance AMSU-A et MHS et / ou Émissivité de surface AMSU-A et MHS Température de surface Composantes de l'ACP sur les températures de brillance IASI et / ou Émissivité de surface IASI Algorithme de restitution Profil de température

Profil d'humidité relative

et / ou ou

Figure 7.1 – Schéma des configurations de restitutions au-dessus des continents.

Cette étude sera menée en deux temps, nous étudierons d’abord l’apport des informations de surface. Pour cela nous considérerons des schémas de restitution utilisant comme entrée les mesures des instruments seuls ou combinés avec les émissivités correspondantes et la température de surface. Puis, nous étudierons l’impact de la synergie entre les rayonnements infrarouges et micro-ondes sur la restitution en combinant les différentes entrées.

7.1.1 Base d’apprentissage

Nous allons utiliser ici les bases de données atmosphériques que nous avons créées au chapitre précédent (Chapitre 6, page 155). Il s’agit de huit bases de données différentes (correspondant à différents nombres de niveaux de pression) constituées de :

– Un profil de température ; – Un profil de vapeur d’eau ; – Quatre valeurs d’ozone intégrées ; – La température de surface.

À partir des 4 quantités d’ozone intégrées, des couches 0,005 ; 132,49 ; 222,94 et 478,54 hPa jusqu’à la surface, nous extrapolons un profil complet sur le même nombre de niveaux que les deux autres profils. Nous répartissons les quantités intégrées d’ozone tout au long du profil en respectant le profil typique de l’ozone atmosphérique : assez faible à basse altitude, croissant jusqu’à un maximum dans la basse stratosphère, puis une rapide décroissance.

Les profils de vapeur d’eau sont utilisés en humidité relative. Cette unité, plus facile-ment intelligible, nous permet de mieux prendre conscience des erreurs commises sur les restitutions effectuées.

Chaque base est donc composée de 10.000 situations avec 3 profils atmosphériques sur les mêmes niveaux verticaux et la température de surface. Ces profils proviennent de restitutions à partir de mesures IASI de l’année 2010. Ils sont donc associés à une date et une géolocali-sation précises. À partir de ces informations, nous associons à chaque situation l’émissivité infrarouge hyperspectrale issue des moyennes mensuelles détaillées à la Section3.3(page90). Il s’agit de moyennes mensuelles de l’émissivité restituée à partir de mesures IASI. Elles sont projetées sur une grille “equal-area” à 0,25×0,25 (voir Section2.1.3, page49). Nous utili-sons l’interpolateur d’émissivité micro-onde TELSEM (Aires et al. 2011b) pour associer les émissivités micro-ondes correspondant aux canaux d’AMSU-A et MHS à chaque situation. Les spectres d’émissivité infrarouge ne sont pas décompressés et sont utilisés sous la forme de composantes principales de l’ACP (voir Section2.2.3, page53). Neuf composantes sont prises en compte dans la restitution car l’algorithme bayésien de restitution de l’émis-sivité et de la température (voir Chapitre 2, page 37) en donne neuf en sortie.

Nous disposons donc d’une base de données de profils atmosphériques associés à la température de surface et aux émissivités micro-ondes et infrarouges correspondantes. Nous pouvons désormais utiliser le code de transfert radiatif RTTOV pour simuler les mesures des instruments IASI, AMSU-A et MHS pour chaque situation.

À l’image de ce que nous avions fait à la Section 5.1.3 (page 127), chaque fois qu’une situation est prise en compte (dans la phase d’apprentissage, de validation ou de test), les mesures satellites sont bruitées suivant les caractéristiques instrumentales données par le constructeur.

Les données IASI sont compressées à l’aide d’une ACP. Les raisons nous ayant amenés à faire ce choix ont déjà été largement exposées dans la Section5.1.4.2 (page130). Nous ne

nous attarderons donc pas plus sur l’ACP ou sur le choix des composantes.

Présenter les résultats obtenus sur les 8 bases de données différentes serait fastidieux et répétitif pour le lecteur. Nous ne présenterons que les résultats concernant la base sur 86 niveaux, car c’est celle qui présente la plus grande variabilité de profils atmosphériques. Les statistiques obtenues sur les autres bases sont très similaires.

Chacune des 10.000 situations de la base de données est donc composée au final de : – Un profil de température sur 86 niveaux de pression ;

– Un profil de vapeur d’eau sur 86 niveaux de pression ; – Un profil d’ozone sur 86 niveaux de pression ;

– Une température de surface ;

– L’émissivité infrarouge de la surface à la résolution IASI ; – L’émissivité micro-onde à la résolution de AMSU-A et MHS ; – 20 composantes de l’ACP sur le spectre de mesures simulées IASI ; – Les mesures simulées de AMSU-A et MHS.

Du fait de la linéarité de l’ACP, le bruit de l’instrument IASI peut être calculé directe-ment sur les composantes, pour chaque itération d’apprentissage. Ces bruits instrudirecte-mentaux permettent d’augmenter artificiellement la base de données de 10.000 situations et de di-versifier les différents profils. Cela permet d’augmenter les capacités de généralisation de l’algorithme de restitution.

Nous découpons ici, de la même manière que nous avons procédé à chaque fois qu’il était question de créer des algorithmes statistiques, la base de données en trois bases distinctes : - Une base d’apprentissage de 8.000 situations, qui sera présentée à l’algorithme et

qui permettra de le paramétrer ;

- Une base de validation de 1.000 situations, qui permet de s’assurer au cours de l’apprentissage que l’algorithme conserve sa capacité à généraliser. C’est sur cette base qu’est calculé le critère de convergence et que sont faits les choix d’architecture des réseaux ;

- Une base de test de 1.000 situations, qui servira, une fois l’algorithme paramétré, à calculer l’erreur finale de restitution.

Ces trois bases sont séparées une fois pour toutes et ce sont les trois mêmes bases qui sont utilisées pour chaque configuration de restitution.

7.1.2 Méthode de restitution

Les restitutions effectuées ci-après seront toutes effectuées grâce à des réseaux de neu-rones. Les réseaux de neurones que nous allons utiliser sont des Perceptrons Multi-Couches (Rumelhart et al. 1986) (semblables à ceux utilisés pour l’interpolateur d’émissivité infra-rouge à la Section 2.2.1 (page 50) et pour les restitutions au-dessus des océans à la Sec-tion 5.2.4.1, page 147). Nous avons montré dans le Chapitre 5 (page 121) que les réseaux

de neurones étaient les outils les mieux adaptés à ces restitutions. En nous basant sur cet acquis, nous allons donc nous concentrer uniquement sur cette méthode de restitution.

Afin de pouvoir comparer facilement les différents résultats, nous avons choisi de conser-ver la même architecture neuronale pour toutes les configurations envisagées. Tous les ré-seaux de neurones que l’on utilise sont constitués d’une seule couche cachée comprenant 60 neurones. De nombreux tests ont étés menés afin de déterminer ce nombre, qui semble adapté compte tenu de la configuration minimale et maximale des réseaux que l’on construit. Ces réseaux contiennent tous 86 sorties (nombre de niveaux pour les différents profils) et de 20 à 70 entrées. Ces 60 neurones cachés leur permettront donc d’établir la relation entre ces variables.

Afin de caractériser au mieux les erreurs en sortie des différents réseaux de neurones que nous allons construire, nous utiliserons systématiquement la racine de l’erreur quadratique moyenne (notée RMS). Comme nous l’avons déjà expliqué, cette mesure de l’erreur nous permet de prendre en compte à la fois son biais et son écart-type. Les réseaux de neurones, par construction, génèrent peu de biais, la plus grande partie de la RMS de l’erreur est de la variance. La RMS est alors une mesure proche de l’écart-type de l’erreur.

7.1.3 Convergence des différents réseaux de neurones

Nous présentons dans cette partie la stabilité des apprentissages effectués dans les dif-férentes configurations. Nous ne montrons ici que la convergence des réseaux de neurones destinés à la restitution des profils d’humidité relative. Les résultats sur les réseaux resti-tuant le profil de température sont sensiblement identiques, ils ne sont donc pas présentés ici.

La Figure7.2présente les convergences des différents réseaux de neurones. Chaque ité-ration correspond à une présentation de la base d’apprentissage au réseau de neurones. À chaque itération, le bruit instrumental des trois capteurs est tiré aléatoirement en suivant la loi gaussienne définie par le constructeur (voir Section 5.1.3, page 127).

Les valeurs indiquées en ordonnées correspondent à la moyenne de la RMS de l’erreur sur tout le profil de l’humidité relative. On retrouve des valeurs relativement faibles car l’erreur est très faible dans les hautes couches de l’atmosphère. Les erreurs sont calculées sur la base de validation au cours de l’apprentissage. Les représentations du profil d’erreur sur les figures suivantes correspondent, quant à elles, à des moyennes de l’erreur sur la base de test avec le réseau paramétré à l’issue de la dernière itération.

Le codage couleur utilisé ici sera conservé par la suite pour plus de clarté pour identifier les différentes configurations. Ici, seuls les réseaux restituant le profil d’humidité relative sont présentés. Le codage couleur est le même pour ceux restituant le profil de température. Les couleurs correspondent aux entrées des réseaux :

- Bleu clair : les mesures de IASI et les informations de surface (température et émis-sivité infrarouge) ;

- Vert foncé : les mesures de AMSU-A et MHS ;

- Vert clair : les mesures de AMSU-A et MHS et les informations de surface (tempé-rature et émissivité micro-onde) ;

- Rouge : les mesures de IASI, AMSU-A et MHS ;

- Jaune : les mesures de IASI, AMSU-A et MHS et les informations de surface (tem-pérature et émissivité infrarouge et micro-onde).

On peut constater ici que les informations de surface ont amélioré les différentes restitutions. Dans chaque configuration, la prise en compte de l’émissivité et de la température de surface permet à la courbe plus claire d’atteindre des valeurs inférieures. On note aussi que les courbes rouge et jaune (correspondant à l’utilisation des trois capteurs simultanément) sont en dessous des autres courbes. C’est l’effet de la synergie. Il semblerait que l’apport de la synergie soit comparable à l’effet de la prise en compte des caractéristiques de surface.

0 10 20 30 40 50 60 70 80 90 2 3 4 5 6 7 8 Itérations d’apprentissage

RMS moyenne sur tout le profil

IASI AMSU−A+MHS AMSU−A+MHS+IASI IASI+Ts+ε AMSU−A+MHS+Ts+ε AMSU−A+MHS+IASI+Ts+ε

Figure7.2 – Moyenne sur le profil d’humidité relative de la RMS de l’erreur de restitution pour les différentes configurations envisagées, pour chaque itération au cours de l’appren-tissage.

Les différentes courbes présentent une structure similaire : une forte décroissance due à un paramétrage grossier des différents poids synaptiques du réseau, suivie d’une lente stabilisation de l’erreur liée à des modifications plus fines des différents paramètres des réseaux. Toutes les courbes se sont bien stabilisées. Aucune ne présente de sur-apprentissage, qui serait visible par une croissance progressive de l’erreur. Ceci est dû à l’utilisation du

bruit instrumental qui est modifié à chaque itération et à un nombre limité de paramètres dans le réseau. Cette légère modification de la base d’apprentissage permet d’éviter que le réseau diminue son erreur de restitution, en codant des relations existant uniquement au sein de la base d’apprentissage. Les réseaux ainsi paramétrés conservent leur capacité de généralisation à des situations qui ne leur ont pas été présentées au cours de l’apprentissage. Le nombre d’itération d’apprentissage de chaque réseau est, ici, volontairement sem-blable, afin de pouvoir les comparer sans soucis liés à différents apprentissages. Il est cepen-dant important de noter que le temps d’itération de chaque réseau dépend du nombre de ses entrées (et également de ses sorties, mais ici ce nombre ne change pas). Le calcul de l’erreur et sa rétropropagation au sein du réseau est plus long pour un réseau avec plus d’entrées. Si l’apprentissage d’un réseau de neurones plus complexe est plus long, lors de son utilisation en configuration de restitution, le temps de calcul des sorties est sensiblement équivalent. Il n’est donc pas problématique de construire un réseau relativement complexe.

Documents relatifs