• Aucun résultat trouvé

6.1.2. Une solution : l’utilisation de méthodes statistiques ... 157 6.2. Méthode utilisée ... 158 6.2.1. Les données d’entrée ... 158 6.2.2. Méthode d’échantillonnage ... 158 6.2.3. Présentation des résultats ... 159 6.3. L’analyse Factorielle Discriminante et le Réseau de Neurones ... 161 6.3.1. Application aux données pluviométriques ... 161 6.3.2. Application aux variables de base ZTUVp... 164 6.3.3. Recherche de variables élaborées discriminantes à partir de l’AFD ... 166 6.3.4. Application des deux méthodes au meilleur jeu de variables... 169 6.3.5. Sensibilité des approches aux échantillons de calage... 174 6.4. Utilisation des approches statistiques en mode prédictif ... 179

6.5. Description de la nouvelle classe de temps d’évènements de convection peu profonde organisée en

bandes ... 181 6.6. Validation de la méthode à partir de simulations ... 184 6.6.1. Distribution des précipitations simulées dans l’espace ... 184 6.6.2. Distribution des cellules de pluie dans l’espace ... 186 6.6.3. Dynamique de la pluie à l’intérieur des bandes orographiques ... 186 6.6.4. Action de la topographie sur la masse d’air ... 187 6.6.5. Simulations de cas prédits ... 189

L’objet de ce chapitre consiste à étendre la classe de temps précédemment élaborée à l’aide de méthodes statistiques. L’objectif est de s’affranchir des données pluviométriques pour l’extraction des évènements de CPP en utilisant les variables thermodynamiques des radiosondages statistiquement discriminantes.

La méthodologie proposée vise d’une part à déterminer la capacité de méthodes statistiques à classer des évènements pluvieux, notamment extraire les évènements de CPP parmi les autres types d’évènements pluvieux, et d’autre part à identifier les processus atmosphériques associés à ces évènements en sélectionnant statistiquement les variables atmosphériques discriminantes. Ce dernier objectif sera traité dans la Partie III.

Les précipitations sont considérées comme une fonction aléatoire conditionnée par les caractéristiques du flux atmosphérique incident. L’utilisation de méthodes statistiques est donc justifiée. Pour traiter la relation non-linéaire entre les précipitations et les variables atmosphériques, l’analyse factorielle discriminante (AFD) et un réseau de neurone (RN) (le perceptron multicouche), sont utilisés, avec pour entrées, des variables extraites des radiosondages ou élaborées non-linéairement à partir des précédentes. Ce chapitre est également l’occasion de proposer une comparaison des performances de ces deux méthodes dans leur rôle de classification d’évènements de CPP et de montrer pourquoi elles doivent être utilisées conjointement. Ce chapitre a fait l’objet d’une publication en révision au Journal of Applied Meteorology and Climatology (Godart et al., 2009b).

6.1. Nécessité d’une nouvelle approche

6.1.1. Un ensemble de données pluviométriques horaires lacunaire

Comme nous l’avons déjà vu, les données pluviométriques horaires contiennent de nombreuses lacunes. Ainsi sur les 880 radiosondages répondant aux critères dynamiques, les critères pluviométriques ne sont finalement applicables que sur 350 d’entre eux soit 40% (Fig. 5-8), ce qui restreint fortement la possibilité de détecter des évènements de CPP. L’analyse des données pluviométriques journalières nous permet de conclure que sur les 530 radiosondages pour lesquels les données pluviométriques ne sont pas disponibles, 59 correspondent à des jours non pluvieux. Nous insistons sur le fait que les critères d’extraction des évènements de CPP ne peuvent s’appliquer qu’au pas de temps horaire. Il reste donc 471 radiosondages pour lesquels une nouvelle approche d’analyse est nécessaire pour conclure quant à leur possibilité d’être caractéristiques d’évènements de convection peu profonde organisée en bandes.

Chapitre 6 : L’analyse factorielle discriminante et les réseaux de neurones : des approches complémentaires 157

6.1.2. Une solution : l’utilisation de méthodes statistiques

De nombreux processus physiques connus (phénomène de blocage, ondes orographiques, etc….) permettent de déterminer le comportement d’une masse d’air lorsque celle-ci rencontre un obstacle tel que le relief. Cette masse d’air peut générer sur le relief des précipitations dont les caractéristiques dépendent à la fois du relief (forme, hauteur, largeur), de la dynamique et de la thermodynamique du flux. Dans notre recherche, nous essayons de comprendre plus particulièrement quelles sont les caractéristiques du flux conduisant aux déclenchements et à l’organisation de précipitations orographiques associées à de la convection peu profonde et organisées en bandes. Ceci peut se faire par l’utilisation de modèles numériques, tel que le modèle météorologique non-hydrostatique MesoNH. Utiliser de tels modèles à base physique permet d’étudier les liens existants entre les caractéristiques du flux et les caractéristiques des précipitations par l’analyse des processus physiques sous-jacents.

Nous pouvons aussi considérer les champs de pluie comme une fonction aléatoire conditionnée par les caractéristiques du flux incident. La relation entre la masse d’air et les précipitations associées se décompose en deux parties : une part déterministe inclue dans les données et par conséquent reproductible grâce au modèle météorologique ; une part aléatoire liée aux informations manquantes dans les données et aux limites des paramétrisations. Par conséquent, avant toute étude climatologique reposant sur la modélisation de la part déterministe, il est nécessaire de s’assurer de l’existence d’un tel lien entre flux atmosphérique et précipitations et surtout de le quantifier. L’approche statistique permet de répondre à ces questions.

L’avantage des deux méthodes statistiques proposées est double. Ces méthodes permettent : 1) d’identifier les variables discriminant un ensemble de groupes et 2) une fois le lien déterministe établi, de classer les radiosondages. L’objectif est donc de s’affranchir des données pluviométriques en établissant un lien statistique entre le radiosondage et son appartenance au groupe de CPP. C’est un raisonnement binaire : ce radiosondage est caractéristique d’un évènement de CPP ou ne l’est pas.

Il s’agit donc de classer les 471 radiosondages restants en partant de l’hypothèse qu’il existe un lien déterministe entre précipitations et variables atmosphériques. La recherche de ce qui permet de distinguer les radiosondages en plusieurs groupes en fonction des variables atmosphériques est une question valide. Nous montrons (annexe 4) les différences statistiquement significatives (d’après un test de Student) entre les moyennes des variables issues des radiosondages caractéristiques des évènements de CPP et ces mêmes variables issues des radiosondages des autres évènements pluvieux. Les groupes sont donc discernables dans l’espace de représentation initial. Cependant ces tests de comparaison de moyenne n’ayant pas été exhaustifs sur toutes les variables possibles et ne permettant

pas de traiter des corrélations entre variables, il est nécessaire d’avoir recours à des méthodes plus objectives pour déterminer toutes les variables qui peuvent être discriminantes.