• Aucun résultat trouvé

Classification des diff´erents types de diagnostiques

A.2 D´efinition du cahier des charges du concept

A.2.2 Classification des diff´erents types de diagnostiques

Il faut distinguer trois directions principales, illustr´ees par la Fig. A.1, selon lesquelles les diagnostiques seront effectu´es : temporelle “T”, ensembliste “N”, et spatiale “S”. Des diagnostiques faisant intervenir deux de ces directions peuvent ´egalement exister. En parti- culier, les calculs statistiques multivari´es tels que les techniques d’Analyse en Composantes Principales (EOFs, M-SSA, CCA, etc) peuvent ˆetre spatio-temporel, ensemblo-temporel ou ensemblo-spatial. Il semble enfin peu probable qu’un diagnostique ait besoin des trois directions, sans qu’il puisse ˆetre d´ecompos´e au pr´ealable en sous-diagnostiques faisant in- tervenir de fa¸con s´epar´ee ces directions (p. ex. spectre spatio-temporel calcul´e par une premi`ere transform´ee de Fourier en temps suivie d’une deuxi`eme en espace). Nous tentons ici de dresser un portrait exhaustif des diff´erents types de diagnostiques en fonction de la direction dans l’espace “TNS”.

Diagnostiques temporels

Les diagnostiques effectu´es le long de la dimension temporelle “T” font intervenir des techniques d’analyse de s´erie temporelle climatique (p. ex. statistiques, traitement du si- gnal, th´eorie de l’information). La plupart du temps, il n’est pas n´ecessaire de charger l’int´egralit´e d’une s´erie temporelle pour effectuer le diagnostique mais seulement une par- tie de celle-ci. Le calcul d’une moyenne temporelle, par exemple, peut ˆetre r´ealis´e en incr´ementant la somme partielle `a chaque pas de temps (ne chargeant en m´emoire qu’un

ANNEXE A. CONCEPT DOABLE 139

pas de temps). Un filtrage lin´eaire n´ecessitera quant `a lui de charger en m´emoire un mor- ceau identique `a la taille du noyau de filtrage. Enfin, une transform´ee de Fourier implique d’utiliser l’int´egralit´e de la s´erie temporelle pour ˆetre calcul´ee. Il apparait donc naturel d’int´egrer un param`etre qui correspond `a la taille des morceaux ´el´ementaires de la s´erie temporelle n´ecessaire `a un diagnostique : la m´emoire tampon ou buffer. Ce param`etre permet un usage plus flexible et optimis´e pour la conception de diagnostiques de s´eries temporelles.

Les diagnostiques multivari´es se limitent `a deux variables pour les s´eries temporelles (p. ex. corr´elations, cross-wavelet), le cas plus g´en´eral d’Analyse en Composantes Principales (ACP) ´etant trait´e dans une partie `a part. La principale diff´erence avec les diagnotisques monovari´es pr´esent´es dans le paragraphe pr´ec´edent provient seulement du nombre de va- riables utilis´ees.

Diagnostiques ensemblistes

Les diagnostiques ensemblistes consistent en diff´erentes op´erations statistiques dans la direction ensembliste “N” (p. ex. l’´evaluation de la densit´e de probabilit´e). La dimension “N” est en somme assez similaire `a la dimension “T”. Il vaudra mieux en g´en´eral charger l’int´egralit´e des r´ealisations en m´emoire car seul la dimension record (g´en´eralement asso- ci´ee `a la dimension “T”) est optimis´ee pour les entr´ees/sorties dans les fichiers netCDF. En pratique, le nombre de r´ealisations (c.-`a-d. la taille de la dimension “N”) est g´en´eralement bien plus faible que le nombre de points des s´eries temporelles (c.-`a-d. la taille de la dimen- sion “T”). L’usage d’un buffer peut ˆetre ´egalement appropri´e pour certains diagnostiques et apportera plus de flexibilit´e.

Diagnostiques spatiaux

Les diagnostiques spatiaux d´ependent de la fa¸con dont les diff´erentes variables du probl`eme sont stock´ees sur la grille. La typologie des grilles utilis´ees en dynamique des fluides g´eophysiques reposent sur les grilles d’Arakawa (Fig A.3), dont les types “C” et “A” sont les plus utilis´es en pratique. La grille “C” fait aujourd’hui la quasi-unanimit´e dans les mod`eles oc´eaniques et atmosph´eriques car elle se r´ev`ele bien appropri´ee `a la discr´etisation des ´equations sous forme flux : les quantit´es scalaires sont ´evalu´ees au centre des mailles de la grille duale tandis que les quantit´es flux relatives aux vitesses zonale u et m´eridienne v sont ´evalu´ees sur les bords. La grille “A” est quant `a elle utilis´ee dans les observations altim´etriques, o`u par exemple les vitesses g´eostrophiques sont ´evalu´ees au mˆeme point que la hauteur dynamique η.

L’usage d’une grille “C” impose donc de connaˆıtre en quels points les variables d’entr´ee et de sortie de l’analyse sont ´evalu´ees tandis que cette information n’est pas n´ecessaire avec l’usage d’une grille “A”. Bien entendu, les sch´emas de discr´etisation des op´erateurs, d´eriv´ees partielles par exemple, doivent ˆetre adapt´es `a la grille. La m´etrique de la grille s’av`ere ´egalement n´ecessaire dans de nombreux calculs (p. ex. moyennes, d´eriv´ees, etc). Elle est implicitement connue car celle-ci est incluse dans le descripteur de la base de donn´ees. Les param`etres fondamentaux des diagnostiques spatiaux sont donc : le type de grille, les variables d’entr´ee et de sortie ainsi que leur position sur la grille (si grille “C”), la m´etrique de la grille.

Figure A.3 – Sch´ema des grilles A et C d´efinies selon Arakawa and Lamb (1977). Les points u, v et η correspondent aux points o`u sont ´evalu´ees respectivement les vitesses zonales, les vitesses m´eridiennes et les grandeurs scalaires.

Analyse en Composantes Principales

Les Analyse en Composantes Principales reposent sur le calcul des valeurs propres de la matrice de covariance, dont la construction diff`ere selon les techniques (p. ex. EOFs, CCA, MSSA). On peut utiliser une propri´et´e de la matrice de covariance afin de la construire pas `a pas, `a partir de matrices extraites de la base de donn´ees, ´evitant ainsi de charger l’int´egralit´e du champ pour le calcul. Pour un champ espace-temps, on peut par exemple calculer les matrices de covariance en temps sur plusieurs sous-domaines spatiaux, puis les sommer afin d’obtenir la matrice de covariance en temps du champ complet. Ce mˆeme principe peut ˆetre appliqu´e pour reconstruire les EOFs `a partir des composantes princi- pales. Par la suite, nous laisserons de cˆot´e ce genre d’analyse pour nous concentrer sur les diagnostiques selon une direction de l’espace “TNS”