• Aucun résultat trouvé

3.3 Processus de Pareto spatio-temporels

3.3.3 Discussions de quelques points concernant la mise en pratique des processus

max 1≤i≤n Xi(s, t)− bn(s, t) an(s, t)  s∈S,t∈T ⇒ {Z(s, t)}s∈S,t∈T . (3.3)

Plus de détails sur les processus max-stables spatio-temporels se trouvent dans les travaux de Davis et al. (2013a,b).

Les convergences de la structure de dépendance et des distributions marginales dans (3.3) peuvent être étudiées séparément ; voir de Haan & Ferreira (2006, Section 9.2). Un processus standardisé X = {X(s, t)} peut être défini comme X(s, t) = H−1(F(s,t)(X(s, t))), s ∈ S, t ∈ T , où H−1 correspond à la fonction inverse de la fonction de répartition de la Pareto

standard H, et F(s,t)est la fonction de répartition deX(s, t). Si X a des distributions marginales continues F(s,t), alorsX a des marginales Pareto standard. Pouran≡ n, bn≡ 0, la limite max-stable pourXdans (3.3) est un processus max-stable de marginales Fréchet standard (processus max-stable standard) Z={Z(s, t)}s∈S,t∈T ; voir de Haan & Ferreira (2006, Définition 9.2.4).

SiX est dans le domaine d’attraction d’un processus max-stable Z, on obtient la conver-gence des `-excès sur l’échelle standard :



u−1X(s, t)|`(X(s, t)) > u

⇒ {W(s, t)} , u → ∞, (3.4)

oùW(s, t) est un processus `-Pareto spatio-temporel standard comme dans la Définition 3.3.1 (Dom-bry & Ribatet, 2015, Théorème 3). Inversement, si la convergence dans (3.4) est vérifiée pour ` correspondant au maximum, alors nous avons la convergence dans (3.3) du processus max-stable X versZ.

3.3.3 Discussions de quelques points concernant la mise en pratique des

pro-cessus de Pareto

En pratique, les résultats asymptotiques présentés précédemment sont utilisés dans le cadre d’échantillons de taille finie. Certains choix doivent alors être faits et nous faisons, dans cette section, des propositions concernant trois problématiques. Des détails et compléments se trouvent dans l’article [G20] soumis pour publication en 2019, dont une version est présentée en annexe E de ce document.

Transformations marginales

Nous commençons par discuter les transformations marginales deX telles que X satisfasse (3.4). Les difficultés se posent souvent en pratique pour les petites valeurs. Par exemple, les faibles valeurs comme la valeur 0, qui arrivent avec une probabilité non négligeable dans notre étude correspondant alors à l’absence de pluie, doivent pouvoir correspondre également à un 0 pour le processus standardisé X (pour l’application, voir section 3.5).

D’une manière générale, nous faisons le choix de la distributionG :R → [0, 1] dont la fonction de survie ¯G vérifie : x ¯G(x) → 1, x → ∞, et ¯G(0) = 1 ; on note G pour l’inverse (généralisé) de G. On définit alors la transformation T = T(s,t) :R → [0, ∞) vers le processus standardisé X

comme suit :

X(s, t) = T (X(s, t)) = G(F(s,t)(X(s, t))) (3.5)

où F(s,t) :R → [0, 1] est la distribution of X(s, t). La transformation inverse de T peut alors se

définir comme T(f ) = F(s,t) (G(f )) pour f ∈ C+(S × T ), avec F

(s,t) l’inverse (généralisé) de F(s,t).

Concernant le choix de F(s,t), il est naturel d’utiliser un modèle de queue motivé par la théorie univariée des valeurs extrêmes dont la paramétrisation correspond directement à celle du processus de Pareto dans la définition 3.3.2. Pour un seuil u(s, t) élevé on suppose que

P(X(s, t) > x) = 1 − F(s,t)(x) =  1 + γ(s, t)x− µ(s, t) σ(s, t) −1/γ(s,t) + (3.6)

pourx > u(s, t), avec les fonctions paramètre de localisation µ(s, t) < u(s, t), d’échelle σ(s, t) > 0 et de formeγ(s, t), et tel que la partie droite de (3.6) est inférieure à 1 (Thibaud & Opitz, 2015). Pour les valeursX(s, t) inférieures à u(s, t), on peut utiliser la fonction de répartition empirique ou d’autres distributions satisfaisant le fait que la probabilité d’être inférieure àu(s, t) correspond à F(s,t)(u(s, t)) avec F(s,t) définie en (3.6).

En utilisant la standardisation dans (3.5), il vient que P(T (X(s, t)) > T (x)) ∼ 1

T(x) pour x

grand, et par conséquent nous avons P(T (X0(s, t)) > T (X(s, t)) | X(s, t) = x(s, t)) ∼ T(x(s,t))1 pour une copie indépendante X0 de X. Pour X(s, t) observé, la valeur de T (X(s, t)) peut être interprétée comme la période de retour (marginale) de l’observation X(s, t), et pour des quan-tiles élevés, on peut interpréter X comme le processus spatio-temporel des périodes de retour marginales.

Définition d’événements spatio-temporels extrêmes

Si notre objectif est de simuler des scénarios extrêmes spatio-temporels, il est impératif de définir ce qu’on entend alors par extrême. Il n’existe pas de définition unique de ce qu’est un événement extrême, c’est-à-dire de définition de la fonctionnelle de coût`. Cette dernière dépend plutôt de la nature du phénomène considéré, de l’ensemble de données ou encore de l’objectif de l’étude. Les connaissances d’experts peuvent suggérer comment mesurer la nature extrême d’un événement, où la question de savoir comment combiner les critères liés à la durée, l’étendue spatiale et l’ampleur est récurrente. Dans un cadre spatial et paramétrique, l’application sur les pluies en Floride proposée par De Fondeville & Davison (2018) et effectuée avec différentes fonctionnelles permet de considérer différents types de pluies (locales et intenses ou accumulation de pluies plus étalées dans l’espace). Les auteurs soulèvent également le problème de travailler sur des données transformées et les soucis d’interprétabilité que cela peut générer. Avec les données environnementales, nous n’avons souvent qu’une seule observation du processus spatio-temporel X, et les valeurs très élevées ont généralement tendance à se regrouper dans le temps et à former des clusters, des sous-périodes relativement courtes. Nous considérons ces sous-périodes comme des événements (ou épisodes) spatio-temporels extrêmes dont la force est quantifiée au moyen de

3.3. PROCESSUS DE PARETO SPATIO-TEMPORELS 51

la fonctionnelle de coût. En pratique, nous appliquons cette fonctionnelle à une large collection d’épisodes candidats pour en extraire les plus extrêmes. Notre algorithme d’extraction, détaillé en section 3.4.1 est conçu pour éviter l’intersection temporelle des épisodes extrêmes sélectionnés.

Nous utilisons l’idée de fenêtres spatio-temporelles glissantes et spécifions le support de la fonction de coût` introduite dans la section 3.3.1 comme un voisinageN (s, t) de la position s ∈ S et du temps t ∈ T . En pratique, la taille de la fenêtre définit la durée maximale et l’étendue spatiale des événements extrêmes. Ce voisinage pourrait être défini par une durée δ dans le temps, et le support spatial pourrait être la zone d’étude complète (dans ce cas on omettrait l’indice spatials) ou une sous-région telle que la zone littorale ou définie par une certaine distance autour d’un site spécifique s0. Pour indiquer le support local de la fonction de coût définie sur un voisinage de (s, t), nous utilisons la notation `s,t(X) = `({X(s0, t0), (s0, t0)∈ N (s, t)}).

On propose de définirN (s, t) comme le produit d’un voisinage spatial N (s) et d’un voisinage temporelN (t) (comme {t0 ∈ T | |t−t0| ≤ δ heures}), N (s, t) = N (s)×N (t). Des fonctionnelles de coût utiles` pour des épisodes spatio-temporels sont obtenues par composition d’une fonctionnelle spatiale `S avec une fonctionnelle temporelle `T, cette dernière s’appliquant aux valeurs de `S

observées sur δ pas de temps successifs :

`s,t(X) = `T(`Ss,t−(δ−1)(X), . . . , `Ss,t(X)), (3.7)

avec `S

s,t(X) = `S({X(s0, t)| s0∈ N (s)}) et δ la durée de l’épisode.

SiX satisfait la condition d’appartenance au domaine d’attraction fonctionnelle (3.3), alors

P(`(X) > u)∼ θ`/u, u→ ∞, (3.8)

oùθ`est le coefficient`-extrémal (voir Engelke et al. , 2019). Quand `s,tcorrespond au maximum spatio-temporel sur N (s, t) (i.e., `T = max et `S

s,t = max), le coefficient `-extrémal θ`s,t corres-pond au coefficient extrémal classique sur le domaineN (s, t) (voir Exemple 4 de Engelke et al. , 2019). Avec (s0, t0)∈ S × T un point spatio-temporel fixé, si l’on définit la fonctionnelle de coût `(X) comme X(s0, t0), alors on a θ`= 1. Par ailleurs, θ` est également égal à 1 si` correspond à la moyenne, c’est-à-dire si `s,t(x) = |N (s,t)|1 R

N (s,t)x(s0, t0) d(s0, t0) ; voir Ferreira et al. (2012, Proposition 2.2).

Comme expliqué précédemment, il est possible d’interpréter X comme le processus spatio-temporel des périodes de retour marginales. La fonctionnelle de coût ` vient alors agréger ces périodes de retour marginales X(s, t).

Par ailleurs, en utilisant (3.8), on peut approximativement calculer des niveaux de retour pour des épisodes extrêmes caractérisés comme des excès de ` par rapport à un seuil élevé u. Comme P(`((X0)) > `(X) | X = x) ∼ θ`/`(x) pour des quantiles élevés de `(X) pour une copie indépendante X0 de X, on peut interpréter `(x)/θ` comme la période de retour d’un événement extrême x.

Vérification et analyse de la condition de stabilité asymptotique

La condition d’appartenance au domaine d’attraction d’un max-stable dans (3.3) est essen-tielle pour l’utilisation des processus de Pareto. En pratique, cela nécessite de pouvoir supposer être en situation de dépendance asymptotique, au moins pour des petites distances/petits écarts, dans l’espace et dans le temps. En pratique, il convient donc de vérifier qu’il est raisonnable de faire cette hypothèse de dépendance asymptotique. Plusieurs approches sont possibles. L’une d’entre elles, consiste à évaluer l’indépendance entre les quantités observées suivantes :`(X) et X/`(X). Une autre façon de faire, plus classique, consiste à étudier empiriquement les para-mètres de dépendance extrémale. Les coefficients extrémaux bivariés fournissent un résumé de la dépendance extrémale en fonction des distances dans l’espace et dans le temps en étant cal-culés par paires. Nous considérons d’abord la fonction coefficient extrémal dans l’espace θspa(h) pour mesurer la dépendance extrémale entre des sites séparés par la distance ||h|| à un instant donné, et ensuite la fonction de coefficient extrémal dans le temps θtim(k) pour mesurer la dé-pendance extrême pour un écart temporelk à un site donné. Nous estimons θspa(h) en utilisant les observations (X(s, ti), X(s + h, ti)), et nous estimons θtim(k) à partir des paires observées (maxs∈SX(s, ti), maxs∈SX(s, ti+ k)).

Certaines études empiriques menées sur des données climatiques montrent que la dépendance extrémale peut s’affaiblir quand la force de l’événement augmente c’est-à-dire en allant vers des valeurs de plus en plus extrêmes (Davison et al. , 2013; Thibaud et al. , 2013; Opitz et al. , 2015; Huser & Wadsworth, 2019; Le et al. , 2018; Tawn et al. , 2018). Il est alors possible que la force de la dépendance finisse par se stabiliser mais à des niveaux très élevés et non observés ou encore il est possible d’être dans la situation d’indépendance asymptotique. Avec des échantillons de taille finie, il faut reconnaitre que nous ne pouvons pas vérifier cela avec certitude mais simplement identifier ce qui peut sembler raisonnable.

3.4 Méthodologie proposée pour simuler des événements

spatio-temporels extrêmes

Dans cette section, nous décrivons l’algorithme pour l’extraction d’épisodes spatio-temporels extrêmes (section 3.4.1) ainsi que la procédure générale pour simuler de nouveaux scénarios spatio-temporels (section 3.4.2). Une interprétation probabiliste d’une telle procédure est donnée section 3.4.3. Dans la suite et sans perte de généralité, nous utilisons la même notation pour l’observation du processus X(s, t) et pour le processus stochastique lui-même.

3.4.1 Sélection d’épisodes extrêmes

L’algorithme 1 décrit la procédure d’extraction des épisodes extrêmes à partir des données standardisées X. Pour ce faire, il convient de fixer au préalable la fonctionnelle de coût`. Cette dernière quantifie la force d’un événement basé en s et t faisant intervenir son voisinageN (s, t) qu’il convient également de définir. Nous devons également choisir un seuilu pour cette fonction-nelle suffisamment élevé pour qu’il soit raisonnable de se baser sur les résultats asymptotiques

Documents relatifs