• Aucun résultat trouvé

2.3 Modèle spatial de max-mélange

2.3.5 Mise en œuvre du modèle

! .

En utilisant l’approximation (2.13), il découle que les paires de sites séparés par une distance ||h|| sont asymptotiquement dépendantes si la distance est inférieure à 2r et asymptotiquement indépendantes sinon.

Si2− θ(h) 6= 0, nous pouvons conclure que ¯χ(h, q)→ 1 quand q → 1. Dans la situation où 2− θ(h) = 0, nous montrons que ¯χ(h, q)→ 2η(h) − 1 quand q → 1. Se basant sur (2.13), nous pouvons résumer les résultats de la façon suivante

¯

χ(h) = 1I[0,2r)(||h||) + (2η(h) − 1)1I[2r,∞)(||h||),

mettant en évidence les comportements différents selon les distances entre deux sites. SoitR > 2r et supposant que η(h) = 1/2 pour ||h|| > R, alors les paires de sites distants de ||h|| sont asymptotiquement dépendantes pour ||h|| < 2r, asymptotiquement indépendantes pour 2r ≤ ||h|| ≤ R et indépendantes pour ||h|| > R. Par exemple, pour le processus gaussien stationnaire transformé de marges Fréchet standard et de corrélation ρY(h), nous avons

¯

χ(h) = 1I[0,2r)(||h||) + ρY(h)1I[2r,∞)(||h||).

Dans ce cas, si la fonction de corrélation ρY(·) est telle que ρY(h) = 0 quand ||h|| > R, nous sommes pour les grandes distances en situation d’indépendance stricte.

2.3.5 Mise en œuvre du modèle

Pour estimer les paramètres du modèle, nous avons utilisé une approche par vraisemblance composite par paires (Lindsay, 1988; Varin, 2008). Padoan et al. (2010) ont utilisé cette approche dans le cadre de processus max-stables spatiaux s’appuyant sur les densités bivariées associées. Cette approche peut également s’utiliser à partir des densités bivariées des dépassements au-dessus d’un seuil élevé (Jeon & Smith, 2012; Wadsworth & Tawn, 2012; Bacro & Gaetan, 2014; Huser & Davison, 2014). En particulier, Wadsworth & Tawn (2012) proposent dans un cadre d’indépendance asymptotique de modéliser les dépassements au-delà d’un seuil suffisamment élevé en utilisant la densité du modèle pour peu qu’au moins l’une des deux composantes dépasse le seuil - et de censurer dans le cas contraire. Très récemment, Ahmed et al. (2017, 2019) ont travaillé sur ce modèle et se sont intéressés à d’autres méthodes d’estimation, notamment une approche par moindres carrés basée sur le F -madogramme.

Dans une étude de simulation (voir [G7] pour plus de détails), nous avons illustré la capacité de cette approche à estimer correctement les paramètres du modèle MM (2.16) en considérant un TEG comme processus max-stable et un processus gaussien, transformé pour avoir des marginales Fréchet standard, avec fonction de corrélation sphérique, comme processus asymptotiquement indépendant.

Il est également important de noter que dans le cas de l’utilisation d’une vraisemblance composite, Varin & Vidoni (2005) ont proposé un critère de sélection de modèle qui est en fait le

pendant du critère AIC dans le cadre de vraisemblance complète. Il s’agit du CLIC (Composite Likelihood Information Criterion). Dans une étude de simulations, également décrite en détail dans [G7], l’identification du vrai modèle entre le modèle MM (2.16) et ses deux composantes par le CLIC donne des résultats particulièrement performants. Très récemment, également dans un contexte de vraisemblance composite, Abu-Awwad et al. (2019) proposent deux tests statistiques pour le paramètre de mélange β∈ (0, 1).

Le modèle proposé a également été mis en œuvre sur les données d’Australie présentées en section 2.3.1. Il s’agit de cumuls journaliers de pluies enregistrés entre 1955 et 2003 en 31 sites (Figure 2.1). L’étude exploratoire de la dépendance extrémale (voir 2.2) suggère, comme discuté en section 2.3.1, différents types de dépendance extrémale en fonction des distances entre les sites. Un modèle max-mélange tel que proposé semble tout à fait adapté, nous laissant également la possibilité de comparer différents modèles à l’aide du CLIC. Nous avons donc mené une étude assez complète en deux parties, la première avec une inférence sur les maxima annuels (période avril-septembre) et la seconde avec une inférence sur les dépassements. Trois catégories de modèles ont été comparées : le modèle MM et ses deux composantes prises seules. Autrement dit, nous avons cherché à comparer un modèle max-mélange, un modèle max-stable TEG et un modèle asymptotiquement indépendant. Pour la composante asymptotiquement indépendante, plusieurs modèles ont été considérés également : processus gaussien transformé avec deux types de fonctions de corrélation (exponentielle et sphérique) et processus inverse TEG. Les modèles ont été comparés à l’aide du CLIC.

Nous avons sélectionné un modèle de chaque catégorie et je reprends ici les notations de l’article [G7] par souci de cohérence. A2 est un modèle max-mélange avec β 6= 0, B est un modèle TEG etC3 un modèle asymptotiquement indépendant (plus précisément c’est un inverse TEG). Afin d’illustrer le comportement de ces modèles et de vérifier leur ajustement, nous avons considéré certaines probabilités conditionnelles (calculées empiriquement sur la base de simulations). Le site s1 se trouve dans le coin supérieur droit de la carte (voir Figure 2.1) et est considéré comme le site de référence. De plus, nous considérons trois sous-ensembles de sites S1 = {s2, s3, s6, s8, s10}, S2 = {s11, s13, s14, s15, s18} et S3 = {s25, s26, s27, s28, s29} qui correspondent à 3 classes de distances par rapport à s1. Nous calculons alors les probabilités conditionnelles P(Z(s) > z, s ∈ Si | Z(s1) > z), i = 1, 2, 3 pour différentes grandes valeurs de p telles que P(Z(s1)≤ z) = p avec p compris entre 0.86 et 0.996. Quand les autres modèles sous-estiment ou sursous-estiment les probabilités empiriques pour certains seuils et certaines classes de distance, l’ajustement du modèle MM A2 (colonne 1 sur la Figure 2.3) donne de bons résultats pour différents seuils et toutes classes de distances. Ces résultats indiquent que le modèle de max-mélange tel que proposé ajoute une flexibilité de modélisation à l’analyse spatiale extrême et semble pouvoir englober différents degrés de dépendance spatiale extrême. De nouveau, le lecteur intéressé trouvera des compléments et précisions dans l’article correspondant [G7] également présent en annexe A partie III de ce document.

2.3. MODÈLE SPATIAL DE MAX-MÉLANGE 33 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.05 0.10 0.15 0.20 0.25 A2 −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.05 0.10 0.15 0.20 0.25 B −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.05 0.10 0.15 0.20 0.25 C3 −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.05 0.10 0.15 A2 −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.05 0.10 0.15 B −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.05 0.10 0.15 C3 −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.02 0.04 0.06 0.08 0.10 0.12 A2 −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.02 0.04 0.06 0.08 0.10 0.12 B −log(1−p)

Cond. Exc. Prob

. 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 0.00 0.02 0.04 0.06 0.08 0.10 0.12 C3 −log(1−p)

Cond. Exc. Prob

.

Figure 2.3 – Données journalières hivernales : valeurs empiriques et selon le modèle (avec paramètres estimés) des probabilités conditionnelles P(Z(s) > z, s ∈ S | Z(s1) > z). Les 3 colonnes correspondent aux modèles A2 (max-mélange), B (max-stable) et C3 (asymptotique-ment indépendant). Ligne du haut : S = S1 (sites proches) ; ligne du milieu S = S2 (sites à distances intermédiaires) ; ligne du bas :S = S3 (sites éloignés). Les valeurs1− p sont telles que P(Z(s1) > z) = 1− p.

2.4 Modèle asymptotiquement indépendant dans l’espace et dans

le temps

2.4.1 Présentation des données et motivation

Dans cette section, nous nous intéressons à la modélisation de données horaires de précipita-tion mesurées en50 stations dans le sud de la France (voir Figure 2.4). L’objectif est de proposer un modèle statistique spatio-temporel, physiquement interprétable, pour les dépassements, et qui soit capable de capturer les dépendances complexes et les dynamiques temporelles présentes dans les données.

Les résultats des analyses exploratoires de la dépendance extrémale présente dans ces données sont présentés en Figure 2.5. Plus précisément on y trouve les estimations deχ(q) et de χ(q) pour des probabilités q = 0.99, 0.995. Cela a été effectué pour des paires en prenant simplement en compte une distance spatiale puis pour des paires en prenant cette fois-ci uniquement en compte un écart temporel. Les intervalles de confiance sont obtenus par une procédure bootstrap. Le fait que quand q augmente, χ(q) semble aller vers 0 indique que faire l’hypothèse d’une situation d’indépendance asymptotique est raisonnable que ce soit dans le cas spatial ou temporel. Par ailleurs les graphiques du χ(q) font état d’une dépendance résiduelle strictement positive, du moins jusqu’à une certaine distance et un certain écart temporel.

Figure 2.4 – Localisations géographiques des 50 stations météorologiques dans le sud-est fran-çais.

Quelques modèles pour extrêmes ont été proposés dans un cadre spatio-temporel. Sans être exhaustive, on peut citer les travaux de Davis et al. (2013a,b) qui étendent les processus max-stables de Brown-Resnick à un cadre spatio-temporel et proposent une inférence par vraisem-blance par paires. Les processus max-stables TEG rappelés et utilisés dans la modélisation pro-posée en section 2.3 ont été généralisés dans une version spatio-temporelle par Huser & Davison (2014) et mis en œuvre sur des données horaires de précipitations. Ces derniers modélisent les tempêtes par des disques de rayon aléatoire, se déplaçant à une vitesse aléatoire pendant une durée aléatoire, s’appuyant donc sur des cylindres spatio-temporels. Le modèle proposé dans

Documents relatifs