• Aucun résultat trouvé

Paramétrisation de la loi régionale

6.2 Spécification et estimation de la loi régionale

6.2.1 Paramétrisation de la loi régionale

6.2.1.1 Stratégie de modélisation

L’idée de base pour capturer les effets de covariables sur la variabilité observée des extrêmes est de faire varier les paramètres de la loi régionale Fr selon, par exemple, la direction des tempêtes de vagues, ou la saison d’occurrence des tempêtes de surcotes de pleine mer. Sous sa forme la plus simple, Fr est uneGPD(1, γr, kr), où γr et kr sont respectivement des paramètres d’échelle et de forme (équation (3.3)). Compte tenu de la difficulté pour estimer kr, les effets de covariables seront uniquement inclus dans le paramètre d’échelle

γr. Pour ce faire, il est généralement distingué dans la littérature scientifique une approche “discrète” d’une approche “continue”.

L’approche “discrète” est analogue aux modèles de mélange. Le principe est d’homogénéiser les observations en les partitionnant selon les différentes modalités des covariables, et d’estimer une loi différente pour chaque sous-échantillon. Pour les hauteurs significatives de vagues extrêmes, [42] ont utilisé un modèle directionnel discret, et [95] un modèle saisonnier discret. Pour estimer les pluies extrêmes, [44] ont proposé un modèle discret via un échantillonnage en type de temps saisonniers. Par exemple, un modèle saisonnier discret pour les surcotes de pleine mer consisterait à estimer une loiGPD pour chacune des 4 saisons. Les quantiles de la loi inconditionnelle Fr sont ensuite estimés sur la base de l’ensemble des classes de covariables. Les inconvénients de cette approche sont i) un nom- bre final de paramètres possiblement élevé, et ii) l’absence de relations entre paramètres des différentes classes de covariables.

6.2 SPÉCIFICATION ET ESTIMATION DE LA LOI RÉGIONALE 131

covariables, par exemple avec des séries de Fourier ou des splines périodiques, pour assurer davantage de cohérence physique [69]. [88, 91] ont ainsi utilisé un modèle saisonnier continu pour l’analyse des maxima mensuels de niveaux marins et de hauteurs significatives de vagues. Un modèle directionnel continu pour les vagues a été proposé par [38, 66]. Bien que généralement plus parcimonieuse (il y a moins de paramètres à estimer) que l’approche “discrète”, l’approche “continue” présente des temps de calcul relativement élevés des quantiles inconditionnels, dû à l’absence d’expression explicite de la loi inconditionnelle (voir, e.g., la section 4.4 de [3]).

Dans ce manuscrit, une approche “mixte”, combinant les avantages des deux approches, est proposée. Le principe est i) d’homogénéiser les observations en les partitionnant selon les différentes modalités des covariables, et ii) d’estimer une loi différente pour chaque classe, et où il existe une variation lisse entre paramètres de classes voisines. Cette approche permet d’obtenir des modèles parcimonieux, avec une cohérence physique dans l’évolution des paramètres selon les covariables, ainsi qu’une évaluation simple des quantiles incon- ditionnels, tout en ayant une représentation explicite de Fr. Les notations suivantes sont utilisées :

• s est une tempête quelconque.

• Mr,sest l’observation de l’échantillon régional associée à la tempête s. Rappelons que pour une région homogène quelconque, l’échantillon régional, de loi Fr, est constitué des maxima régionaux normalisés de chaque tempête ayant impacté cette région (voir l’article de la section 5.1).

• c = 1, ..., C est une modalité des C covariables (dans le cas des vagues par exemple,

c peut représenter les flux d’ouest pour les C = 8 secteurs directionnels).

• δr,s est la covariable associée à la tempête s de la région r (par exemple dans le cas des vagues, δr,s = c si la tempête s ayant impacté la région r est de secteur directionnel c).

• Fr,c est la fonction de répartition de la variable aléatoire Mr,s| δr,s= c.

• pr,c = P(δr,s= c) est la probabilité que la covariable associée à la tempête s soit de modalité c.

Conditionnellement à la modalité c = 1, ..., C, la loi régionale est paramétrée de la façon suivante : Mr,s | δr,s= c ∼GPD(1, γr,c, kr) (6.1) où log(γr,c) = γr0+ γr1cos  Cc  + γ2rsin  Cc  (6.2)

avec γr0, γr1 et γr2 ∈ R. L’utilisation du logarithme permet de conserver la contrainte γr,c ≥ 0. Les effets de la covariable sont représentés par une fonction sinusoïdale (série de Fourier tronquée d’ordre 1), assurant une variation lisse entre paramètres de classes différentes. Par la formule des probabilités totales, la loi régionale inconditionnelle Fr s’écrit comme

un mélange de loisGPD : ∀y ≥ 1, Fr(y) = C X c=1 pr,cFr,c(y) (6.3)

En particulier, le niveau de retour régional inconditionnel T -ans, yr,T = Fr−11 −λT1 , est solution de : C X c=1 pr,cFr,c(y) = 1 − 1 λT (6.4)

où λ = 1 est l’occurrence annuelle moyenne des tempêtes en chaque site de la région.

Soit θr = (pr,1, ..., pr,C−1, γ0r, γr1, γr2, kr) les C + 3 paramètres de Fr intervenant dans les équations (6.1) à (6.3) (pr,C est déterminé par pr,C = 1 −

C−1 P c=1

pr,c). Ce modèle permet ainsi de faire varier l’intensité (via γr,c) et la fréquence (via pr,c) régionale des extrêmes, selon les covariables observées (saison ou direction des tempêtes).

Dans le cadre d’analyses statistiques locales, [33, 70, 92] proposent de moduler non seule- ment le paramètre d’échelle, mais aussi le seuil de la loiGPD selon les covariables. Cepen- dant, la borne inférieure du support de la loi régionale est, par construction, fixée à 1 : le seuil définissant les tempêtes n’est donc pas directement modélisable en fonction des covariables. Néanmoins, un modèle régional plus élaboré pourrait, par exemple, supposer une structure paramétrique pour les fréquences (pr,c)c=1,...,C.

6.2.1.2 Méthode d’estimation de la loi régionale

Les méthodes d’estimation du maximum de vraisemblance et desL-moments sont parmi les plus utilisées dans le cadre de la théorie des valeurs extrêmes. En particulier, l’estimateur du maximum de vraisemblance est réputé pour ses propriétés d’optimalité asymptotique [22]. La méthode desL-moments est quant à elle populaire du fait de sa simplicité de mise en œuvre et de ses bonnes performances pour des échantillons de petite taille [56]. Cepen- dant, la méthode des L-moments ne peut directement incorporer des covariables dans la procédure d’estimation, à la différence du maximum de vraisemblance [71]. Ainsi, le mod- èle des équations (6.1) à (6.3) convient particulièrement à une estimation par maximum de vraisemblance.

En particulier, [23] ont introduit l’estimation par maximum de vraisemblance pénalisé. Le principe est de combiner l’efficacité asymptotique du maximum de vraisemblance et la

6.2 SPÉCIFICATION ET ESTIMATION DE LA LOI RÉGIONALE 133

précision des L-moments pour des échantillons de petite taille. Dans le cas de Fr, cette

procédure pénalise des estimations élevées du paramètre de forme kr. Le maximum de

vraisemblance pénalisé est implémenté dans la fonctionfitgpd du package POT du logiciel statistique R [107].

Les paramètres γ0

r, γr1, γr2 et krdes équations (6.1) et (6.2) sont donc estimés par maximum de vraisemblance pénalisé. Les fréquences (pr,c)c=1,...,C intervenant dans l’équation (6.3) sont estimées par maximum de vraisemblance, comme la proportion observée des tempêtes ayant la modalité c parmi l’ensemble des tempêtes.