• Aucun résultat trouvé

3.3 Sur la détermination de l’indice local

3.3.2 Choix de λ

Pour le site i, le seuil statistique ui correspond à une occurrence annuelle moyenne λ des tempêtes. Ainsi, la détermination de l’indice local est équivalente à la sélection de λ. La littérature scientifique apporte plusieurs éléments de réflexion quant au choix du seuil dans le cadre d’une approche POT, sans toutefois fournir une réponse universelle. Ce choix est souvent le résultat d’un compromis biais/variance des estimations des quantiles extrêmes. En effet, en augmentant le seuil, la variabilité des estimations s’accroît, car moins de données sont utilisées pour ajuster la loi GPD ; cependant, le biais se réduit car le domaine de validité de la GPD est plus susceptible d’être atteint. À l’inverse, en diminuant le seuil, l’hypothèse d’une loiGPD pour les dépassements correspondants étant moins plausible, les estimations peuvent être plus biaisées, même si la variabilité se réduit.

Ainsi, plusieurs outils ont été développés pour déterminer un seuil au-delà duquel la loi

GPD est une hypothèse convenable, comme par exemple le mean excess plot, ou encore la

recherche d’une zone de stabilité des paramètres estimés de laGPD [22]. En raisonnant en termes d’occurrence annuelle moyenne λ des extrêmes, [87] conseillent, pour une analyse statistique locale menée dans le cadre des aléas maritimes, d’utiliser des valeurs λ comprises

entre 2 et 5, représentant selon eux un compromis biais/variance acceptable.

Ces considérations sont valables pour une analyse statistique locale des extrêmes, où généralement la durée d’observation est trop faible pour se permettre d’utiliser des valeurs

λ trop petites (ce qui conduirait à des échantillons de trop petite taille pour estimer con-

venablement la loi GPD). Cependant, dans le cas d’une analyse régionale, [10] ont utilisé

λ = 1. Ce choix est justifié par le fait qu’en regroupant les données de plusieurs sites, il

devient possible de se focaliser sur les observations les plus extrêmes, sans pour autant obtenir une forte variabilité dans les estimations finales.

Par ailleurs, pour une analyse régionale, la durée effective régionale Deffdevient également un critère à prendre en compte pour le choix de λ. En effet, un intérêt de l’analyse régionale est de substituer les durées locales d’observation par une durée effective régionale plus importante, pour réduire les incertitudes sur les extrêmes estimés. Ainsi, si Deff varie avec λ, λ devrait être choisi de façon à correspondre à une durée effective régionale Deff maximale.

Dans ce manuscrit, λ est déterminé à partir par une analyse de sensibilité des résultats issus de différentes analyses régionales sur les observations de surcotes de pleine mer de 29 sites situés dans la zone Golfe de Gascogne et Manche (figure 3.12, ce qui correspondra à la région 1 obtenue dans le chapitre 4). En particulier, λ est choisi pour garantir à la fois une estimation stable de la loiGPD régionale et une durée effective régionale suffisante. La méthode du pooling, décrite dans le chapitre 1, est ici utilisée. En faisant varier l’occurrence annuelle moyenne λ des extrêmes entre 0.25 et 7, un nouvel échantillon ré- gional est obtenu en regroupant les observations normalisées par les seuils locaux cor- respondant à λ. Notamment, pour une valeur fixée de λ, les seuils locaux ne sont pas déterminés en extrayant les tempêtes de surcotes de pleine mer selon la méthode de la section 3.3.1, pour des raisons de temps de calcul, mais en utilisant une procédure sim- ilaire à celle utilisée par [6, 10] : les seuils sont déterminés indépendamment d’un site à l’autre, en imposant une durée minimale de 72 h entre 2 événements de tempête en chaque site. Un filtre spatial est ensuite appliqué sur les extrêmes normalisés par ces seuils, en ne retenant que l’observation normalisée maximale parmi celles apparues en moins de 72 h dans la région. L’échantillon régional est constitué de ces observations normalisées maxi- males. Une loi régionaleGPD(1, γ, k) est ensuite estimée par maximum de vraisemblance à partir de l’échantillon régional (équation 3.3). Les durées effectives régionales Deff cor- respondantes à chacun des échantillons régionaux paramétrés par λ sont estimées avec la formule Deff= n/λ, issue du modèle de dépendance développé dans le chapitre 5, où n est le nombre de tempêtes de surcotes de pleine mer observées dans la région.

La figure 3.13 montre l’évolution du paramètre de forme k de la loi GPD régionale, en fonction de λ. Ces estimations semblent instables pour les valeurs λ > 4. Ceci peut

3.3 SUR LA DÉTERMINATION DE L’INDICE LOCAL 47

Figure 3.12: Localisation des 29 sites (surcotes de pleine mer) illustrant le choix de λ.

refléter un biais dû à l’utilisation de trop d’observations non suffisamment extrêmes, ce qui remettrait en cause la validité de la loi GPD. À l’inverse, les incertitudes deviennent élevées pour λ < 1. Concernant la surcote de pleine mer millénale locale moyenne, les estimations sont instables jusqu’à λ > 1, et les incertitudes augmentent si λ < 1. La valeur λ = 1 semble représenter le meilleur compromis biais-variance.

La figure 3.14 montre l’évolution de la durée effective régionale Deff, en fonction de λ. Deff semble aussi diminuer quand λ augmente. Par exemple, si λ = 5, Deff= 325 ans, si λ = 1,

Deff= 451 ans et si λ = 0.25, Deff= 556 ans. Ceci peut s’expliquer par le fait que quand

λ augmente (autrement dit, quand les seuils diminuent), la redondance de l’information

régionale augmente, les tempêtes de surcotes de pleine mer ayant notamment tendance à impacter davantage de sites. Cela se confirme en étudiant l’évolution du pourcentage de réduction de la taille de l’échantillon régional (dont la taille correspond au nombre de tempêtes observées) après application du filtre spatial sur 3 jours, qui augmente avec λ. Par exemple, l’échantillon régional est réduit d’environ 68% pour λ = 5, contre 55% pour

λ = 1, et 45% pour λ = 0.25, après filtrage de la dépendance spatiale.

Le choix de λ repose donc sur un compromis entre une estimation fiable de la loi régionale sans trop d’incertitudes (correspondant ainsi des valeurs de λ plutôt élevées) et une durée

Figure 3.13: Estimation du paramètre de forme de la loiGPD régionale en fonction de λ (gauche) et estimation de la surcote de pleine mer millénale locale moyenne en fonction de λ (droite). Les intervalles de confiance à 95% correspondants sont obtenus par la delta-méthode.

Figure 3.14: Estimation de la durée effective régionale en fonction de λ (gauche) et pour- centage de réduction de la taille de l’échantillon régional après application du filtre spatial en fonction de λ (droite).

effective régionale associée suffisante (correspondant à des valeurs de λ plutôt faibles). La valeur λ = 1 semble représenter le meilleur compromis. Les arguments de [10] sur le choix

3.4 SUR LA RÉPARTITION SPATIALE DES INDICES LOCAUX 49

λ = 1 sont ici vérifiés : l’analyse régionale permet de se concentrer sur la partie haute de

la distribution, autorisant ainsi des valeurs de λ plus petites que pour des analyses locales, sans pour autant y associer trop d’incertitudes sur les estimations. La valeur λ = 1 est donc retenue dans ce manuscrit pour définir les seuils statistiques (et donc les indices locaux).

Le choix λ = 1 pourrait laisser supposer que les résultats obtenus seront sensiblement similaires à ceux issus d’un échantillonnage par maxima annuels. Cependant, le cadre des tempêtes permet de représenter la simultanéité des extrêmes à l’échelle de l’événement météorologique, et non à l’échelle de l’année, conduisant à des résultats plus physiquement interprétables.

Par ailleurs, dans le chapitre 5, la durée effective régionale de ces 29 sites sera estimée à 517 ans, contre 451 ici (pour λ = 1). Cette différence est due à la méthode utilisée pour extraire les tempêtes de surcotes de pleine mer. En effet, le filtre spatial de ce paragraphe extrait 451 tempêtes, contre 517 avec la méthode présentée dans la section 3.2. En particulier, le filtre spatial ne permet pas de distinguer plusieurs tempêtes survenant simultanément en différents endroits de la région, alors que la nouvelle méthode d’extraction permet de prendre naturellement en compte ce cas.