• Aucun résultat trouvé

Les limites de la théorie des valeurs extrêmes

6.4 Processus hydrologiques et chaos : un exemple

7.1.2 Les limites de la théorie des valeurs extrêmes

 1 −k(x − a) b 1/k# b>0 (7.1)

La valeur du paramètre k détermine le type de loi. Pour k < 0 on retrouve l’expression de la fonction de répartition de la loi de Fréchet (EV de type II). De même pour k > 0 on retrouve la fonction de répartition de la loi de Weibull (EV de type III). Enfin, la limite de la fonction de répartition de la loi de Jenkinson lorsque k tend vers 0 est la fonction de répartition de la loi de Gumbel (EV de type I).

Gumbel a très largement contribué par ses travaux à la vulgarisation et à la diffusion de cette jeune théorie des valeurs extrêmes (Gumbel, 1958), en particulier en hydrologie (Gumbel, 1941). Selon lui, dans la mesure où l’on s’intéresse à la loi de probabilité de débits de pointe de crues, qui constituent les valeurs maximales de séries généralement annuelles de débits, il est légitime de penser qu’elle est de l’un des trois types présentés ci-dessus. Sur des séries de débits observés4, le calage d’une loi EV de type I, choisie pour sa simplicité puisque sa fonction de répartition peut-être définie par deux paramètres (anet bn, k étant nul), semble souvent conduire à des résultats tout à fait acceptables et conforte le point de vue de Gumbel. Or, il est nécessaire de garder à l’esprit le caractère asymptotique de la théorie des valeurs extrêmes : les lois des valeurs extrêmes (Gumbel, Fréchet et Weibull) sont des candidats privilégiés pour la modélisation des valeurs maximales d’un échantillon (Embrechts et al., 2001), mais rien ne garantit en général, compte tenu des effectifs des échantillons et des gammes de probabilités considérées dans les applications hydrologiques, que cette loi des valeurs maximales sera valablement approchée par une loi de l’un des trois types extrêmes.

7.1.2 Les limites de la théorie des valeurs extrêmes

L’article de Gumbel de 1941 présente une méthode d’analyse statistique des débits de crues telle qu’elle est encore bien souvent pratiquée aujourd’hui (Miquel, 1984). La motivation

4

Le Rhône à Lyon sur la période 1826-1936 et le Mississipi à Vicksburg sur la période 1890-1939 dans l’article de Gumbel de 1941, et de nombreuses applications depuis.

initiale affichée du calage d’une loi de probabilité théorique était l’interpolation (i.e. le lissage) de la fonction de répartition empirique des débits observés. Mais les fondements théoriques du choix de cette loi semblent justifier, aux yeux de Gumbel, son utilisation en extrapolation : pour l’estimation de débits de période de retour d’un ordre de grandeur comparable, voire supérieur à la durée de la série observée.

Cet argument est séduisant, mais passe sous silence un volet important de la théorie des valeurs extrêmes. Les trois types de lois présentés plus haut sont asymptotiques. La vitesse de convergence vers cette asymptote dépend de la loi des Xi : elle peut être extrêmement faible !

Si elle n’est pas dégénérée, la loi du maximum de n variables aléatoires Xi pourra être assimilée à une loi de l’un des trois types, ce qui revient aussi à dire qu’au-delà d’une certaine probabilité ou période de retour T , la fonction de répartition des Xi est très proche de celle d’une loi de l’un des trois types.

Mais les valeurs de n ou de T correspondantes peuvent être élevées. A titre d’exemple, la figure 7.1 présente les fonctions de répartition d’une loi exponentielle de moyenne 1 et d’une loi normale centrée réduite sur un “papier de Gumbel”, les deux lois appartenant au domaine d’attraction de la loi de Gumbel. On ne porte pas directement G(x) = P (X < x) sur l’axe des abscisses mais − log(− log G(x)). Sur ce papier (i.e. avec ce type d’échelle), la fonction de répartition de la loi de Gumbel apparaît linéaire. On constate que la loi exponentielle converge rapidement vers la loi de Gumbel : au-delà d’une période de retour de 3 valeurs (− log(− log G(x)) = 1), elle peut être approchée par une droite. En revanche, la convergence de la loi normale est extrêmement lente, ce qu’avaient déjà signalé Fischer et Tippett (1928). La fonction de répartition de la loi Normale apparaît encore nettement concave sur papier de Gumbel pour des périodes de retour dépassant le million de valeurs. Des essais numériques confirment cette impression visuelle. La moyenne et la variance de la loi des valeurs extrêmes de type I sont respectivement égales à la constante d’Euler γ = 0.5772 et à π2/6 = 1.645. Dans le cas de la loi exponentielle, an et bn ont pour expression (Leadbetter et al., 1983) :

an = 1 bn = log(n)

Et dans le cas de la loi Normale centrée réduite : an = (2 log(n))1/2

bn = (2 log(n))1/21

2(2 log(n))

7.1 Les hydrologues sont-ils bien raisonnables ? 125

Loi exponentielle de moyenne 1 Loi normale N (0, 1)

Fig. 7.1 – Fonctions de répartition de la loi exponentielle et de la loi Normale sur “papier de Gumbel”. A titre indicatif −log(−log(x)) = 1 est équivalent à T = 3, −log(−log(x)) = 4 est équivalent à T = 50, −log(−log(x)) = 7 signifie T = 1000, −log(−log(x)) = 14 signifie T = 1 million

Mn étant le maximum de n variables, la moyenne et la variance de an(Mn− bn), n étant égal à 100, estimés à partir de 20 000 simulations sont respectivement égales à 0.577 et 1.63 dans le cas de la loi exponentielle et à 0.42 et 1.71 dans le cas de la loi normale. Pour n = 1000, ces valeurs estimées sont de 0.45 et 1.71 pour la loi Normale. Elles convergent donc extrêmement lentement vers les valeurs correspondant à la loi de Gumbel.

Bouleau (1991) souligne un autre point qui révèle bien le caractère asymptotique de la théorie des valeurs extrêmes : les trois types de lois sont incompatibles avec des transfor-mations non linéaires. Ainsi, considérons Yiet Xi = F (Yi), F étant une fonction strictement croissante.

Mn= maxi=1,..,n(Xi) est alors nécessairement égal à F (Mn0), en notant Mn0 = maxi=1,..,n(Yi). Si au delà d’une certaine valeur n, la loi de probabilité de an(Mn0 − bn) = M0, c’est-à-dire la loi de an(F−1(Mn) − bn), peut être assimilée à l’une des lois des trois types, la loi de F (M0/an+ bn), autrement dit la loi de Mn, n’a généralement pas une densité de proba-bilité correspondant à l’un des types de lois de valeurs extrêmes. Les distributions de Mn et de Mn0 ne sont jamais exactement égales aux distributions des GEV, et les vitesses de convergence de Mn et de Mn0 vers leurs lois asymptotiques, qui n’ont d’ailleurs aucune raison d’appartenir au même type, peuvent être très différentes.

Les variables environnementales cumuls pluviométriques, volumes et débits de crues -sont le fruit de processus fortement non linéaires. Aucune certitude ne peut exister a priori sur les vitesses de convergence de leurs distributions vers celles des lois de valeurs extrêmes,

et donc sur la pertinence du choix d’une des lois des valeurs extrêmes pour interpoler ces distributions pour les faibles périodes de retour.

Poursuivons la réflexion sur les formes possibles des distributions des variables environ-nementales et plus particulièrement des débits de pointes de crues des cours d’eau en étudiant les relations qui existent entre ces distributions et celles des caractéristiques des pluies à l’origine des crues. La transformation pluie-débit est connue pour être fortement non linéaire.

7.2 Réflexions théoriques autour des distributions statistiques