• Aucun résultat trouvé

Chapitre 14

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre 14"

Copied!
46
0
0

Texte intégral

(1)

Chapitre 14 – ANALYSE STATISTIQUE DES FLUX

14.1 Concepts et objectifs des modèles probabilistes 14.2 Les outils de la description statistique en hydrologie

14.2.1 Lois de probabilité des débits moyens annuels et mensuels 14.2.2 Analyse des structures des séries chronologiques en hydrologie 14.2.3 Les structures spatiales de phénomènes hydrologiques

14.3 Les modèles stochastiques des processus hydrologiques unidimensionnels 14.3.1 Les modèles à chronologie fixée

14.3.2 Les modélisations à seuil de débit fixé

14.4 Les modèles stochastiques des processus hydrologiques multidimensionnels 14.4.1 La modélisation des processus conjoints à 2 sites

14.4.2 Les modèles multisites 14.5 La description statistique des crues

14.5.1 Les méthodes des débits maximaux annuels 14.5.2 Les méthodes de dépassement de seuils 14.5.3 Les méthodes hydrométéorologiques

14.5.4 Portée et limites des méthodes d’estimation statistiques des crues Bibliographie

14.1 Introduction : concepts et objectifs des modèles probabilistes

L'hydrologie est une science d'observation des phénomènes naturels; elles se fondent essentiellement sur 1'interprétation des séries d'observation portant sur les phénomènes mesurables ou non, qui caractérisent le cycle de l'eau dans la nature. Ce sont notamment les mesures de précipitations, d'infiltration, de ruissellement, d'évaporation et de débits des cours d'eau qui fournissent 1'information de base de l'hydrologie. On conçoit donc que cette science soit tributaire des méthodes statistiques de traitement de séries chronologiques et des échantillons de données numériques.

Le calcul des probabilités fournit alors des modèles adéquats pour la description des processus hydrologiques. Ce n'est pas que les phénomènes en jeu soient régis par le hasard.

Le débit d'une rivière est sous la dépendance de facteurs divers parfaitement déterminés les uns fixes, comme l'étendue, 1a forme, la déclivité du bassin versant, la nature du sous-sol, le profil en long et en travers du lit, les autres variables, comme la végétation, les stocks en eau et en neige, les précipitations, la température, le vent, le degré hygrométrique de l'air etc.,, Une telle énumération n'est certes pas exhaustive. Ainsi ces facteurs sont en si grand nombre et leurs interactions si complexes qu'il semble vain d'espérer en connaître le mécanisme détaillé quels que soient l'importance de 1'information et le nombre d'observations recueillies.

Les résultats, c'est-à-dire les processus de débit apparaissent alors comme des réalisations de processus aléatoires.

(2)

D'un point de vue opérationnel, il ne s’agit pas de savoir si les phénomènes hydrologiques sont de nature intrinsèquement aléatoire ou déterministe, ce qui est un problème d'ordre philosophique, il s'agit de faire des prévisions en probabilité sur des phénomènes dont on ne peut appréhender directement le mécanisme. C'est E. Halphen (1945) qui, à propos de ses travaux en hydrologie pouvait affirmer "Les probabilités sont des mesures de 1'ignorance humain et la statistique est ce qui tient lieu de science aux ignorants que nous sommes".

·Dans la suite de ce chapitre nous traiterons uniquement des flux d'écoulement c'est-à- dire des séries chronologiques de débits des rivières. L'analyse statistique des précipitations est exposée dans le chapitre 3.

Les données hydrologiques, matériau de base de toute analyse statistique des débits d'un cours d'eau observés à un station donnée contrôlant un bassin versant donné, représentent généralement sous la forme de séquences x1, x2, …, xi, …, xn de n observations d'une grandeur hydrologique X bien définie. Selon l'échelle de temps à laquelle on se place, la définition de la variable X peut être adaptée à la description du comportement du cours d'eau en crue, en étiage ou en apports moyens. Ainsi pourra-t-on distinguer :

a) A l'échelle journalière : le débit moyen journalier ou le débit instantané observé à heure fixe;

b) A l'échelle mensuelle : les débits moyens mensuels, chaque mois pouvant donner lieu ou non à la définition d'une variable X spécifique. Dans le premier cas les xi sont des observations annuelles successives du même mois;

c) A l'échelle annuelle : une multiplicité d'indicateurs hydrologiques adaptés tels que : - le module (ou débit moyen annuel)

- le débit maximal annuel (généralement noté QM) : maximum instantané ou maximum des 365 débits moyens journaliers d'une année particulière

- le débit minimum annuel Qm

- le débit caractéristique de N jours (DCN) : atteint ou non dépassé pendant N jours chaque année, consécutifs ou non

- le débit moyen minimal de plusieurs jours (généralement 10 jours: Q10, parfois 20: Q20, sinon 30 jours: Q30) c'est-à-dire la moyenne mobile sur 10, 20 ou 30 jours consécutifs la plus faible de l'année

Une telle liste n'est certes pas exhaustive, nous en verrons des illustrations plus loin.

Notons également que l'information de base peut être constituée d'observations d'une variable X (X1, X2, … , Xj , … , Xk) multidimensionnelle dont chaque coordonnée Xj représente la grandeur relative à une station j d'un ensemble de k stations.

Décrire statistiquement de tels ensembles de données hydrologiques c'est les représenter par des caractéristiques globales synthétiques, de façon à mettre en évidence des traits de régime par comparaison avec d'autres données ou à dégager les fluctuations de telles années ou telles séries d'années particulières.

Rappel de quelques définitions et illustrations

Revenons au cas d'une variable hydrologique unidimensionnelle X. Soit la fréquence

(3)

expérimentale p d’un interval1e ]a,b] de valeurs de X calculé sur l’échantillon d’observations : x1, … , xi, … , xn,

𝑝 = 𝑟

𝑛 (14.1)

avec r, effectif de la classe, nombre d'observation de l'échantillon ou l'événement a < X < b a été observé. L’ensemble des observations de l'échantillon peut être reparti en k classes, recouvrant l'étendue de la variable étudiée. L'ensemble ordonné des classes, associées à leurs fréquences expérimentales représenté sur graphique, constitue le polygone de fréquence. La figure 14.1 montre un exemple de polygone de fréquence, celui des modules (débits moyens annuels) du Rhin à Bale de 1808 à 1960 exprimé ici en effectifs ri.

Dans le contexte probabiliste où on se place ici, l'échantillon est considéré comme tiré au hasard dans une population hypothétique de valeurs de X représentable par une loi statistique (fiche C). Par exemple étudions 1'ajustement de la loi normale à la distribution des modules du Rhin à Bale. Pour chaque intervalle [a,b] la probabilité:

𝑃(𝑎, 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥

𝑏 𝑎

= 1

𝜎√2𝜋∫ 𝑒𝑥𝑝 [−(𝑥 − 𝜇)2 2𝜎2 ] 𝑑𝑥

𝑏 𝑎

(14.2)

est estimée par la fréquence r/n d'une part, par la probabilité estimée 𝑃̅(𝑎, 𝑏) obtenue en remplaçant μ et σ2 par leur estimations m'1 et m2 d'autre part. Dans le cas du Rhin on a sur la période 1808-1960 :

m'1 = 1005 m3/s m2 = 127,5 m3/s

La figure (14.1) permet de comparer effectifs empiriques rj et "effectifs théoriques" νj

définis par les espérances mathématique 𝑛𝑃̅(𝑎𝑗, 𝑏𝑗) pour chaque classe ]aj,bj]. I1 est possible ici de vérifier l'ajustement par un test du χ2 (fiche A).

Dans le cas, fréquent en hydrologie, où l'échantillon est trop limité pour répartir les observations par classes d'effectifs rj suffisamment grands, on associe à chaque réalisation xi

de l'échantillon ordonné par valeurs croissantes de X, une fréquence de non dépassement estimée pi. Plusieurs méthodes d'estimation sont possibles pour les pi. Parmi les plus utilisées citons :

𝑝𝑖 = 1𝑖 (𝑛 + 1)⁄ (𝐹𝑜𝑟𝑚𝑢𝑙𝑒 𝑑𝑒 𝑊𝑒𝑖𝑏𝑢𝑙𝑙) (14.3) 𝑝𝑖= (𝑖 − 0,3) (𝑛 + 0,4) (𝐹𝑜𝑟𝑚𝑢𝑙𝑒 𝑑𝑒 𝐶ℎ𝑒𝑔𝑜𝑑𝑎𝑦𝑒𝑣) (14.4)⁄

𝑝𝑖 = (𝑖 − 0,5) 𝑛⁄ (𝐹𝑜𝑟𝑚𝑢𝑙𝑒 𝑑𝑒 𝐻𝑎𝑧𝑒𝑛) (14.5)

avec i nombre de réalisations de l'échantillon inférieure ou égales à xi*.

Le report graphique des pi* en fonction des xi* fournit une courbe de fréquence cumulée, estimation empirique de la fonction de répartition :

(4)

𝐹(𝑥𝑖) = ∫ 𝑓(𝑥)𝑑𝑥

𝑥𝑖

−∞

(14.6)

Cette méthode est intéressante lorsque, par un choix convenable d'échelle la fonction de répartition théorique ajustée peut être représentée par une droite. C'est le cas de la loi normale car la formule (14.6) peut s'écrire dans ce cas :

𝐹(𝑥𝑖) = 𝐺(𝑡𝑖) = 1

√2𝜋∫ 𝑒𝑥𝑝 [−𝑡2

2] 𝑑𝑡 (14.7)

𝑡𝑖

−∞

avec

𝑡𝑖 = (𝑥𝑖− 𝑢) 𝑢⁄ (14.8)

Si 1'échelle graphique des ordonnées par exemple est graduée en probabilités G(ti) suivant une échelle proportionnelle aux ti obtenue par la relation (14.6) indépendantes des paramètres μ et σ, une loi normale de paramètres μ et σ quelconques sera représentée par une droite d'équation (14.8). Le report des courbes de fréquences

Ligne manquante

comme de l'ajustement effectué par la loi théorique, cette vérification peut souvent être beaucoup p1us efficace et sensible qu'un test numérique comme le test du χ2 dont l’arbitraire du découpage en classes peut diminuer 1a puissance comme cela est souligné dans la fiche A.

La loi log-normale peut bénéficier d'une représentation graphique analogue puisque la relation linéaire (14.8) est simplement remplacée par une relation logarithmique:

𝑡𝑖 = [𝐿𝑜𝑔(𝑥− 𝑎) − 𝜇] 𝜎⁄ (14.9)

Si a est connu ou estimé, une échelle logarithmique des abcisses en Log (xi*-a) permet donc une représentation linéaire de la loi log-normale.

La figure 14.2 donne un exemp1e d'ajustement de la loi-normale aux débits mensuels de juin de la Loire à Blois observés de 1879 à 1973. Ici a est arbitrairement choisi égal à 0.

Les moyennes et variances empiriques des logarithmes figurent sur le graphique. Le χ2 calculé sur 10 classes d'amplitude égales en probabilité (c'est-à-dire te11e que νj = n/10) donne le résultat :

𝜒2 = ∑10

𝑛 (𝜈𝑗− 𝑛 10)

2 𝑗

= 7,0 (14.10)

valeur qui d'après une table du χ2 et pour 10 - 2 - 1 = 7 degrés de liberté, a presque 50 chances sur 100 d'être dépassée. Le résultat indique un bon ajustement conforté par la représentation graphique 14.2.

La figure 14.3 montre la répartitions saisonnière des différents quantiles xp de débits mensuels de la Garonne à Portet relatifs aux probabilités respectives p = 10 %, 25 %, 50 %, 75 % et 90 %. Rappelons qu'un quantile xp est défini à partir de la fonction de répartition F :

𝐹(𝑥𝑝) = 𝑝 (14.11)

(5)

Dans ce graphique les quantiles ont été estimés par ajustement de lois log-normales aux débits mensue1s de la période 1920-1959. Une telle représentation, qu'utilisent les anciens annuaires hydrologiques de la société hydrotechnique de France, permet une description particulièrement claire du régime moyen aussi bien que de la variabilité d'un cours d'eau : elle permet également de caractériser les fréquences d'occurrence saisonnières d'années particulières comme 1962 sur le graphique et dont l'étiage apparaît particulièrement sévère en été.

Remarques importantes

On devra se souvenir que remplacer une fréquence observée par une probabilité estimée va bien au-delà d'une simple description de données d'observation, c'est déjà un jugement prévisionnel sur ce que sera l'écoulement d'une rivière dans 1'avenir. Mais le passage de la fréquence à la probabilité n'est possible que sous des hypothèses précises dont le calcul des probabilités rend compte, notamment :

- 1'indépendance des réalisations successives (observations) de l'échantillon ;

- 1'appartenance de ces réalisations à une même population (caractérisée par 1a même loi F(x), en particulier invariante dans le temps). Les hypothèses peuvent être soumises à certaines vérifications mais les conclusions tirées de ces vérifications ne peuvent être complètement certaines. Il y a 1à une source d'incertitude importante inhérentes à tout traitement de données d'observation. I1 ne faut pas oublier que l'hydrologie n'est qu’une science d'observation dont les résultats sont essentiellement tributaires des ensembles de données, d’où l’importance des techniques statistiques. A cet égard le terme de loi statistique peut être fallacieux, on devrait plutôt parler de distribution statistique, car la notion de loi, en hydrologie physique notamment, implique 1'assurance d’une validité et d'une fiabilité que n’ont pas les distributions statistiques. I1 n'existe aucune connaissance physique a priori qui permette de nous assurer que telle distribution est la "vraie loi statistique" d'une variable aléatoire hydrologique, les choix effectués résultant seulement du plus ou moins bon ajustement aux observations. Les applications multiples et extensives de modèles probabilistes effectuées depuis longtemps ont toutefois permis de dégager certaines règles empiriques pour guider les choix, mais il ne faut jamais exclure la possibilité de choix erronés, source d'incertitudes que l'on appelle généra1ement erreurs d'adéquation.

14.2 Les outils de 1a description statistique en hydrologie

Dans le paragraphe (14.1) précédent nous avons introduit quelques principes et méthodes d'analyse statistiques illustrés sur des exemples hydrologiques. Les fiches annexes présentent de façon plus systématique un certain nombre d'outils généraux : lois statistiques (fiche C), krigeage (fiche F), méthodes multivariées (fiche G), analyse spectrale (fiche J). Le présent paragraphe est destiné à illustrer leurs applications à 1a représentation probabiliste des débits des rivières ainsi que leurs portées et limites. Le point de vue adopté ici est uniquement de descriptif ; leurs usages en liaison avec les objectifs opérationnels (prédétermination, prévision, simulation, transfert d'information) seront pris en compte dans les paragraphes suivants.

14.2.1 Lois de probabilité des débits moyens annuels et mensuels

La représentation probabiliste des débits moyens est un vieux problème en hydrologie

(6)

statistique mais le choix des lois théoriques reste toujours empirique après confrontation avec la distribution de fréquence des observations.

a) La loi normale : Bien que les polygones de fréquence soient souvent dissymétriques, contrairement à la forme de la densité de la loi normale, cette loi n'est pas systématiquement à rejeter. Les cas où elle peut s'appliquer concernent des débits moyens pris sur des périodes assez longues (les modules par exemple), des surfaces de bassin importantes (à régime climatique donné), des bassins dont certaines parties sont d’altitude élevée où les influences nivo-glaciaires apportent une certaine régularisation du régime. Les modules du Rhin à Bâle (figure 14.1) fournissent une bonne illustration de l'ajustement par la loi normale.

b) La loi log-normale ; Cette loi prend bien en compte la dissymétrie des polygones de fréquence des débits. On a déjà vu un exemple d'ajustement à des débit mensuel (Juin pour la Loire à Blois figure 14.2). Notons toutefois que l'estimation du troisième paramètre à savoir a (formule 14.8) peut s'avérer quelques fois difficile et fournir une valeur supérieure à des débits observés, ce qui est gênant pour une limite inférieure. Par ailleurs la décroissance souvent lente de la densité log normale pour les grandes valeurs du débit peut être en désaccord avec l'observation.

c) Les lois de Pearson et log-Pearson type III : Ces lois et notamment la loi log- Pearson III ont un statut quasi-officiel aux Etats-Unis parce qu'elles ont été recommandées par le Conseil des ressources en eau pour un emploi systématique. Plus spécialement réservées aux débits de crues (paragraphe 14.5.1) elles peuvent également s'appliquer aux débits moyens avec les méthodes d'estimation décrites dans la fiche C. Dans la mesure où elles dépendent de trois paramètres elles peuvent paraître s’adapter plus aisément aux diverses distributions de divers régimes hydrologique par la prise en compte du coefficient d'asymétrie CS en particulier. Toutefois on notera que, outre le paramètre α et le paramètre λ de comportement asymptotique pour les grands débits, le troisième paramètre m caractérise une limite inférieure ou supérieure dont l'estimation est délicate et qui n'a d'ailleurs pas d'interprétation hydrologique très claire.

d) Les lois d’Halphen : Les distributions théoriques précédentes, classiques en statistiques mathématiques ont été développées hors du champ de l'hydrologie où elles ont cependant trouvé des applications fructueuses. Il n'est pas sans intérêt de rappeler ici d'autres familles de distributions théoriques spécifiquement développées pour des besoins hydrologiques, les lois d’Halphen (Morlat, 1956). Les travaux d’Halphen (1941 à 1954) ont porté sur la recherche de lois destinées à représenter les débits mensuels de l'ensemble des rivières françaises. Les objectifs étaient d'obtenir des lois à trois paramètres (Pour représenter la diversité des régions possibles) avec une décroissance exponentielle pour les grands débits (comme la loi de Pearson) mais aussi pour les petits débit (afin d'éliminer le problème délicat de l'estimation d'une limite inférieure). Trois types de distributions d'Halphen ont ainsi été proposées :

- les lois du type A, de densité :

𝑓(𝑥) = 1

2𝜇𝐾𝑗(𝑎)𝑒𝑥𝑝 [−𝑎 2(𝑥

𝜇+𝜇

𝑥)] 𝑥𝛾−1 (14.13) où Kj(a) est la fonction de Bessel-Basset d'ordre j.

(7)

- les lois du type B, de densité :

𝑓(𝑥) = 2

𝜈2𝑒𝑓𝛼(𝑏)𝑒𝑥𝑝 [− (𝑥 𝜈)

2

+ 𝑏𝑥

𝜈] 𝑥2𝛼−1 (14.14)

où efα(b) est la fonction d'Hermitte.

- les lois du type B-1 telles que la variable inverse y = 1/x est distribuée selon une loi de type B.

Comme le système classique des lois de Pearson, les lois d'Halphen forment un ensemble complet de distributions repérables par deux paramètres, ici :

le coefficient de variation : Cv = m2 / m'1 et le paramètre : λ0 = (m1-mg) / m2

où mg est 1a moyenne géométrique dont le logarithme est égale à la moyenne des logarithmes des débits.

La figure 14.4 donne 1'abaque de correspondance entre ces paramètres de forme et les lois d'Halphen caractérisés par (a,γ) ou (b,α). Les paramètres μ et ν sont des paramètres d'échelle dont le Cv et le λ0 sont indépendants. Parmi les lois d'Halphen de type A, un rôle privilégié fut donné à la loi A0, pour x=0, dite loi harmonique, dont on trouvera un abaque (figure 14.5) permettant de calculer les probabilités en fonction de la variable réduite 𝑥=x/μ pour des valeurs d'un paramètre de dispersion relative exprimé soit par le Cv, soit par λ avec :

𝜆 = 𝑚1/ℎ

où h est la moyenne harmonique (dont 1'inverse est égale à la moyenne des inverses des débits) et le paramètre μ qui s'interprète comme la médiane de la distribution s'écrit:

μ = m1 h

Pour utiliser cette loi, il suffit donc d'estimer les paramètres λ et μ par les movennes arithmétiques et harmoniques empiriques m1 et h d’employer l'abaque avec la variable réduite x/μ.

Exemple

La figure (14.6) présente, avec une ordonnée en échelle normale et une abscisse en échelle logarithmique, 1'ajustement de la loi log-normale (avec a = 0) aux débits mensuels de septembre de la Loire à Blois.

Le χ2 (fiche A) calculé avec 10 classes d'amplitudes égales en probabilité est égal à:

𝜒2 = 15,2

ce qui pour 7 degrés de liberté est légèrement supérieur au seuil χ20,95 de signification du test pour un risque d'erreur de première espèce à 5%. D'ailleurs 1a vérification graphique (figure 14.6) montre un ajustement médiocre pour les grands et les petits débits (queues de distributions).

(8)

Pour cette série de données, les estimations des paramètres Cv et λ0 sont : 𝐶𝑣 = 0,72; 𝜆0 = 0,27

ce qui dans l'abaque (14.5) donne un point pratiquement sur 1a courbe représentative de la loi harmonique A0.

Par ailleurs, on a :

𝑚1 = 131,1 𝑚3𝑠−1; ℎ = 87,2 𝑚3𝑠−1 .

ce qui donne les estimations, d'après (14.17) et (14.18) : 𝜇 = 107,3 𝑚3𝑠−1; 𝜆 = 1,29

La loi harmonique ainsi ajustée a été tracée en utilisant l’abaque 14.5 sur le même système de coordonnées que la loi log-normale (figure 14.6). On constate que l'adéquation est sensiblement améliorée pour les grands et les petits débits, là où la loi log-normale présentait des déviations notables à la courbe des fréquences empiriques.

Dans la pratique hydrologique actuelle le problème du choix des lois du débit moyen est trop souvent considéré comme résolu. On utilise quasi systématiquement la loi log- normale ou quelquefois la loi de Pearson (paragraphe 14.3.1). Les travaux d’Halphen malgré leur ancienneté ont montré que ce choix pouvait ne pas être judicieux lorsqu'on examinait le comportement systématique d'un ensemble de stations. Après des débuts prometteurs, les utilisations hydrologiques des lois d’Halphen n’ont pas été poursuivies, par le manque de tables extensives de ces lois à l’époque. Les moyens de calcul modernes pourraient permettre de remettre à l’honneur les lois d’Halphen car elles comblaient, et elle comblent toujours, un manque dans la solution des débits moyens, problème trop rapidement supposé résolu actuellement (1).

14.2.2 Analyse des structures des séries chronologiques en hydrologie

Dans ce paragraphe nous nous attacherons non pas à décrire les distributions de probabilité précises de chaque variable chronologique datée X(t) mais surtout à caractériser les structures probabilistes des séries chronologique :

𝑋(𝑡0), 𝑋(𝑡0+ 𝛥𝑡), … , 𝑋(𝑡0+ 𝑖 𝛥𝑡), 𝑋(𝑡0+ (𝑖 + 1)𝛥𝑡) …

c'est-à-dire à dégager les différences et les interrelations entre les divers éléments successifs d'une telle séquence.

En hydrologie ces structures dépendent étroitement du pas de temps Δt : que celui-ci soit journalier, mensuel, annuel, les « corrélations » et « non-stationnarités » qui apparaîtront

1 La famille des distributions de Halphen a fait depuis l’écriture de ce chapitre l’objet de nouvelles études. On consultera en particulier l’ouvrage de Salaheddine El Adlouni et Bernard Bobée : Halphen Distribution Family with application in hydrological frequency analysis (2017) Water Resources Publications, LLC, Highlands Ranch, Colorado (USA).

(9)

auront des formes et des intensités différentes, caractéristiques de chaque échelle de temps.

Quelques définitions préalables sont nécessaires :

Pour tout ensemble d’époques (t1, t2, … , tn) on considère une collection de variables aléatoires généralement de même nature mais définies à des instants différents :

Ces variables possèdent pour chaque n, une distribution de probabilités conjointe : 𝐹𝑛(𝑥1, 𝑥2, … , 𝑥𝑛⁄𝑡1, 𝑡2, … , 𝑡𝑛) = 𝑃𝑟𝑜𝑏[𝑋1 ≤ 𝑥1 𝑒𝑡 𝑋2 ≤ 𝑥2 𝑒𝑡 … 𝑋𝑖 ≤ 𝑥𝑖 𝑒𝑡𝑐 … ] appelée loi temporelle du processus associée à sa densité de probabilité (14.19) :

𝑓𝑛(𝑥1, 𝑥2, … , 𝑥𝑛⁄𝑡1, 𝑡2, … , 𝑡𝑛) =𝜕𝑛𝐹𝑛(𝑥1, 𝑥2, … , 𝑥𝑛⁄𝑡1, 𝑡2, … , 𝑡𝑛)

𝜕𝑥1𝜕𝑥2… 𝜕𝑥𝑛 (14.20)

Les distributions sont caractérisées par : - Les moments du premier ordre (espérances)

𝑚1(𝑡) = 𝐸[𝑋(𝑡)] = ∫ 𝑥 𝑓1(𝑥, 𝑡) 𝑑𝑥 (14.21)

+∞

−∞

- Les moments du second ordre (variances et covariances) Les variances (ou moments centrés du second ordre)

𝑚2(𝑡) = 𝐸[[𝑋(𝑡) − 𝑚1(𝑡)]2] = ∫ [𝑥 − 𝑚1(𝑡)]2𝑓2(𝑥)𝑑𝑥

+∞

−∞

(14.22)

et pour tout couple t1,t2, la covariance (ou autocovariance)

𝛾𝑋𝑋(𝑡1, 𝑡2) = 𝐸[[𝑋(𝑡1) − 𝑚1(𝑡1)][𝑋(𝑡2) − 𝑚1(𝑡2)]]

= ∫ ∫ [𝑥1 − 𝑚1(𝑡1)][𝑥2− 𝑚1(𝑡2)]𝑓(𝑥1, 𝑥2⁄𝑡1, 𝑡2)𝑑𝑥1𝑑𝑥2

+∞

−∞

(14.23)

+∞

−∞

qui, normalisée, fournit le coefficient d'autocorrélation :

𝜌𝑋𝑋(𝑡1, 𝑡2) = 𝛾𝑋𝑋(𝑡1, 𝑡2) √𝑚⁄ 2(𝑡1) 𝑚2(𝑡2) (14.24)

On peut généraliser ces notions à des moments d'ordre r quelconques en prenant en compte des puissances jusqu’à l'ordre r de la variable et des produits (en nombre r) de variables x(ti) à des époques différentes ou identiques.

a) La stationnarité des processus hydroloqiques

Un processus stochastique est dit strictement stationnaire si sa loi temporelle (équation 14.24) ne varie pas lorsque toutes les époques t1, t2, … , tn sont translatées arbitrairement dans le temps et prises égales à t1 + T, t2 + T, … , tn + T (pour tout T). Une telle propriété est

(10)

difficile à vérifier en pratique. On se contente généralement de prendre en compte la stationnarité du second ordre relative au moment du premier et second ordre soit :

m1 ( t ) = m1 ( t + T )

m2 ( t ) = m2 ( t + T ) (14.25) γXX ( t1 , t2 ) = γXX ( t1 + T, t2 + T )

Les figures (14.7) et (14.8) illustrant les moyennes et écart-types empiriques des débits journalier de chaque jour calendaire estimés sur 46 ans à 1a station de Vieille Brioude sur l'Allier montrent à l'évidence le caractère non-stationnaire des processus hydrologiques à l'échelle journalière. La figure (14.3) donnant le quantile des lois normales ajustées sur des débits moyens de la Garonne à Portet est révélatrice des effets saisonniers, facteurs d’une non-stationnarité à l’échelle mensuelle. A l ‘échelle annuelle et au delà, les séries hydrologiques telles que les modules sont généralement supposées stationnaires; la vérification en est délicate compte tenu de l’information nécessairement limitée à cette échelle. En dehors des hétérogénéités dans les séries dues aux changements artificiels de l’environnement et qu’on peut détecter par les méthodes décrites au chapitre 15, des études ont quelquefois mis en doute cette stationnarité sur des résultats qui apparaissent non significatifs. A cet égard, on peut citer, surtout pour mettre en garde le lecteur, certains travaux apparaissant généralement après des catastrophes naturelles comme les grandes sécheresses, qui mettent en avant des changements cycliques à grande échelle dans les variables hydrologiques. Ces études reposent sur l’idée d’une représentation du processus X(t) sous la forme :

𝑋(𝑡) = ∑ 𝛼𝑖 𝑠𝑖𝑛2𝜋𝑡

𝜔𝑖 + 𝜀(𝑡) (14.26)

𝑖

où les composantes cycliques, prépondérantes vis-à-vis du résidu aléatoire ε(t), permettraient une prédiction à long terme des débits.

La recherche des périodicités (amplitude αi et périodicité ωi) peut-être basée sur l’analyse spectrale (voire plus loin) mais un procédé largement utilisé par les chercheurs de périodes a été la méthode des moyennes mobiles. Pour réduire l’effet des aléas et mettre en évidence les régularité dans une série x1, x2,…, xt, … , xn on remplace chaque valeur xt par une moyenne 𝑥̅ = ∑𝑡 𝑖=𝑡+𝑘𝑖=𝑡−𝑘𝑥𝑗⁄(2𝑘 + 1) calculée sur des valeurs voisines et centrées sur xt.

Les graphiques de la figure 14.9 extraits de Bernier (1965) montrent les courbes chronologiques de moyennes mobiles sur 5 et 10 ans calculées sur des relevés annuels sur 160 ans. Des cycles dont les périodes avoisinnent 10 ans et 40 ans apparaissent sur ses graphiques.

Or les données de base ne sont pas des valeurs hydrologiques réelles mais des nombres au hasard indépendants et stationnaires par construction. Ceci est une illustration de « l’effet Slutsky » du nom du mathématicien qui a démontré que certaines manipulations statistiques (telles que les moyennes mobiles) introduisaient nécessairement des périodicités fictives dans les séries. Aussi l’utilisation de ce type de méthodes peut être complètement fallacieuse.

b) La mémoire des processus hydrologiques

La mémoire d’un processus caratérise la dépendance probabiliste entre la réalisation

(11)

présente (à l'époque t) et les réalisations antérieures (antécédentes à t).

L'absence de mémoire est mathématiquement traduite par l’hypothèse d'indépendance exprimée par la condition suivante sur les fonctions de répartition du processus :

𝐹𝑛(𝑥1, 𝑥2, … , 𝑥𝑛⁄𝑡1, 𝑡2, … , 𝑡𝑛) = 𝐹1(𝑥1⁄ ). 𝐹𝑡1 1(𝑥2⁄ ). … . 𝐹𝑡2 1(𝑥𝑛⁄ ) (14.27) 𝑡𝑛 Cette hypothèse d’indépendance est généralement admise pour les variables hydrologiques annuelles (modules, débits maximaux ou minimaux annuels, etc…). C’est une hypothèse pratique et commode bien qu’en toute rigueur elle puisse être mise en doute quelquefois ; en effet :

- L'existence de mémoire à une échelle plus courte que l'année induit nécessairement une mémoire, mais d'intensité plus faible et souvent négligeable à l'échelle annuelle.

- Certains travaux semblent mettre en évidence une mémoire du très long terme (voir ci-après la description du phénomène de Hurst).

L'hypothèse de structure de dépendance la plus simple est l'hypothèse de Markov (fiche E). Traduite en mots elle s'énonce : la distribution de probabilité conditionnelle de x(t) :

𝑓(𝑥𝑛; 𝑡𝑛⁄𝑥1, … , 𝑥𝑛−1; 𝑡1, … , 𝑡𝑛−1)

à l’époque t=tn connaissant les états antérieurs, ne dépend effectivement que de la réalisation de X(t) à l’époque immédiatement antérieure à tn soit :

𝑓(𝑥𝑛; 𝑡𝑛⁄𝑥1, … , 𝑥𝑛−1; 𝑡1, … , 𝑡𝑛−1)= 𝑓(𝑥𝑛; 𝑡𝑛⁄𝑥𝑛−1; 𝑡𝑛−1) (14.28)

Nous verrons ultérieurement (paragraphe 14.3) des exemples de modèles linéaires markoviens.

Le coefficient d'autocorrélation ρxx (t , t-1) fonction uniquement de 1'écart de temps τ, si le processus est stationnaire, permet de mesurer 1'intensité de la mémoire du processus. Pour un tel procesus stationnaire l'estimation classique des coefficients d'autocorrélation ρk entre les variables xt et xt-k sur une séquence de réalisations observée à pas de temps constant est :

𝑟𝑘= ∑𝑛−𝑘𝑖=1 𝑥𝑖𝑥𝑖+𝑘− 1

𝑛 − 𝑘∑𝑛−𝑘𝑖=1 𝑥𝑖𝑛𝑖=𝑘+1𝑥𝑖

√[∑𝑛−𝑘𝑖=1 𝑥𝑖2− 1

𝑛 − 𝑘(∑𝑛−𝑘𝑖=1 𝑥𝑖)2] [∑𝑛𝑖=𝑘+1𝑥𝑖2− 1

𝑛 − 𝑘(∑𝑛𝑖=𝑘+1𝑥𝑖)2]

(14.29)

La fonction exprimant les variations de ρk (ou de son estimation rk) en fonction de k s'appelle autocorrélogramme (théorique ou estimé). La figure (14.10) montre à titre d'exemple l'autocorrélogramme estimée des débits moyens journaliers de l’Allier à Vieille Brioude. Pour eliminer autant que possible l'effet de la non-stationnarité des débits journaliers, le coefficient rk n’a pas été calculé directement sur les débits mais sur les débits journaliers centrés réduits xi obtenus en posant :

𝑥𝑖 = (𝑞𝑖 − 𝑞̅ ) 𝑠𝑖 ⁄ (14.30) 𝑖

où 𝑞̅𝑖 et si sont respectivement les moyenne et écart-type des débits qi de chaque jour calendaire sur les 46 années.

(12)

Une telle procédure implique l'hypothèse que la non-stationnarité ne joue pas sur les autocorrélations, hypothèse qui peut être mise en doute dans de nombreux cas (mais on verra ultérieurement des exemples au niveau de la modélisation des structures de débits mensuels).

L'hypothèse markovienne implique la propriété suivante pour les processus linéaires stationnaires (fiche E) :

𝜌𝑘 = 𝜌1𝑘 = 𝑒− 𝑎 𝑘 (14.31) avec

𝑎 = −𝐿𝑜𝑔 𝜌1

Il en résulte alors une décroisssnce exponentielle en fonction de k. L'allure des graphiques (14.10) montre que 1a décroissance du corrélogramme semble beaucoup plus lente que le prototype exponentiel ce qui traduit une structure de mémoire beaucoup plus complexe.

Il faut noter que, vis-à-vis de l'estimation du coefficient d'autocorrélation théorique ρk, rk est soumis à des erreurs d'échantillonnage assez grandes, notamment pour les valeurs élevées de k. La caractérisation de ces erreurs d'échantillonnage est en dehors du domaine de ce manuel. Nous renvoyons le lecteur soit à des ouvrages de statistique généraux tels que (Hannan, 1960) ou à des ouvrages spécialisés à l'hydrologie (Yevjevich, 1972) pour des détails sur ces problèmes importants.

Un autre moyen de caractériser 1a mémoire d'un processus hydrologique utilise 1'analyse spectrale. Etant donné un processus stationnaire de fonction d'autocorrélation ρXX(t) la fonction de densité spectrale (ou spectre) s'écrit :

𝑆𝑋𝑋(𝑓) = √𝑚2 ∫ 𝜌𝑋𝑋(𝑡) 𝑒−2 𝑖 𝜋 𝑓 𝑡𝑑𝑡

+∞

−∞

(14.32)

avec 𝑖 = √−1 dans cette formule, dont une méthode d’estimation générale est donnée par la formule :

𝐽𝑋𝑋

̅̅̅̅(𝑓) √𝑚⁄ 2 = 2 [1 + 2 ∑ 𝑟𝑋𝑋(𝑘) 𝑊(𝑘) cos 2 𝜋 𝑓 𝑘

𝐿−1

𝑘=1

] (14.33)

pour 0 ≤ f ≤ 1 / 2, où le nombre L et 1a "fenêtre de pas" W(k) sont choisis de façon à obtenir un compromis acceptable entre deux exigences contradictoires (un biais d’estimation faible et une variance d'échantillonnage faible). On trouvera dans la fiche J des détails sur le choix de L et de la fenêtre de pas.

Pour un processus périodique avec une période ω/2π équivalente à une fréquence f=2π/ω, le spectre présente généralement un pic à cette fréquence. Considérons par exemple le spectre des débits mensuels de 1a Dore à Giroux (figure 14.11). On remarque le pic très prononcé à la fréquence correspondante à la périodicité annuelle. Si on élimine ces périodicités, en utilisant par exemple des données dessainnalisées, homogénéisées par des transformations du type de la formule (14.35) le spectre peut donner des informations sur la

(13)

structure du processus et petaettrel 1a validation de certains modèles. La figure 14.11 illustre la comparaison entre spectre observé et spectre calculé dans une série simulée avec un modèle de Thomas-Fiering que nous verrons plus loin, pour ce qui concerne les débits mensuels de la Dore à Giroux.

Un autre exemple (figure 14.12) est celui des débits mensuels de la Sioule à Pont du Bouchet (Delleur, 1970) sur les données homogénéisées, centrées, réduites (formule 14.30) par rapport à leurs moyennes et écart-type de chaque mois. La décroissance du spectre est compatible avec l'allure du spectre théorique réultant d'un modèle linéaire markovien stationnaire :

𝑥𝑡− 𝜇 = 𝜌1(𝑥𝑡−1− 𝜇) + 𝜀𝑡 (14.34)

qui a pour spectre théorique :

𝑆𝑋𝑋(𝑓) = 𝜎2⁄1 + 𝜌12− 2 𝜌1cos 2𝜋𝑓 (14.35)

où σ2 est la variance du résidu εt, supposè être un "bruit blanc", c'est-à-dire un processus tel que les réalisations successives de ε sont indépendantes en probabilité.

Si généralement on peut, au moins théoriquement, ajuster des formules théoriques telles que (14.35) aux spectres estimés, les méthodes d'ajustement sont cependant délicates et l'analyse spectrale reste malgré tout un outil exploratoire ne permettant de mettre en évidence que 1es grandes lignes des processus de débits : périodicités, contribution des hautes fréquences pour des structures de mémoire complexes, contribution des basses fréquences pour 1a mémoire au long terme et les tendances (ainsi une tendance à la croissance ou à la décroissance se traduit-elle par une ordonnée à l'origine du spectre).

c) Analyse des mémoires au long terme (Le phénomène de Hurst)

Une méthodologie issue des travaux de Hurst (1951) et appliquée à l'étude des séquences d'indicateurs hydrologiques annuels a suscité certains doutes sur l'hypothèse d'indépendance pratiquement adoptée pour les modules, les débits de crue maximaux annuels etc…

Soit donc : x1, x2, … , xn une séquence de réalisations chronologiques de tels indicateurs :

𝑥𝑡 = ∑ 𝑥𝑢

𝑡

𝑢=1

(14.36)

alors

𝑥̿(𝑡, 𝑠) = [𝑥𝑡+𝑠 − 𝑥𝑡] 𝑠⁄ (14.37) est la moyenne des observations du sous-échantillon de t+l à t+s.

𝑆2(𝑡, 𝑠) = 1

𝑠 ∑ 𝑥𝑢2

𝑡+𝑠

𝑢=𝑡+1

− [1

𝑠 ∑ 𝑥𝑢

𝑡+𝑠

𝑢=𝑡+1

]

2

(14.38)

(14)

est la variance de ce sous-échantillon.

Soit :

𝑅(𝑡, 𝑠) = Max

0<𝑢<𝑠[𝑥𝑡+𝑈 − 𝑥𝑡− 𝑢 𝑥̿(𝑡, 𝑠)] − Min

0<𝑢<𝑠[𝑥𝑡+𝑈 − 𝑥𝑡− 𝑢 𝑥̿(𝑡, 𝑠)] (14.39) Si les xi sucessifs sont supposés être les apports successifs dans un réservoir, R(t,s) a une interprétation phénoménologique importante ; il représente la capacité que devrait avoir le réservoir supposé plein à l'époque t, pour assurer sans défaillance sur la période [t, t+s] la satisfaction d'une demande d'eau constante égale à 𝑥̿(𝑡, 𝑠). Si le processus est stationnaire, les propriétés probabilistes du rapport 𝑅(𝑡, 𝑠) 𝑆(𝑡, 𝑠)⁄ ne sont fonctions que de s.

Des travaux théoriques (Anis et Lloyd, 1976) ont montré que l'espérance mathématique du rapport précédent avait 1a propriété suivante :

𝐸 [𝑅(𝑡, 𝑠)

𝑆(𝑡, 𝑠)] = 𝐾 𝑠0,5 (14.40)

pour s grand, propriété valable aussi bien pour les processus indépendants que pour ceux à mémoire courte (processus de Markov par exemple). Or Hurst a montré que pour le modules d'un grand nombre de rivières dans le monde, on obtient :

𝐸 [𝑅(𝑡, 𝑠)

𝑆(𝑡, 𝑠)] = 𝐾 𝑠𝐻 𝑎𝑣𝑒𝑐 𝐻 > 0,5 (14.41)

Les figures (14.13) et (14.14) présentent deux graphiques logarithmiques de log (R/S) en fonction de s pour les débits maximaux annuels du Rhin à Bale et de la Loire à Montjean;

pour chaque s le nuage de points correspond à diverses valeurs de t. L'estimation de H peut poser des problèmes délicats (Mandelbrot et Wallis, 1969). Dans le cas présent, la méthode suivante a été utilisée :

- Pour chaque s, 1a valeur moyenne des différents log [R(t,s) / S(t ,s)] a été calculée, soit les R/S (points représentés par un ☐ sur les graphiques).

La valeur H a été estimée par la pente de la droite de régression de log 𝑅 𝑆̅̅̅̅̅̅̅̅̅̅⁄ . Par ce procédé on trouve :

H = 0,55 pour le Rhin H = 0,70 pour la Loire

Mandelbrot et Wallis ont montré qu'une interprétation possible du phénomène de Hurst, c'est-à-dire d'un H supérieur à 0,5, était la présence d'une très longue mémoire entraînant une persistance illustrée par des successions de longues périodes de hauts débits suivies de périodes de bas débits (Effet Joseph).

Pour ce proessus à très longue mémoire, où finalement 1'indépendance est remise en cause, le spectre devrait présenter une asymptote à l'origine :

(15)

𝑓→0lim𝑆(𝑓) = +∞

mais il apparaît que la méthode basée sur le rapport R/S est plus sensible et efficace pour la mise en évidence possible du phénomène de Hurst que 1'analyse spectrale.

L'exemple des crues de la Loire et du Rhin montre que cet effet n'est pas seulement détectable sur les débits moyens annuels et est un facteur de régime de certains cours d'eau. A cet égard, on notera la différence du comportement de la Loire d'un côté et du Rhin de l'autre.

On a déjà noté le facteur régularisant des influences nivales et glaciaires sur le débit du Rhin ; on connaît par ailleurs le régime des crues particulièrement variables de la Loire et 1'irrégularité notable de ce régime traduite effectivement par des périodes de très grandes crues au cours du siècle dernier et suivie par des périodes où le débit a été beaucoup moins important. Notons toutefois que certains auteurs (Klemeš, 1971) ont montré que des valeurs de H supérieures à 0,5 pourraient également s'expliquer par des non-stationnarités dans les tendances centrales des processus hydrologiques (moyenne évoluant avec le temps par exemple). Il semble également que des modèles à mémoire courte, finie, puissent également rendre compte du phénomène de Hurst.

14.2.3 Les structures spatiales de phénomènes hydrologiques

Il a été vu au chapitre 3 que 1a précipitation, comme d'ailleurs tous les flux météorologiques (températures, etc…) avaient des structures spatiales assez étroites, traduites par des corrélations, des dépendances statistiques à l'échelle de surface souvent assez vastes pour englober plusieurs bassins. Il en résulte une dépendance statistique entre les débits de ces bassins même si ceux-ci ne sont pas reliés entre eux par le réseau hydrographique. Bien entendu dans le cas de bassins imbriqués dans le même réseau, contrôlés par des stations reliées d’amont en aval par exemple, cette dépendance viendra renforcer la dépendance purement hydraulique.

Les outils permettant la description de ces dépendances et structures spatiales sont les méthodes régressives (fiche D) et multivariées (fiche G). L'exemple suivant donne une illustration, parmi d'autres, des applications possibles des méthodes régresssives.

La figure 14.15 montre la droite de régression entre les modules de l'Aube à Blaincourt et la Seine à Bar (bassins voisins mais reliés par le réseau hydrographique à 1'aval de ces deux stations seulement). Les paramètres statistiques (moyennes, écart-types s et coefficients de corrélation statistiques sont donnés sur le graphique). On notera la valeur élevée du coefficient de corrélation traduisant la liaison étroite des modules de ces deux bassins.

L'équation de la droite de régression estimée est : 𝑦𝐴 = 𝜃0+ 𝜃1 𝑥𝑆 (14.42) avec

𝜃1 = 𝑟 𝑠𝐴⁄𝑠𝑆 = 0,762 𝜃0 = 𝑦̅̅̅ − 𝜃𝐴 1𝑥̅ = −0,058 𝑆

(16)

l’écart-type résiduel étant :

𝜎 = 𝑠𝐴⁄1 − 𝑟2 = 1,103

La station de Bar a été mise en service en 1950, on y dispose donc de 17 années d'observations supplémentaires antérieures à 1967, les modules correspondants sont portés sur 1'abscisse du graphique (14.15). On peut songer à utiliser la liaison étroite entre modules pour reconstituer des valeurs de modules yA concomittantes aux valeurs xS complémentaires en utilisant la régression (14.47). Cette méthode est fallacieuse car elle néglige la dispersion résiduelle des yA autour de la droite de régression qui, même pour une liaison très forte, n’est pas négligeable si l’on onsidère l’estimation σ de l’écart-type résiduel. En toute rigueur il faudrait ajouter à yA estimé par (14.47) un résidu aléatoire simulé que l'on peut obtenir par tirage au sort dans la loi de probabilité des résidus ε.

Mais dans le contexte statistique, on peut s'intéresser directement à certains paramètres statistiques comme l'espérance μy et de la variance ν2y de la variable y. Dans ce cas on peut obtenir des estimations directes μy et ν2y déduites de l’information complémentaire. De façon générale :

𝜇𝑦 = 𝑦̅̅̅ − 𝜃𝑘 1(𝑥̅̅̅ − 𝑥𝑘 ̅̅̅̅) (14.43) 𝑁 𝜈𝑦2 = 𝑠𝑦,𝑘2 − 𝜃̅̅̅12(𝑠𝑥,𝑘2 − 𝑠𝑥,𝑁2 ) (14.44)

où les indices x et y représentent les variables hydrologiques des séries "longue" et … Ligne manquante

… indice ces nombres répèrent les paramètres statistiques, moyenne et variance de chaque série. Dans notre exemple particulier, on obtient :

𝜇𝑦𝐴 = 16,2 𝑚3⁄𝑠

Ici nous avions pris arbitrairement une période commune de 10 ans. En fait la station de Blaincourt a été observée depuis 1954. Les moyennes et écart-types empiriques calculés sur la série complète sont en fait :

𝑦̅𝐴 (1954 − 1976) = 16,6 𝑚3⁄𝑠 𝑠𝐴 (1954 − 1976) = 5,78 𝑚3⁄𝑠

Les estimations précédentes sont donc très proches de ces valeurs; ceci n'est pas étonnant compte tenu de la très forte corrélation entre les stations.

L'estimation μy est intéressante à comparer à la moyenne 𝑦̅𝑘 du point de vue des erreurs d'échantillonnage caractérisées par les variances.

𝑉𝑎𝑟(𝑦̅𝑘) =𝜈𝑦2

𝑘 (14.45)

(17)

𝑉𝑎𝑟(𝜇𝑦) =𝜈𝑦2

𝑘 {1 −𝑁 − 𝑘

𝑘 [1 − (𝑘 − 2)𝜌2

𝑘 − 3 ]} (14.46)

où ρ est le coefficient de corrélation théorique (estimé par r). Le rapport de ces deux variances permet de mesurer l'augmentation de précision apportée par la connaissance de l'information complémentaire sur x. L'efficacité de l'estimation de μy sera donc exprimée par le rapport :

𝐸 = 1 −𝑁 − 𝑘

𝑘 [1 − (𝑘 − 2)𝜌2

𝑘 − 3 ] (14.47)

Dans notre exemple précédent avec ρ estirmé par r, on trouve E=0,394.

Le rapport K/E (25,3 dans notre exemple) donne, du point de vue des critères d'échantillonnage sur 𝜇𝑦 , le nombre d'observation y équivalent à l'information complémentaire sur x prise en compte dans la corrélation. Cette méthodologie d’amélioration des estimations par les modèles régressifs peut être appliquée pour toute variable x explicative comme les précipitations ou les débits pour autant que la précision soit augmentée, c'est-à- dire E < 1, ce qui implique :

𝜌2 > 1 (𝑘 − 2)⁄

La validité des formules d'estimation sur 𝜇𝑦 ne préjuge aucune forme de distribution statistique des variables x et y. Par contre la formule d'estimation de la variance 𝜈𝑦2 suppose que les résidus ε de la régression sont distribués selon une loi normale. Si les variables x et y sont elles-même normales alors les formules (14.48) et (14.49) fournissent les estimations du maximum de vraisemblance.

Extension sur régressions multiples

La méthode précédente peut être généeralisée au cas de la prise en compte d'informations complémentaires sur plusieurs chroniques explicatives "longues"

(précipitations, débits, températures, etc…) soit l'équation de régression :

𝑦 = 𝜃0+ 𝜃1𝑥1+ 𝜃2𝑥2… + 𝜃𝑟𝑥𝑟 (14.48)

Des formules généralisant les précédentes sont :

𝜇𝑦 = 𝑦̅𝑘− 𝜃𝑘𝑇(𝑥̅𝑘− 𝑥̅𝑁) (14.49)

𝜈𝑦 = 𝑠𝑦,𝑘2 − 𝜃𝑘𝑇(𝑆𝑥𝑥,𝑘− 𝑆𝑥𝑥,𝑛)𝜃𝑘 (14.50) ou

 𝑠𝑦,𝑘2 : variance empirique des y sur la série courte de longueur k,

 𝑦̅𝑘 : moyenne empirique des y sur la série courte.

et les notations matricielles suivantes sont utilisées :

 𝑋̅𝑘 et 𝑋̅𝑛 représentent les vecteurs des r moyens calculés sur les séries courtes et

(18)

longues des x.

 𝑆𝑥𝑥,𝑘− 𝑆𝑥𝑥,𝑛 les matrices de covariance empirique calculées sur les séries courtes et longues.

 θk (dont le transposé est 𝜃𝑘𝑇) est le vecteur des coefficients de régression estimé sur la série courte des y et x (fiche D).

La formule (14.51) donnant le rapport E mesurant l'augmentation de précision est alors :

𝐸 = 1 +𝑁 − 𝐾

𝑁 [𝑟 − (𝑘 − 𝑟 − 1)𝑅2

𝑘 − 𝑟 − 3 ] (14.51)

où R est le coefficient de corrélation multiple de y en fonction des x (fiche D).

Les méthodes régressives à r dimensions sont des cas particuliers de méthodes multivariées. On peut appliquer à l'étude conjointe d’un ensemble de variables de débits relatives à un ensemble de stations de jaugeage des méthodes comme d'analyse en composantes principales ou le krigeage pour mettre en évidence les relations spatiales intrinsèques entre les stations (Villeneuve et al., 1979). Mais ces techniques ont trouvé, en matière de débits, un champ moins favorable à des applications extensives que dans le domaine des précipitations.

14.3 Les modèles stochastiques des processus hydrologiques unidimensionnels

Nous avons vu au paragraphe précédent que des techniques statistiques adaptées comme les analyses spectrales ou d’autocorrélation mettaient en évidence des structures temporelles très fortes des séries chronologiques de débits de rivières. Quel que soit le pas de temps que l'on choisisse (annuel et surtout mensuel et journalier). Il existe des dépendances probabilistes souvent étroites entre les débits successifs, c’est-à-dire que les distrihutions marginales des écoulements, pour chaque période (mensuelle par exemple) isolée de son contexte chronologique, ne suffisent pas à la description des processus stochastiques hydrologiques et surtout à leur simulation. Il importe de modéliser ces structures.

Pour effectuer cette modélisation la considération des pas de temps est essentielle. A l'échelle annuelle l'hypothèse d'indépendanc peut être pratiquement admise entre les modules successifs dans la plupart des cas; alors les lois marginales des modules décrites dans le paragraphe (14.2.1) suffisent à la modélisation des processus de débits annuels. Cette indépendance peut quelquefois être mise en question, mais la mise en œuvre de modèles concurrents éventuellement plus réalistes pose des problèmes sur le plan pratique ; nous y reviendrons.

Généralement la complexité et l’intensité de 1a structure de dépendance croissant à mesure que 1'on descend dans 1'échelle des pas de temps :

saisonnier  mensuel  journalier

I1 est de pratique courante d'utiliser des modèles adaptés aux pas de temps particuliers pour les problèmes opérationnels étudiés comme la gestion de réservoirs saisonniers pour lesquels le pas de temps mensuel peut suffire par exemple. Des structures simples représentées par des modèles markoviens sont alors adéquates à ce niveau. Le problème de la

(19)

cohérence structurelle des modèles ajustés indépendamment sur différentes échelles de temps peut être posé dans la mesure où l'estimation et 1a vérification de ces modèles ont porté sur des données différentes. Ce souci de cohérence et aussi celui de présenter des modèles à usages multiples "passe partout" a poussé certains hydrologues à proposer des modèles de simulation de débits à l’échelle 1a plus fine, la journalière le plus souvent, présumés capables de décrire les chroniques à des échelles de temps plus larges en s'appuyant sur le principe "qui peut le plus, peut le moins". Ces types de modèles peuvent être très fallacieux; d'une part la modélisation des débits à l'échelle journalière est très complexe et ne semble pas avoir reçu de solution complètement satisfaisante à ce jour, d'autre part les critères d'ajustement peuvent être incompatibles selon les diverses échelles de temps et une bonne adéquation adaptée aux débits journaliers ne peut bien souvent se faire qu'au détriment de 1'adéquation aux échelles de temps supérieures.

Là encore, c'est le point de vue opérationnel de choix d'un modèle adapté au pas de temps et aux critères opérationnels choisis ainsi qu'aux données disponibles qui doit primer ce souci de cohérence structurelle. Dans 1a revue des modèles qui suit, nous préciserons chaque fois les échelles des temps auxquelles ils sont les mieux adaptés. Il existe toutefois une approche permettant de contourner le dilemme des pas de temps, c'est celle qui consiste à prendre en compte des seuils de débits fixés et à modéliser les chroniques de surplus et déficits; nous y consacrerons un paragraphe important.

14.3.1 Les modèles à chronologie fixée

a) Les modèles markoviens et autorégressifs (Fiche E)

Considérons les débits moyens observés à une station de jaugeage donnés au cours de période de temps successives : … , t – 1, t, t + 1, … etc. Le modèle le plus largement utilisé pratiquement en hydrologie est le modèle markavien ou autorégressif d'ordre 1 :

𝑋𝑡+1= 𝜇𝑡+1+ 𝛽𝑡+1(𝑋𝑡− 𝜇𝑡) + 𝜀𝑡+1 (14.52)

où Xt est soit le débit de la période t, soit toute transformation de seuil de débit permettant de représenter la distribution de εt+1 par une loi simple (par exemple Xt =log Qt).

- 𝜇𝑡 est l’espérance de Xt pour la période t.

- les 𝜀𝑡sont supposés d'espérance nulle, de variance ν2t et mutuellement indépendants au cours des périodes successives.

Les coefficients βt et les variances ν2t peuvent être calculés de façon à reconstituer d'une part les coefficients de corrélation ρt,t+1 entre les variables Xt et Xt+1 successives et les variances ν2t de chaque Xt. On a les expressions :

𝛽𝑡+1= 𝜎𝑡+1

𝜎𝑡 𝜌𝑡,𝑡+1 (14.53) 𝜈𝑡+12 = 𝜎𝑡+12 (1 − 𝜌𝑡,𝑡+12 ) (14.54)

Dans un modèle autorégressif du premier ordre, on peut montrer que les coefficients de corrélation entre les variables Xt +k et Xt de deux périodes séparées par k périodes intermédiaires doivent vérifier la relation (fiehe E) :

(20)

𝜌𝑡+𝑘,𝑡= 𝜌𝑡+𝑘,𝑡+𝑘−1 𝜌𝑡+𝑘−1,𝑡+𝑘−2… 𝜌𝑡+1,𝑡 (14.55)

généralisant la relation simple

𝜌𝑡+2,𝑡 = 𝜌𝑡+2,𝑡+1 𝜌𝑡+1,𝑡 (14.56)

Cette structure simple, en fait la plus simple des structures de dépendance, permet généralement de représenter les chroniques de débits à l'échelle mensuelle mais difficilement aux échelles inférieures.

A cette échelle mensuelle, le caractère saisonnier, non stationnaire, du processus est pris en compte par des coefficients 𝜇𝑡, 𝜎𝑡2, 𝜌𝑡,𝑡+1 (et donc 𝛽𝑡 et 𝜈𝑡2) prenant des valeurs périodiques, de périodes égales à 12 mois. En d'autres termes1'espérance 𝜇𝑡 et la variance 𝜈𝑡2 sont spécifiques à chaque mois calendaire et les correlations 𝜌𝑡+1,𝑡 représentent les liaisons entre janvier et février, février et mars, etc …

Si les εt sont disttibuées selon la loi normale, les lois statistiques marginales des Xt

sont également normales. Dans la mesure où la loi log-normale est souvent réaliste pour représenter les débits mensuels (figure 14.2) le modèle markovien (14.57) est alors appliqué aux logarithmes des débits.

Fiering (1967) a développé des formules permettant de traiter le cas où le "résidu" εt

est distribué selon une loi proche de la loi Pearson type III en effectuant une transformation sur et qui conserve les trois premiers moments de la distribution des variables Xt prises égales ici aux débits Qt :

𝜀𝑡 𝑉𝑡 = 2

𝛾𝑡[1 +𝛾𝑡

6 𝜈𝑡−𝛾𝑡2 36]

3

− 2

𝛾𝑡 (14.57)

avec

𝛾𝑡=𝑔𝑡− 𝜌𝑡,𝑡−13 . 𝑔𝑡−1 [1 − 𝜌𝑡,𝑡−12 ]3 2

où 𝛾𝑡, 𝑔𝑡, 𝑔𝑡−1, sont les coefficients d'asymétrie (fiche C) respectivement de εt, Qt, Qt-1 et νt

est une variable normale centrée réduite. Cette forrnule est appelée transformation de Wilson- Hilferty.

Le modèle (14.52) est généralement attribué à Thomas et Fiering (1962). Cependant, il était largement utilisé en France avant cette date. Halphen (1941) a présenté une application aux débits mensuels du Rhin à Bale et de la Dordogne à Bort dans l'annuaire de la SHF de 1941. La figure 14.16 illustre la variation saisonnière mensuelle des paramètres du modèle ajusté aux débits mensuels de la Dore à Giroux. On remarquera l'effet saisonnier très notable sur 1e coefficient de corrélation entre mois successifs ce qui montre que la série chronologique des apports mensuels ne saurait être comparée complètement transformée en utilisant une transformation du type (14.30).

Sous la forme (14.57) le modèle markovien est utilisable en simulation. Partant d'une

Références

Documents relatifs

servations nécessaires pour juger si l’approximation d’une distribution de la plus grande valeur vers sa forme asymptotique dépend de la distribution initiale

décroissance de la loi initiale est galtonienne, la convergence vers la loi de GUMBEL n’est réellement lente que pour la loi normale et cette dernière loi ne.

Remarquons pour ce dernier exemple qui nous intéresse spécialement ici, que la suite des débits est une série chronologique particulière un peu différente.. de

Indiquer d’abord, sans faire de calculs, si la vitesse d’écoulement de l’eau dans la canalisation est plus rapide, égale ou moins rapide qu’à la sortie du robinet..

L'une des difficultés majeures de cette méthode de mesure est liée à la qualité du mélange. Dans le cas le plus courant des tuyauteries horizontales, celui-ci doit en effet

On injecte dans la rivière de débit Q, en un point judicieusement choisi pour favoriser le mélange ra- pide avec l'eau de la rivière, un débit constant q d'une solution de traceur à

Pour le bassin de l’Allenbach pour lequel on dispose de seulement 6 années de mesures et qui respecte les critères d’applicabilité (basin alpin suisse de 28.8 km 2 ), la manière

Il est possible de constater que même si les pics se produisent à des temps différents, la combinaison des deux hydrogrammes donne un débit de pointe beaucoup