Etat de l’art
en Hydrologie stochastique et statistique
(titre imposé)Par Philippe Bois
ex Professeur d’Hydrologie et d’Hydrométrie à l’ENSHMG ex Chercheur au LTHE (INPG, UJF, CNRS, IRD)
Ou plutôt réflexions sur les méthodes non mécanistes utilisées en Hydrologie
Sources:
Web
Hydrologie.org
Des années comme réviseurs, président et rapporteur de thèse
Quelques documents anciens et utiles
Certains montrent que l’hydrologie statistique est déjà ancienne
Halphen 1953
Montpellier 1991
J. M. Masson Qui utilise les statistiques en hydrologie 1992
J. Bernier IAHS 116 1976
Accepteriez vous d'être mon interprète auprès des organisateurs du colloque pour leur exprimer combien j'avais apprécié sa grande valeur
scientifique,ses travaux et son affabilité. Sa disparition prématurée est une grande perte.
Je regrette aussi l'occasion manquée de revoir un certain nombre de collègues et amis qui seront présents d'après le programme
Petit mot de Jacques Bernier reçu par Ph. Bois le 14 janvier 2008
La statistique est basée sur l’observation
Alors observons et analysons
Un peu franco français et non exhaustif
Objet principal: Effectif Pourcentage
Nappes, Sol,hydrogéologie, transferts 43 26
Qualité, Ressources 43 26
Modélisation hydrologique 25 15
Hydrologie Statistique, Modèles Statistiques
17
10Hydrologie classique, Monographies, Bassins 17 10
Hydrométéorologie, Pluies, Radars 11 7
Divers 5 3
Hydrométrie, Mesures, Données 4 2
Total 165 100
Classification des thèses récentes (depuis 2003) de Hydrologie.org
Analyse bayésienne Modèles probabilistes
Analyse canonique des corrélations Modélisation stochastique
Analyse décisionnelle Ondelettes
Classification Période de retour
Contrôle des données Prédétermination
Crues historiques Prédictibilité
Désagrégation Multifractale Prévision de pluies Distribution fréquentielle Prévision déterministe Estimation bayesienne Prévision immédiate
Extremes Prévision probabiliste
Fonction aléatoire Prévision stochastique
Fractal Multifractal Processus Markovien
Generateur stochastique de pluie Processus ponctuels
Geostatistique Régression
Homogénéisation Réseau de neurones
hydrologie statistique Segmentation
Krigeage Séries temporelles
Méthode des analogues Simulation Multifractale Modèle d'invariance d'échelles Stationnarité
Modèles de cascade Théorie des valeurs extremes Variables régionalisées
Mots clés des thèses d’Hydrologie Statistique ou stochastique Ordre alphabétique
hydrologie statistique Contrôle des données Distribution fréquentielle Homogénéisation
Modèles probabilistes Séries temporelles
Période de retour Simulation Multifractale
Prédétermination Stationnarité
Extremes Prévision de pluies
Théorie des valeurs extremes Prévision déterministe Modélisation stochastique Prévision immédiate Analyse bayésienne Prévision probabiliste Crues historiques Prévision stochastique Estimation bayesienne Régression
Prédictibilité Analyse canonique des corrélatio Generateur stochastique de pluie Réseau de neurones
Désagrégation Multifractale Segmentation
Fonction aléatoire Méthode des analogues Fractal Multifractal Variables régionalisées Modèle d'invariance d'échelles Geostatistique
Modèles de cascade Krigeage
Processus Markovien Classification
Processus ponctuels Analyse décisionnelle Ondelettes
Mots clés des thèses d’Hydrologie Statistique ou stochastique Classés par méthode
Méthodes Probabilistes
:Description de la distribution (efforts à faire cf fig suivante)
Ajustement Recherche de lois (recherches en cours sur les extrêmes) Obligatoire et légale pour les crues (France crue centennale)
Romanche au Chambon Variations saisonnières des débits journaliers Source: EdF Calendriers de probabilité Pas assez utilisés
Ajustements probabilistes
: Remarques:- Ce n’est pas parce que une variable est aléatoire qu’elle suit une loi de probabilité classique
-Exemple des extrêmes: le débit maximum annuel d’une rivière ne suit pas forcément une loi des extrêmes type Gumbel ou autre Car c’est parfois un mélange ou une combinaison de phénomènes (cas de bassins à crues pluviales ou nivales)
-l’ajustement doit être fait autant par expérience que à la vue
de la fonction de répartition empirique (cas des points isolés outliers ou horsains), cf. figure suivante
- Les logiciels de recherche de la loi la mieux ajustée sont souvent dangereux
Pour les extrêmes les différentes lois classiques donnent pour les faibles fréquences des résultats souvent fort différents
Exemple:
Pour le Verdon à Quinson la crue millénale est dans un rapport de 1 à 3 entre Gumbel et Fréchet cf. Figure suivante
GAUSS
GUMBEL FRECHET
GALTON PEARSON III
VERDON à QUINSON
Temps de retour Débit
100 ans 1000 ans
Pour les crues de faible fréquence une méthode reliant la probabilité des pluies extrêmes au pas de temps caractéristique des crues)
et la probabilité des volumes extrêmes de crues permet d’utiliser l’information pluviométrique souvent plus riche et plus fiable que les Données de crues.
L’analyse bayésienne permettant d’utliser d’autres informations (incertitudes ou valeur historique) est de plus en plus utilisée (exemple de la crue du Lez, figure suivante)
Dans le cas de bassins où la crue peut avoir diverses origines,
Une bonne technique consiste à analyser séparément les types de crues et ensuite à composer les lois ajustées
Dans l’exemple suivant on a étudié séparément les crues pluviales et les crues nivales
Durance Serre Ponçon Composition de lois des Max Annuels Source: EdF
Ajustements:
Recherches en cours par type de temps ou type de crues cf texte et exposé de Remi Garcon
Exemple d’utilsation de l’analyse bayésienne
Analyse Fractale ou multifractale
:Souvent utilisée pour les champs de pluie notamment en désagrégation (voir travaux de Pierre Hubert et Daniel Schertzer)
La Houille Blanche 2006
Extrèmes et Multifractals en Hydrologie La Houille Blanche 2006
Analyse de données
Corrélation multiple
Y expliqué par Xi i de 1 à p
Bien connu mais souvent hélas
Peu d’utilisation de la corrélation partielle Peu d’utilisation des méthodes de validation
Peu d’utilisation des méthodes de sélection de variables nombreux pièges
Analyse en composantes principales
Objet: Analyse des corrélations entre variables
Réduction du nombre de variables par transformation linéaire de celles-ci Nombreux pièges
Assez utilisé
Can. J. Civ. Eng. 25(6): 1050–1058 (1998) | doi:10.1139/cjce-25-6-1050 | © 1998 CNRC Canada
Régionalisation du régime des
précipitations dans la région des Bois-francs et de l'Estrie par l'analyse en composantes principales
T. O. Siew-Yan-Yu, J. Rousselle, G. Jacques et V.-T.-V. Nguyen
Analyse factorielle des correspondances
Objet: Chercher les distances entre variables et observation
Nombreux pièges (exemple des températures Celsius et Fahrenheit)
Analyse discriminante
Objet: Vérifier si le partage d’un tableau en plusieurs groupes est valable Pouvoir affecter à un groupe une nouvelle observation
Méthode des analogues:
Idée simple: On possède une nouvelle observation de p variables et on cherche dans une archive de n observations celles qui sont voisines et on examine leurs propriétés ou leur relation avec un phénomène Y.
Exemple: Prévision quantitative des pluies
Source: Thèse S. Guilbaud 1997
Geostatistique
Objet: Etude de variables distribuées dans l’espace (ex: champ de pluies) Très utilisé
Logiciels disponibles (attention pièges)
Indispensable pour s’autoriser le tracé d’isovaleurs Krigeage
Génération stochastique
:Objet: Générer des séries ou des champs de même structure que l’observé
Séries temporelles
Modèles ARMA ARIMA Chaines de Markov
Ondelettes (récent en Hydrologie) Exemple:
Analyse multirésolution croisée de pluies et débits de sources karstiques David Labat
Laboratoire de mécanisme des transferts en géologie, UMR 5563 CNRS, Laboratoire souterrain de Moulis, 09200, Saint-Girons (Moulis), France CRAS Reçu le: 30 Juin 2001; accepté le: 6 Mai 2002 .
En guise de conclusion
:Sur l’hydrologie statistique et stochastique Très nombreuses méthodes
Certaines indispensables (extrèmes), d’autres très riches
des progrès récents soit méthodologiques soit d’accès aux données et logiciels
Sur les freins à un développement plus grand:
chez les hydrologues et statisticiens:
dialogue en progrès mais efforts à poursuivre envers l’extérieur (décideurs et organismes):
- faire comprendre que l’aléatoire existe et doit être étudié par des méthodes appropriées
- les convaincre que l’on n’utilise pas ces méthodes uniquement par manque de connaissance ou de compétence
Documents:
Nombreux polycopiés en ligne: Laborde, Musy, Bois-Obled, Ababou Livres spécialisés
Proposition concrète:
Guide du routard hydrologue au pays de la statistique et de l’analyse de données Sous forme de fiches en ligne (par exemple sur hydrologie.org
une fiche par méthode:
objet de la méthode exemples d’hydrologie les pièges
références