• Aucun résultat trouvé

Chapitre 4 : Cartographies et analyse de risque

I. Cartographies d’estimation par krigeage

I.1. Estimateurs utilisés en géostatistique

De la géostatistique linéaire à la géostatistique non linéaire

L’interpolation spatiale est l’un des objectifs principaux de la géostatistique. Elle consiste à estimer, à partir de valeurs mesurées, une grandeur de la manière la plus précise et la plus perti- nente possible. Classiquement, en géostatistique linéaire, l’interpolateur est construit comme une combinaison linéaire des données. Cette estimation est, en espérance, non biaisée et possède la plus petite variance d’erreur d’estimation possible. C’est la manière dont est construit le krigeage qui est l’opérateur pour l’interpolation en géostatistique. Il s’appuie sur le variogramme.

Au chapitre précédent, la forte dissymétrie des données a conduit à utiliser une transformation par anamorphose, ce qui a permis de déformer l’histogramme des données vers une distribution gaussienne. Au niveau de l’interpolation, cette opération conduit à passer de la géostatistique linéaire à la géostatistique non linéaire. En effet, tout comme la moyenne et la variance qui sont

sensibles à la présence de valeurs fortes, les estimateurs linéaires des données ne sont pas adaptés à des distributions fortement dissymétriques.

De la même manière que le variogramme étend la gamme des fonctions aléatoires pouvant être étudiées par rapport à la covariance (c’est le passage du modèle stationnaire du second ordre au modèle intrinsèque), la géostatistique non linéaire généralise le krigeage à une bien plus grande gamme d’interpolateurs : le krigeage disjonctif élargit l’estimateur à l’ensemble des combinaisons linéaires de fonctions monovariables des données, l’espérance conditionnelle minimise l’erreur quadratique moyenne parmi toutes les fonctions multivariables des données.

Les estimateurs utilisés en géostatistique, krigeage, krigeage disjonctif et espérance condi- tionnelle, sont donc hiérarchisés. Les hypothèses nécessaires à l’emploi de chacune des tech- niques sont, elles aussi, de plus en plus contraignantes. Les interpolateurs présentés sont donc d’autant plus exigeants qu’ils sont sophistiqués (Tableau 4).

Interpolateur Forme de l’estimateur Connaissance préalable

Krigeage Covariance (stationnaire) ou Variogramme (intrinsèque) Krigeage disjonctif Lois bivariables

Espérance conditionnelle Lois à (n+1) variables

Tableau 4 : Récapitulatif des estimateurs en géostatistique (d’après Emery 2001b).

La mise en œuvre de l’espérance conditionnelle requiert donc un modèle de lois multiva- riables, qui doit pouvoir être inféré à partir des données expérimentales. En pratique, il n’y a guère que le cadre multigaussien qui permette une telle construction. Pour se ramener à ce cadre multigaussien, on travaille sur la transformée gaussienne de telle que

( est la fonction d’anamorphose). Les données sont transformées en données

La pertinence du cadre multigaussien par rapport aux données est discutée au Chapitre 9 en troisième partie du document. Nous rappelons que, dans cette première partie, la mise en œuvre de la géostatistique est faite sous l’hypothèse multigaussienne. L’interpolateur utilisé est donc l’espérance conditionnelle, qui nécessite auparavant la présentation du krigeage simple.

Krigeage simple

Le krigeage s’appuie sur l’interprétation de la variable régionalisée comme la réalisation d’une fonction aléatoire dont la structure spatiale a été modélisée par le variogramme.

Le krigeage simple, ou à moyenne connue, est présenté dans le cadre d’une fonction aléatoire stationnaire du second ordre, en utilisant sa fonction de covariance. De plus, la moyenne étant supposée connue, elle est considérée comme étant égale à 0 (ce qui revient à soustraire la valeur

Chapitre 4 : Cartographies et analyse de risque

connue de la moyenne à la valeur mesurée et à travailler sur cette différence). De plus, dans le cadre multigaussien, la moyenne est effectivement connue et égale à 0.

La quantité sur laquelle travaille le krigeage n’est pas l’estimation elle-même, notée

mais l’erreur d’estimation , différence entre l’estimation et la quantité à estimer. Le krigeage s’articule autour de quatre étapes successives qui correspondent à quatre contraintes sur cette erreur d’estimation :

Contrainte de linéarité : dans le cadre de la géostatistique linéaire, l’interpolateur étant exprimé comme une combinaison linéaire des données disponibles, il en va de même de l’erreur d’estimation. Avec comme pondérateurs, l’interpolateur au point cible s’écrit :

Contrainte d’autorisation : dans le modèle stationnaire du second ordre, toute com- binaison linéaire est autorisée. La contrainte est automatiquement vérifiée.

Contrainte de non biais (ou d’universalité) : elle revient à exprimer que l’erreur d’estimation est d’espérance nulle, ce qui est le cas de manière immédiate puisque le krigeage simple travaille à moyenne connue.

Contrainte d’optimalité : la dernière étape consiste à trouver les pondérateurs qui minimisent la variance de l’erreur d’estimation qui s’écrit :

Les contraintes d’autorisation et de non biais sont immédiatement vérifiées dans le cadre du krigeage simple. Elles sont cependant actives et indispensables dans le cadre du krigeage ordi- naire, respectivement à moyenne inconnue et dans le cadre intrinsèque.

La contrainte de non biais signifie que les erreurs d’estimation sont nulles en moyenne glo- bale. La contrainte d’optimalité impose que les erreurs commises soient les plus petites possibles et donc que l’interpolateur soit le plus précis possible vis-à-vis de l’objectif choisi (minimisation de l’erreur quadratique moyenne).

La minimisation de la variance de l’erreur d’estimation, qui est une forme quadratique posi- tive, s’obtient classiquement par l’annulation de ses dérivées partielles par rapport aux poids inconnus :

C’est un système linéaire où le nombre d’équations et le nombre d’inconnues sont égaux au nombre de données utilisées. Sa résolution ne pose donc aucun problème si toutes les données sont situées à des points distincts. De plus, le système d’équation peut être écrit sous forme matri- cielle :

Cette représentation met en évidence trois termes : le premier est une matrice ne dépendant que de la configuration géométrique des données, le second est le vecteur des poids de krigeage (les inconnues que l’on cherche à calculer), le troisième est le vecteur prenant en compte les posi- tions relatives des données à la cible. Les deux termes connus sont exprimés en covariance, dé- pendant de la structure spatiale du phénomène.

La résolution de ce système est effectuée par simple inversion de matrice puisque tout est connu sauf le vecteur des pondérateurs. Cela permet de déterminer les poids de krigeage opti- maux. Ils ne dépendent pas des valeurs prises par la grandeur aux points de données puisque les

n’apparaissent pas dans le système matriciel, mais seulement de la configuration des points de données entre eux et par rapport à la cible, et du modèle de covariance. De plus, la variance de l’erreur de krigeage simple se simplifie :

De la même manière, cet indicateur de la précision de l’estimation ne dépend pas de la valeur des données, seulement de leurs positions par rapport à la cible et du modèle covariance (ou de variogramme). Elle peut donc être calculée a priori si l’on connaît la maille d’échantillonnage et la structure spatiale. Elle est nulle si l’estimation est réalisée sur un point de donnée : tous les poids sont nuls sauf celui du point concerné (le krigeage est un interpolateur exact). En revanche, à mesure que l’on s’éloigne des données, la variance de krigeage augmente, indiquant une plus grande incertitude dans la valeur estimée.

En résumé, le krigeage fournit une estimation sans biais et aussi précise que possible. Il prend en compte les informations de nature géométrique (nombre et configuration des points de don- nées) et également les informations structurales contenues dans le modèle de covariance. Il fournit en plus la précision de son résultat sous la forme d’une variance d’erreur d’estimation.

En pratique, l’estimation en un point donné peut être réalisée à partir de tous les points dispo- nibles (voisinage unique) ou uniquement à partir des points situés dans un certain voisinage du point cible (voisinage glissant).

Espérance conditionnelle en modèle multigaussien

Si la fonction aléatoire étudiée peut se mettre sous la forme , où est la fonction d’anamorphose et une fonction aléatoire gaussienne, alors le krigeage simple de coïncide avec son espérance conditionnelle. Sa loi, conditionnellement aux données, est donc une loi gaussienne de moyenne égale à son krigeage simple et de variance égale à la variance de krigeage correspondante. La densité de la loi conditionnelle s’écrit1

:

1 Le conditionnement est symbolisé par « » au lieu de « » afin

Chapitre 4 : Cartographies et analyse de risque

En notant la densité de probabilité de la loi normale réduite, l’espérance conditionnelle

de s’écrit alors :

La précision de l’estimation est donnée par la variance conditionnelle :

Contrairement aux variances de krigeage classique (et même du krigeage disjonctif), les va- riances conditionnelles dépendent des valeurs des données grâce au passage de à par anamorphose. Ainsi, pour une même configuration géométrique des données, on peut rendre compte du fait que les erreurs sont plus importantes dans les zones à forte variabilité et moindres dans les zones de faible variabilité. En ce sens, la variance d’estimation conditionnelle donne une mesure plus réaliste de l’incertitude qu’une variance d’estimation a priori.

Connaissant la fonction de répartition de la loi conditionnellement aux données, on en déduit celle de :

Il est ensuite possible de fournir, pour un niveau de risque donné, les bornes d’un intervalle de confiance sur et par conséquent la largeur de l’intervalle de confiance correspondant pour . C’est l’indicateur de qualité qui sera retenu pour les cartographies ci-après, généralement associé à un niveau de confiance de 95 %. Il est à noter que cet intervalle n’est pas centré sur la valeur fournie par espérance conditionnelle.

En conclusion, l’estimation par espérance conditionnelle est rapide à mettre en œuvre. Elle nécessite la fonction d’anamorphose et un krigeage simple de la transformée gaussienne des don- nées. Cependant, elle repose sur des hypothèses théoriques très contraignantes puisque la variable est supposée, après transformation, suivre une loi spatiale gaussienne. De plus, une généralisation à moyenne inconnue et utilisant un krigeage ordinaire peut également être mise en place (Emery, 2006).