Estimation locale monovariable des concentrations

5.1.2 Hypoth`ese intrins`eque

S’il est possible de faire la part entre géométrie du champ et régionalisation de la variable d’intérêt, et par conséquent de modéliser la structure spatiale de la fonction aléatoire, alors le cadre intrinsèque permet le calcul d’une variance d’estimation sur le champ V de la moyenne des concentrations (Zi)i=1,... ,N, qui s’exprime comme [Matheron (1970), Petitgas & Rivoirard (1991)]

σ_EI2 = CV V + Cij− 2 CiV (5.2)

o`u CV V, Cij et CiV sont respectivement les covariances moyennes entre deux points d´ecrivant

indépendamment V , entre la donnée i et un point décrivant V et entre deux données i et j pour tous les couples (i, j). Par rapport à la formule transitive, il y a apparition du terme CiV qui

représente l’influence sur l’estimation de la géométrie des données, ici fixes, par rapport à celle du champ ; la grille n’est donc plus nécessairement régulière. Le modèle de variogramme γ(h) = 4000+6200×Sph(30m) illustré à la figure5.2conduit à un coefficient de variation pour l’estimation globale de 31.3 %, la concentration moyenne sur le champ étant estimée par krigeage à 38.2 ppm. Les coefficients de variation et les variances d’estimation, comparables et cohérents pour les deux formalismes, sont inférieures au résultat de la statistique classique. La portée de la structure spatiale, grande par rapport à la taille du champ, explique cela. Ces variances indiquent la précision de l’estimation d’une concentration moyenne sur l’ensemble du champ. Dans le cas présent, cette connaissance du niveau de concentration moyen en polluant présente un intérêt pratique assez limité, et il est plus important de procéder à une estimation locale des concentrations en place lorsque ces dernières présentent une structuration spatiale.

5.2 Estimation locale monovariable des concentrations

Les estimations sont réalisées ponctuellement sur une grille de 2 m sur 2 m dont les contours correspondent à ceux du site. Vu le peu de données disponibles, les estimations sont effectuées en voisinage unique. Nous déterminons les méthodes d’estimation les plus appropriées en analysant le cas du benzo(a)pyrène sur les sondages, avant de les appliquer aux autres HAP.

Deux critères permettront de comparer l’efficacité des différents modèles :

– une validation croisée ; l’erreur quadratique moyenne, donnée systématiquement, synthétise moyenne et variance des écarts entre les valeurs réelle et estimée2. Bien qu’étant conscient que l’utilisation d’une telle statistique est délicate vu le peu de données et la dissymétrie des variables, les conditions identiques des différentes estimations en font un critère expérimental de comparaison intéressant.

– les variances d’estimation associ´ees aux estimations, pour chaque mod`ele.

n’a pas été approfondie ici, la prise en compte des irrégularités ne jouant que faiblement sur l’effet de pépite C0 du

covariogramme transitif, qui est le facteur déterminant dans le calcul de la variance d’estimation. En effet, celle-ci, qui est la différence entre l’intégrale du covariogramme et son approximation au pas de la maille, peut être correctement approchée par le produit C0.a2, cette approximation donnant dans le cas présent un coefficient de variation de 30 %.

En effet, si Z est estim´e par Z?, l’erreur quadratique moyenne E[(Z− Z?

)2] vaut Var[Z− Z?

] + E2[Z− Z?

94 CHAPITRE 5. SITE Y - ESTIMATION DES CONCENTRATIONS EN PLACE Le modèle structural γ(h) = 4000 + 6200×Sph(30 m) de la figure5.2, ajusté sur le variogramme m.p.e., est utilisé pour le krigeage ordinaire (KO) de Bap sur les sondages. Les deux zones de valeurs fortes, au Sud et au Nord, ressortent sur la carte d’estimation (voir figure 5.3). La tache située au Nord se prolonge à l’Est de la croix centrale. Les écart-types d’estimation, nuls aux points expérimentaux où l’interpolation est exacte, deviennent très élevés dès que l’on s’en écarte, `

a cause de l’effet de pépite3. Ils montrent par ailleurs bien le risque que présente l’utilisation de cette estimation dès que l’on sort de la zone investiguée.

(a) Krigeage ordinaire (b) Ecart-types d’estimation

Fig. 5.3 – Site Y - Krigeage ordinaire de Bap sur les sondages, mod`ele ajust´e sur le variogramme m.p.e.

Il est possible d’attribuer une part de l’effet de pépite à la variance de l’erreur de mesure et de la filtrer. Nous reviendrons sur ce point au chapitre8pour le second site. Le nuage de corrélation entre valeurs réelles aux points expérimentaux et estimées par validation croisée illustre l’effet de lissage du krigeage, les valeurs estimées étant nettement moins dispersées que les valeurs réelles (voir figure

5.4). L’erreur quadratique moyenne obtenue par validation croisée, égale à 8532, servira de référence dans la suite ; cette erreur est légèrement supérieure pour un modèle ajusté automatiquement sur le variogramme classique. Les deux concentrations les plus fortes sont mal ré-estimées.

Destiné essentiellement à l’estimation globale, le formalisme transitif peut également être utilisé pour l’estimation locale [Bez (1997), Rivoirard (1995)]. Le krigeage transitif consiste à estimer z(x) par une combinaison linéaire des données situées dans un voisinage de x. L’optimalité est ici obtenue en choisissant les pondérateurs de la combinaison linéaire de sorte que, s’il était possible de translater partout dans l’espace la configuration formée par x et les points de son voisinage, la somme des erreurs quadratiques entre valeurs vraies et estimées soit minimale.

Le krigeage transitif obtenu à l’aide du covariogramme transitif de la figure 5.1 est illustré à

3_{Il est d’usage de proc´}_{eder au krigeage en filtrant l’effet de p´}_{epite - erreur de mesure ou de positionnement ; cette}

technique, discutée à la page 144, conduit à des écart-types qui ne sont alors plus nuls aux points expérimentaux [Chilès & Delfiner (1999)]. Cela nécessite cependant une connaissance suffisante de ces erreurs de mesure, ce qui n’est pas le cas ici.

Dans le document Caractérisation géostatistique de pollutions industrielles de sols: cas des hydrocarbures aromatiques polycycliques sur d'anciens sites de cokeries (Page 102-104)