• Aucun résultat trouvé

● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●

KO KDE KVN Simu. (moy.) Simu. (min.)

200 400 600 800 1000

50100150200250

Nombre de simulations

EAM [Bq. m−3]

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

● ●● ● ● ● ●● ● ● ● ● ● ● ● ●

200 400 600 800 1000

50100150200250

Nombre de simulations

EAM [Bq. m−3]

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

a) b) c)

FIGURE4.11 – Influence du nombre de simulations sur les erreurs absolues moyennes obtenues par krigeage avec variogrammes numériques et par krigeage avec dérive externe pour les scénarios S1 (a), S2 (b) et S3 (c). Les points représentent les erreurs moyennes obtenues sur 20 tirages de simulations, et les barres d’erreurs donnent les erreurs minimales et maximales obtenues sur les 20 tirages. Les erreurs obtenues par krigeage ordinaire et sur les simulations (en moyenne ou au minimum) sont également rappelées.

4.4 Quantification des incertitudes

L’objectif opérationnel d’une étude géostatistique de site contaminé est souvent d’estimer la quantité et la localisation des terres devant être dépolluées ou excavées, ainsi que les incertitudes associées. Trois méthodes sont comparées pour quantifier les risques liés aux incertitudes d’estimation.

4.4.1 Approche classique basée sur l’écart-type théorique d’erreur de krigeage

Dans le cas d’estimations par krigeage, la distinction entre zone contaminée et zone saine est rare-ment effectuée en se basant uniquerare-ment sur le résultat de l’estimation : l’écart-type théorique d’erreur de krigeage (σK) est pris en compte pour distinguer une zone très probablement contaminée, une zone très probablement saine, et une zone intermédiaire sur laquelle il est difficile de se prononcer [Bobbia et al.,2008;de Fouquetet al.,2011]. Cette méthode est fondée sur l’hypothèse de résidusRgaussiens et indépendants de l’estimation :

Z=Z+σKR avec R∼ N(0, 1) (4.7)

Zest l’estimation deZ. Dans ce cas, des intervalles de confiance sont construits en utilisant les quantiles de la loi normale (voir Complément4.1).

Complément4.1

Intervalles de confiance

Sous l’hypothèse d’un résidu gaussien et indépendant de Z, un intervalle de confiance est construit comme suit :

Z+σKqαZ<Z+σKq1−α au risque 2αprès (4.8) où qα est le quantile de la loi normale associé à α. Il est également possible de calculer des intervalles de confiance non symétriques. Soientαetβ les risques respectivement associés à la borne inférieure et à la borne supérieure de l’intervalle de confiance :

Zin f =Z+σKqα et Zsup=Z+σKq1−β (4.9) Les trois configurations possibles sont schématisées sur la Figure4.12.

Complément4.1

a) |z [ Z | ]

(x0) Zin f(x0) Zsup(x0)

Z

b) [ Z | ] |z

(x0)

Zin f(x0) Zsup(x0)

Z

c) [Z | |z ]

(x0)

Zin f(x0) Zsup(x0)

Z

FIGURE 4.12 – Configurations possibles au point x0 par rapport au seuil de contamination z : a) contaminé au risqueαprès ; b) sain au risqueβ près ; c) zone intermédiaire incertaine.

4.4.2 Indicatrice de dépassement de seuil

Dans le cas où la loi du résidu de l’estimation ne vérifie pas les hypothèses requises, une autre approche est proposée. Elle repose sur le krigeage de l’indicatrice de dépassement de seuil1Zz, qui est une approxi-mation de l’espérance conditionnelle. Dans ce travail, l’indicatrice de dépassement de seuil est estimée par cokrigeage avec des covariances simples et croisées numériques et en utilisant comme variable auxiliaire les valeurs d’activité. Des exemples d’indicatrices ainsi estimées sont donnés sur la Figure4.13. Ces résultats sont satisfaisants, puisque l’on retrouve bien les fortes valeurs d’indicatrice à l’intérieur du contour.

40 45 50 55 60

X [m]

Z [m]

−0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Indicatrice

−6−4−20

40 45 50 55 60

X [m]

Z [m]

−0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Indicatrice

−6−4−20

a) b)

FIGURE4.13 – Cokrigeage de l’indicatrice pour les seuils 500 Bq.m-3 (a) et 1000 Bq.m-3 (b). Le trait noir indique l’enveloppe du panache de référence pour ces seuils. Ces cartes sont obtenues en considérant le scénario d’échantillonnage S2.

En utilisant l’estimation de l’indicatrice de dépassement d’un seuil z, les trois zones précédemment décrite sont définies comme suit :

x0 est dans la zone très probablement contaminée siZ(x0)≥zet1Z≥z(x0)≥p1;

x0 est dans la zone très probablement saine siZ(x0)<zet1Zz(x0)<p2;

x0 est dans la zone intermédiaire si aucune des deux conditions précédentes n’est remplie.

L’information sur l’indicatrice permet de conforter (cas 1 et 2) ou de nuancer (cas 3) le résultat de l’estimation. Les valeurs les plus pertinentes de p1 et p2 sont celles permettant d’avoir peu de risques sur la zone très probablement contaminée (risque économique de faux-positif), et encore moins sur la zone très probablement saine (risque sanitaire de faux-négatif). Lorsque p1 augmente, la surface de la zone intermédiaire augmente et celle de la zone très probablement contaminée diminue. Le risque de trouver de la contamination dans la zone intermédiaire augmente et le risque de faux-positif diminue. Inversement, quandp1est plus faible, il y a moins de risque de retrouver de la contamination dans la zone intermédiaire.

D’un point de vue sanitaire, il est donc préférable d’avoir une valeur dep1plutôt faible. Quandp2diminue, la surface de la zone très probablement saine diminue et celle de la zone intermédiaire augmente. Le risque de faux-négatif diminue. Ainsi, d’un point de vue sanitaire, il est également préférable d’avoir une valeur dep2plutôt faible.

4.4.3 Simulations géostatistiques

Des réalisations de fonctions aléatoires peuvent être générées à partir d’une matrice de covariance donnée (Chapitre 2, Section 2.2.5). Ces réalisations permettent de prendre en compte les incertitudes, en travaillant sur la distribution obtenue sur un grand nombre de réalisations. Plusieurs hypothèses sous-jacentes sont nécessaires pour générer ces réalisations, et bien que la validité d’une partie de ces hypothèses soit discutable sur le cas synthétique étudié (Complément 4.2), des simulations conditionnelles ont été réalisées (le conditionnement est effectué par krigeage simple des résidus). Les panaches simulés semblent réalistes (Figure 4.14). Pour tracer des cartes de probabilité de dépassement de seuil, 200 simulations conditionnelles sont générées. Les résultats sont intéressants, puisque les fortes probabilités sont situées à l’intérieur des contours (Figure4.15).

40 45 50 55 60

X [m]

Z [m]

0 1000 2000 3000 4000

Activité [Bq.m−3]

−6−4−20

40 45 50 55 60

X [m]

Z [m]

0 1000 2000 3000 4000

Activité [Bq.m−3]

−6−4−20

FIGURE4.14 – Simulations conditionnées par les données de la référence pour le scénario S2.

40 45 50 55 60

X [m]

Z [m]

0.0 0.2 0.4 0.6 0.8 1.0

Probabilité

−6−4−20

40 45 50 55 60

X [m]

Z [m]

0.0 0.2 0.4 0.6 0.8 1.0

Probabilité

−6−4−20

a) b)

FIGURE4.15 – Cartes des probabilités de dépassement des seuils 500 Bq.m-3(a) et 1000 Bq.m-3(b) obtenues à partir de 200 simulations conditionnées par les données du scénario S2.

Complément4.2

Hypothèses sous-jacentes

La méthode de simulation a été détaillée au Chapitre2(Section2.2.5). La première étape consiste à transformer par anamorphose la référence pour obtenir une distribution gaussienne. Cette étape est discutable dans le cas présent, puisque les simulations de panaches présentent un effet zéro important : sur une partie du domaine de modélisation, l’activité est nulle pour toutes les réali-sations ou presque. Après anamorphose, il faut vérifier que les vecteurs obtenus sont gaussiens (a minimabi-gaussiens). Deux éléments sont étudiés pour confirmer ou infirmer cette hypothèse (Chapitre1, Complément1.2).

Complément4.2

a) Nuages de corrélation

Deux exemples de nuages de corrélation[Y(x1),Y(x2)], oùY est la transformée gaussienne de l’activité, sont présentés sur la Figure4.16, pour deux couples de points pris dans la zone où l’effet zéro est faible. Ces deux nuages ne sont pas elliptiques, ce qui tend à infirmer l’hypothèse que les vecteurs obtenus sont bi-gaussiens.

−2 −1 0 1 2 3

−2−10123

Y(x1)

Y(x2)

−2 −1 0 1 2 3

−2−10123

Y(x1)

Y(x2)

FIGURE4.16 – Nuages de corrélation[Y(x1),Y(x2)]pour deux couples de points.

b) Variogramme et madogramme

L’autre élément à vérifier est le rapport entre la racine du variogramme et le madogramme. Ce rapport est tracé pour tous les couples de points présentant un effet zéro faible en fonction de la distance entre les deux points (Figure4.17). Ce rapport n’est pas constant, ce qui tend également à infirmer l’hypothèse que les vecteurs obtenus sont bi-gaussiens.

0 1 2 3 4

1.71.81.92.0

Distance entre x1 et x2 [m]

γ(x1,x2)γ1(x1,x2)

FIGURE 4.17 – Rapport entre la racine du variogramme et le madogramme en fonction de la distance entre les points. Le trait rouge indique la constante pπ, à laquelle le rapport est égal dans le cas gaussien.

4.4.4 Comparaison des méthodes et discussion

Chacune des trois méthodes proposées présente des avantages et limites, qui sont discutés sur le cas synthétique étudié. L’approche classique basée sur la construction d’intervalles de confiance présente l’avan-tage d’être une méthode conventionnelle et reconnue. Cependant, dans le cas présent, les hypothèses sur la loi des résidus obtenus par krigeage avec variogrammes numériques ne sont pas vérifiées. En effet, sous cette hypothèse, près de la moitié des points du domaine d’étude présentent une borne inférieure d’inter-valle de confiance négative, parfois assez largement. Par ailleurs, en choisissant des risques raisonnables, beaucoup de points de la référence ne sont pas contenus dans les intervalles de confiance calculés.

Le principal inconvénient de la méthode de cokrigeage d’indicatrice est qu’elle repose sur des para-mètresp1etp2arbitraires, sur lesquels aucune étude n’a été menée. Ces paramètres dépendent des risques que l’on peut se permettre de prendre, d’un point de vue sanitaire (selon la substance considérée) et d’un point de vue économique (méthode de dépollution). En revanche, cette méthode ne requiert pas

d’hypo-thèses sur les résidus de krigeage. De plus, puisque les variogrammes simples et croisés de l’activité et des indicatrices sont calculés sur des simulations numériques, ils sont cohérents entre eux.

Le tracé de cartes de probabilité de dépassement de seuil à partir d’un grand nombre de simulations géostatistiques permet d’avoir la distribution en tout point, si la méthode de simulation utilisée est robuste.

À nouveau, il faut se fixer des probabilités au-dessus et en-deçà desquelles les zones contaminées et saines se trouvent. La méthode de simulation proposée ici repose sur un grand nombre d’hypothèses qui ne sont pas toujours vérifiées. Il serait intéressant d’améliorer la méthode pour la rendre plus robuste.

Finalement, des cartes de délimitation en zone contaminée, zone saine et zone intermédiaire sont tracées pour les trois méthodes à partir des données du scénario S2. Les paramètres propres à chaque méthode sont arbitraires, mais ont été choisis de manière à ce que les méthodes soient comparables, dans la mesure du possible. Les risquesαetβ du calcul d’intervalles de confiances valent respectivement 0,05 et 0,1 (ce qui revient à accepter un risque plus élevé sur les faux-positifs, i.e.le risque économique). Les paramètres p1 et p2 de l’indicatrice de dépassement de seuil sont fixés à 0,5 et 0,3. Pour les simulations, les zones contaminées et saines sont situées au-dessus de la probabilité 0,9 et en-deçà de la probabilité 0,3. Les cartes obtenues avec les trois méthodes sont assez semblables (Figure4.18). La zone contaminée apparaît cependant plus étendue pour la méthode de simulations, et la zone intermédiaire est plus étendue avec la méthode des intervalles de confiance.

40 45 50 55 60

Les erreurs associées sont données dans le Tableau4.8. Pour le seuil 500 Bq.m-3, très peu de mailles sont mal classées (faux-positifs et faux-négatifs), quelle que soit la méthode. Pour la méthode des intervalles de confiance, une très large partie de la zone intermédiaire est en réalité saine. C’est également le cas, dans une moindre mesure, pour les simulations. La zone intermédiaire est répartie de manière plus équilibrée entre mailles contaminées et mailles saines pour la méthode de l’indicatrice. Pour le seuil 1000 Bq.m-3, la proportion de faux-positifs augmente, quelle que soit la méthode. À nouveau, une large partie de la zone intermédiaire est en réalité saine pour la méthode des intervalles de confiance, et dans une moindre mesure pour les simulations.

Ainsi, les approches usuelles (intervalles de confiance et simulations) apparaissent plus conservatives et moins risquées d’un point de vue sanitaire : le nombre de faux-négatifs est nul, et seule une faible partie de

la zone intermédiaire est en réalité contaminée. L’approche proposée dans ce travail, basée sur le krigeage d’indicatrices de dépassement de seuil, apparaît légèrement plus risquée (3% de faux négatifs contre 0%

pour le seuil 500 Bq.m-3et 4% pour le seuil 1000 Bq.m-3), mais conduit à une proportion nettement plus faible de la zone intermédiaire en réalité saine. Cela est intéressant d’un point de vue économique et logistique, notamment dans le cas d’une contamination radiologique : le volume de terre stocké dans des sites de stockage de déchets radiologiques, mais en réalité non contaminé, est plus faible que pour les autres approches.

Finalement, les trois méthodes sont assez comparables, et se distinguent surtout par leur mise en œuvre pratique et les hypothèses qu’elles requièrent. Par ailleurs, il est important de noter que dans cette étude, le support considéré pour la décontamination est ponctuel (maillage des simulations réalisées avec ME-LODIE). En réalité, le support dépend de la méthode de dépollution utilisée, et peut atteindre quelques mètres cubes.

TABLEAU4.8 – Pourcentage de mailles mal classées avec les trois méthodes (Inter.=intervalles de confiance ; Indic.=indicatrices de dépassement de seuil ; Simu.=simulations) par rapport à la surface contaminée sur la référence (soit 104 mailles pour le seuil 500 Bq.m-3et 69 pour le seuil 1000 Bq.m-3).

(a) Seuil 500 Bq.m-3

Inter. Indic. Simu.

Faux-positifs 4 4 8

Faux-négatifs 0 3 0

Zone intermédiaire saine 97 24 43

Zone intermédiaire contaminée 23 23 10

(b) Seuil 1000 Bq.m-3 Inter. Indic. Simu.

6 9 13

0 4 0

51 20 42

28 14 13