• Aucun résultat trouvé

Y (Meter) Y (Meter)

N/A
N/A
Protected

Academic year: 2022

Partager "Y (Meter) Y (Meter)"

Copied!
24
0
0

Texte intégral

(1)

Enlever les valeurs extrêmes de concentration:

pour quoi faire?

[email protected] CG Fontainebleau

Journées de Géostatistique 18-19 Septembre 2003

(2)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 2

Les valeurs extrêmes de concentration (métaux précieux, poisson, pollution…)

• un problème extrêmement sérieux, vue

l’importance des valeurs extrêmes en abondance globale ou en dépassement de seuil

… mais forte instabilité des statistiques et des outils

• Besoin de méthodes adéquates, avec hypothèses

mesurées (développements en cours pour or et

poisson)

(3)

Une « technique » très répandue:

la suppression des valeurs extrêmes

• … notamment du variogramme, pour calculer une

« structure »

… laquelle pourra servir à un krigeage… excluant ou non les valeurs extrêmes

• Problème abordé ici: que peut-on dire d’une telle technique de façon « théorique »?

est-il possible de construire des modèles géostatistiques qui la légitiment?

par exemple dans lesquels le variogramme « entier » est

identique au variogramme sans extrêmes, ou s’en déduit

simplement (ex: addition de pépite)

(4)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 4

Hypothèses de base

• seront considérées comme valeurs extrêmes: les valeurs au-dessus d’un seuil z donné, supposées peu fréquentes et beaucoup plus fortes que les autres

• ces valeurs extrêmes ne sont pas des valeurs erronées

• a priori elles peuvent se trouver n’importe où dans le champ étudié

• on ignore les incertitudes sur le variogramme calculé

sans les extrêmes: celui-ci est supposé parfaitement

connu

(5)

Le variogramme conditionnel

(6)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 6

• est-ce nécessairement une fonction de type variogramme (conditionnellement définie négative)?

• Lien avec

théoriquement possible connaissant les lois

bivariables (Z(x), Z(x+h)) (géostat non-linéaire, lourde en hypothèses!)

Le variogramme conditionnel, en théorie…

( )

2

( ) 1 ( ) ( ) | ( ) , ( )

z

h 2 E Z x h Z x Z x z Z x h z

γ

=  + − < + <

( )

2

( ) 1 ( ) ( )

h 2 E Z x h Z x

γ =  + −

(7)

Un cas simple:

le modèle mosaïque à valuations indépendantes

• Espace partitionné en compartiments

• On value (tous les points de) chaque

compartiment indépendamment des autres, et selon la même loi

• Deux points à distance h:

– appartiennent à un même compartiment (et ont donc la même valeur) avec proba r(h)

– appartiennent à des compartiments différents (et ont donc des valeurs indépendantes, éventuellement

égales) avec proba γ ( ) h = − 1 r h ( )

(8)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 8

Modèle mosaïque à valuations indépendantes

0.

0.

5000.

5000.

10000.

10000.

15000.

15000.

X (Meter) X (Meter)

0. 0.

5000. 5000.

10000. 10000.

15000. 15000.

Y(Meter) Y(Meter)

(9)

Modèle mosaïque à valuations indépendantes

• La variable Z(x), de même que ses transformées, ont toutes une structure identique à

• Cependant le variogramme (?) sans les extrêmes est différent (plus régulier à petites distances, car on chevauche moins souvent les compartiments):

[ ]

var( | ) ( ) ( )

( ) 1 1 ( ) ( )

z

Z Z z P Z z h

h P Z z h

γ γ

= < < γ

− − <

( ) h 1 r h ( )

γ = −

[ ]

( ) ( )

var( | ) ( ) 1 ( ) ( )

z

z

h h

Z Z z P Z z P Z z h

γ γ

γ

= < < + − <

(10)

Approche additive

(11)

• L’élimination des fortes valeurs suggère le modèle additif:

somme de deux FA ≥ 0 indépendantes:

– fond Z

1

, inférieur au seuil z

– Z

2

responsable du dépassement de seuil

• ce qui permet le calcul de statistiques concernant Z

1

(x) à partir des seuls points de S

1

où Z(x) < z

Approche additive

1 2

( ) ( ) ( )

Z x = Z x + Z x

(12)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 12

• Z2(x) > 0 Z(x) = Z1(x)+Z2(x) ≥ z Z2(x) ≥ z - Z1(x)

• Z1(x) et Z2(x) étant indépendants:

Z2(x) > 0 => Z2(x) ≥ z-min(Z1) ≥ max(Z1) – min(Z1)

rôle très particulier du seuil dans la distribution de Z (bimodale par ex )

Approche additive: distribution

0 z

(13)

Approche additive: structure

• => Modèle structural simple:

• étant supposé connu: ?

– composante supplémentaire, pépite par ex – rescaling si

1 2

( ) ( ) ( )

Z

h h h

γ = γ + γ

, 1

( )

1

( )

Z Z

h h

γ = γ

, 2

( )

2

( )

Z Z

h h

γ = γ

2

( ) h

1

( ) h

γ ≡ γ

1

( ) h

γ γ

Z

( ) h

2

( ) h

γ

1 2

( ) ( ) ( )

Z x = Z x + Z x

(14)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 14

Approche additive: estimation

permet calcul de variance et krigeage sur Z(x)

• modèle bivariable permet calcul de variances et cokrigeage à partir des données:

– Z1(x) et Z2(x)=0 connus sur S1

– Z(x) = Z1(x)+Z2(x) connu sur les autres points S2

(bien que Z1(x) et Z2(x) soient indépendantes, leur cokrigeage n’est pas leur krigeage)

Z

( ) h

γ

(15)

Approche additive: estimation

• Alternative au cokrigeage (non optimale, mais privilégiant la structure de Z

1

, la mieux connue):

– kriger Z

1

, y compris sur S

2

, à partir des seules valeurs non extrêmes Z=Z

1

sur S

1

– en déduire valeurs estimées de Z

2

=Z-Z

1

sur S

2

– estimer Z

2

à partir de ces valeurs estimées de Z

2

sur S

2

et des valeurs nulles de Z

2

sur S

1

(saupoudrage uniforme de la moyenne m

2

de Z

2

si

celle-ci est pépitique)

(16)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 16

Approche additive: conclusions

• intérêt: simplicité du modèle structural et de l’estimation

• inconvénients:

– hypothèse très particulière sur la distribution de valeurs de Z

– Z

1

et Z

2

ne sont connus individuellement qu’aux points de données où Z<z,

l’estimation ne tient pas explicitement compte du fait

que Z

2

est > 0 aux points de données où Z ≥ z

(17)

Approche géométrique

(18)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 18

Approche géométrique: base

• distinction selon l’appartenance aux ensembles

par exemple:

( ) ( )

( ) ( )1

Z x z

( )1

Z x z

Z x = Z x

<

+ Z x

{ | ( ) } A = A

z

= x Z x ≥ z

{ | ( ) }

c c

A = A

z

= x Z x < z

( )1

x Ac

( )1

x A

Z x

Z x

= +

(19)

Approche géométrique

• Eléments à considérer: structures et relations entre

– ensemble A des fortes valeurs – Z dans A

– Z dans A

c

– Z au passage de A

c

à A

(20)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 20

Approche géométrique: modèle simple

avec

indépendants

pouvant faire l’objet d’estimations séparées (mais hétérotopiques)

• Structure de Z = combinaison des structures des 3 variables

1 2

( ) ( )1

x Ac

( )1

x A

Z x = Y x

+ Y x

1

x A

1

( ), 0

Y x entre et z

2

( ),

Y x ≥ z

(21)

Approche géométrique: modèle simple

si et (supposés) quasi-pépitiques:

• Variogramme avec

• Estimation de Y

1

, soit Z | Z<z, se complète par saupoudrage de

en proportion

1

x A

Y x

2

( )

2

[ ( )]

2

[ ( ) | ( ) ] m = E Y x = E Z x Z x ≥ z

[ ]

2

( ) ( ) ( )

Z

h

z

h P Z z pépite

γ ≡ γ

< +

( )

P Z ≥ z

[ ]

2

var var( | ) ( )

pépite = Z − Z Z < z P Z < z

(22)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 22

Approche géométrique: modèle simple

• Un peu plus général (suppose absence d’effets de bord, simples et couplés, de Z dans A et A

c

):

factorisation par:

avec

• estimation par krigeage séparé (isotopique) des facteurs

2 ( )

[ ( ) Z x − m ]1

Z x z

1

Z x( )z

[ ( ) Z x − m

1

]1

Z x( )<z

1

[ ( ) | ( ) ] m = E Z x Z x < z

2

[ ( ) | ( ) ]

m = E Z x Z x ≥ z

(23)

Approche géométrique: modèle simple

• Le modèle simple légitime un krigeage séparé des valeurs de Z inférieures au seuil z

• Il fait jouer un rôle très particulier au seuil: ce qui se passe au-dessus ne dépend pas de ce qui se passe au-dessous. Difficile en particulier

d’étendre à un modèle multi-seuil.

(24)

Ecole des Mines de Paris - Centre de Géostatistique - Sept 03 J. Rivoirard extremes 24

Conclusions

• Dans les cas envisagés, la suppression des valeurs extrêmes permet des techniques

effectivement simples, mais dans des modèles où le seuil joue un rôle très particulier.

• D’autres approches, plus sophistiquées semblent

nécessaires sinon…

Références

Documents relatifs

This output is filtered to provide a strip chart output and drive the readout meter, both of which indicate load power consumption.. The isolation amplifier output also biases

Comme f0g est négligeable rela- tivement à la mesure de lebesgue sur R, le Théorème de continuité de Lebesgue s'applique en prenant la fonction majorante t!. e t

Dans les 2 cas l’effet de pépite n’intervient pas dans les calculs de variance de bloc et variance de dispersion.. L’effet de pépite et les variances

Variable principale : modèle de « lenteurs » pour un modèle de blocs du sous-sol dans le plan défini par 2 forages coplanaires Variable secondaire : temps de

This latest member of Coherent’s power meter line-up combines both a steady digital display and fast analog meter to provide the most economical way to make power measurements.

Pressing the Wave ( λ) button when in Measure mode toggles to the Edit Wavelength mode and initiates an edit cycle. Pressing the Wave button a second time returns the instrument

Figure 4 shows the basic RFID electrical power meter designed to read the RFID card and supplies electricity to the loads.. The working principle of the RFID

Dans une proc´edure d’estimation classique, il est g´en´eralement admis que la variable ´etudi´ee pr´esente une structure spatiale. Cela signifie que les mesures effectu´ees