• Aucun résultat trouvé

3.3 Krigeage simple Méthode du variogramme

3.3.2 Variogramme empirique

La définition du variogramme (3.9) montre qu’il est possible de l’estimer directement à partir des observations X = {h(x1), h(x2), . . . , h(xN)} du champ sans connaître sa

moyenne, si on suppose que le champ est homogène. Par contre, par définition, l’estimation du covariogramme ou du corrélogramme demande d’estimer par avance la moyenne, ce qui pourrait introduire une incertitude d’estimation supplémentaire. Cette remarque nous amène à l’utilisation de l’estimation du variogramme empirique pour identifier le modèle de covariance du champ aléatoire. Les détails de la définition et de la construction du variogramme empirique sont disponibles dans Cressie (1991), Bailey et Gatrell (1995), Journel et Huijbregts (2003), Marcotte (2009) et Sherman (2011). La définition de l’estimation du variogramme empirique retenue ici est la suivante :

ˆ γ(δ) = 1 2N (δ) X |xi−xj|=δ [h(xi) − h(xj)]2 (3.16)

où N (δ) est le nombre de paires de points xi, xj dont l’écart est δ.

Pour l’illustration, considérons un exemple simple dans un cas unidimensionnel. Nous calculons le variogramme empirique à partir d’une trajectoire en utilisant le tableau de données 3.2 suivant.

x 0 3 6 9 12 15 18 21 24 27 30

h(x) 10,87 11,03 10,15 10,29 10,77 9,57 8,94 9,14 9,42 9,36 9,18 Tableau 3.2 – Exemple de variogramme empirique - tableau des données

Pour chaque distance δ, nous trouvons tous les paires possibles de points dont la distance est de δ et nous calculons la différence correspondante des valeurs du champ. Le tableau 3.3 présente le calcul pour δ = 3. Observons que pour δ = 3, le nombre de paires est de

N (δ) = 10, la somme des différences aux carrées est de 3, 0413. La valeur du variogramme

correspondante à la distance δ = 3 est calculée par la formule (3.15) : ˆγ(3) = 0, 152.

Points Distance H(x) Différence

xi xj δ h(xi) h(xj) [h(xi) − h(xj)] 2 0 3 3 10,87 11,03 0,0256 3 6 3 11,03 10,15 0,7744 6 9 3 10,15 10,29 0,0196 9 12 3 10,29 10,77 0,2304 12 15 3 10,77 9,570 1,4400 15 18 3 9,570 8,940 0,3969 18 21 3 8,940 9,140 0,0400 21 24 3 9,140 9,420 0,0784 24 27 3 9,420 9,360 0,0036 27 30 3 9,360 9,180 0,0324

De la même manière, nous pouvons construire le tableau des valeurs du variogramme empirique (Tab. 3.4), et représenter la courbe correspondante (Fig. 3.4).

δ 3 6 9 12 15 18 21 24 27 30

ˆ

γ 0,152 0,324 0,337 0,487 0,828 1,118 0,926 0,969 1,423 1,422 Tableau 3.4 – Variogramme empirique - tableau de calcul pour différentes valeur de δ

0 5 10 15 20 25 30 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 ˆ 

Figure 3.4 – Variogramme empirique estimé à partir des données dans la tableau 3.2

L’exemple précédent est simpliste, notamment parce que les points d’observation sont régulièrement espacés. Ce n’est pas toujours le cas en pratique. On distingue alors deux constructions du variogramme empirique : construction point par point et construction

par intervalles. Celles-ci sont présentées dans les sections suivantes. On se limite au cas

unidimensionnel pour simplifier les notations.

3.3.2.1 Construction point par point

Le variogramme empirique est construit selon les étapes suivantes :

Étape 1 : On génère toutes les paires de points possibles (xi, xj) et on calcule la

distance correspondante de chaque paire δi,j = |xi− xj|. Ces distances sont stockées

dans un ensemble A = {δi,j = |xi− xj| ; i, j = 1, . . . , N }.

Étape 2 : On filtre dans l’ensemble A toutes les valeurs différentes possibles de δi,j

et on les stocke dans un ensemble B = {δk, k = 1, . . . , M }.

Étape 3 : Pour chaque valeur δk, k = 1, . . . , M dans B, on compte dans A le nombre N (δk) de paires (xi, xj) réalisant cette distance δk. On calcule ensuite la somme des

différences aux carrées correspondantes et on les stocke dans un ensemble D.

D =    ∆k = X {(xi,xj):|xi−xj|=δk} [h(xi) − h(xj)]2   

• Étape 4 : On calcule la valeur du variogramme empirique correspondant à chaque valeur δk par la formule : ˆγ(δk) =

k

2N (δk)

et on trace le variogramme empirique point par point avec les couples (δk, ˆγ(δk)).

3.3.2.2 Construction par intervalles

Le variogramme empirique est construit selon les étapes suivantes :

Étape 1 : On génère toutes les paires de points possibles (xi, xj) et on calcule la

distance correspondante de chaque paire δi,j = |xi− xj|. Ces distances sont stockées

dans un ensemble A = {δi,j = |xi− xj| ; i, j = 1, . . . , N }.

• Étape 2 : On divise le domaine

" min(A),max(A) 2 # en K intervalles de taille T = max(A)/2 − min(A)

K . On obtient un ensemble de bornes

Γ = ( δ0 = min(A), . . . , δk = δ0+ kT, . . . , δK = max(A) 2 ) .

Étape 3 : Pour chaque intervalle [δk, δk+1[ , on compte le nombre Nkde paires (xi, xj)

dont la distance δk ≤ δi,j = |xi− xj| < δk+1. On calcule la somme des différences aux

carrées correspondantes et on les stocke dans un ensemble comme dans la méthode précédente.

• Étape 4 : On associe chaque valeur ∆k à une valeur ¯δk moyenne des distances δi,j

tombant dans l’intervalle [δk, δk+1[ :

¯ δk = 1 Nk X {(xi,xj):δi,j∈[δk,δk+1[} δi,j

• Étape 5 : On calcule les valeur du variogramme empirique par la formule : ˆγk =

k

2Nk

et on trace point par point les couples {¯δk, ˆγk}.

3.3.2.3 Remarques sur la construction du variogramme empirique

Marcotte (2009) donne des indications sur les valeurs des paramètres à prendre pour obtenir des variogrammes de bonne qualité.

• Pour chaque point expérimental du variogramme, il faut au moins 30 paires de points, i.e. pour chaque intervalle, N (δ) ≥ 30. Dans le cas où N (δ) ≤ 10, la valeur ˆγ(δ) associée n’est pas considérée comme fiable et on ignore ce point pour la

suite (Sec. 3.3.3).

Le nombre de paires N (δ) diminue lorsque la distance δ augmente. On ne tient donc pas compte des valeurs du variogramme lorsque δ dépasse environ Dmax

2 , où Dmax est la taille du domaine d’observation considéré.

La figure 3.5 présente une réalisation simulée d’un champ aléatoire gaussien et les variogrammes empiriques construits par la méthode “point par point” et la méthode “par intervalles”. On observe que celui construit par la méthode “point par point” est assez dispersé. De plus, le nombre de calculs dans cette méthode est grand car le cardinal M de l’ensemble B (étape 2) est de l’ordre de grandeur de la moitié du nombre de points décrivant la trajectoire.

Pour la suite, on utilise donc la méthode par intervalles pour construire le variogramme. Dans cette méthode, le choix de nombre d’intervalles est très important. Si celui-ci est grand, le nombre de calculs est élevé et le variogramme est alors dispersé. Par contre, s’il est trop petit, le variogramme n’est pas lisible. Pour le choix de ce nombre, nous proposons d’utiliser la formule de Sturges (Sturges,1926), qui donne le nombre de classes optimal à utiliser pour tracer un histogramme à partir d’un échantillon de taille donnée.

K = 1 + 10 log10(M )

3 (3.17)

où K est le nombre de classes de l’histogramme de toutes les distances possibles entre les points et M est le nombre de ces distances.

0 20 40 X 60 80 100 4 6 8 10 12 14 16 H

Moyenne = 10, Variance = 4, Scale = 2, Nugget = 0.5

Champ gaussien - Modele gaussien

0 10 20 30 40 50 h 0 2 4 6 8 10 12 14 16 18 Variogramme

Methode point par point

0 10 20 30 40 50 h 0 1 2 3 4 5 Variogramme

Methode par intervalles

Figure 3.5 – Une réalisation simulée d’un champ gaussien, modèle de covariance gaussien et les variogrammes empiriques construits par la méthodes “point par point” et la méthode “par intervalles”