HAL Id: hal-00883307
https://hal.archives-ouvertes.fr/hal-00883307
Submitted on 1 Jan 1999
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Comparaison d’estimateurs de la ressource forestière
tropicale basés sur plan de sondage et sur modèle
compte tenu d’une post-stratification
Hélène Dessard
To cite this version:
Article
original
Comparaison
d’estimateurs
de la
ressource
forestière
tropicale
basés
sur
plan
de
sondage
et
sur
modèle
compte
tenu
d’une
post-stratification
Hélène Dessard*
Cirad-forêt,
Campus
international deBaillarguet,
BP 5035, 34 032Montpellier
Cedex 1, France(Reçu
le 17 décembre 1998 ;accepté
le 16juin
1999)Abstract -
Comparison
ofdesign-based
and model-based estimates fortropical forestry
resource withpost-stratification.
Forest resource management
planning provides today
theguide
line forharvesting:
the forest is cut inhigh yield
units from which forest managerssuccessively
extractquantities
of timber.Management mapping
needs local assessment of the resource over the whole forest from a forestinventory.
Prediction of the resource is madeby
two methods ofkriging:
one isordinary kriging
and the other one, named stratifiedkriging,
takes into account anauxiliary qualitative
variable. Results obtained from these technics arecompared
with thoseyielded by
classicalsampling.
Thanks to anexhaustively sampled
area, one canjudge
moreobjectively
thesuitability
of eachtechnique.
If the total is similar for the different estimators, variances obtainedby kriging
are smaller. The difference betweenordinary
and stratifiedkriging
concerns the distribution of the estimation.Taking
into account the stratificationwas not very efficient and it
might
be better to use survey estimators. © 1999Inra/Éditions scientifiques
et médicales Elsevier SAS.management
planning
/ forest inventory / kriging /post-stratification
Résumé -
L’exploitation
forestière estaujourd’hui guidée
par unplan d’aménagement,
c’est-à-dire par undécoupage
engrandes
uni-tés de la forêt d’où
l’exploitant
extrait successivement une certainequantité
de bois. L’établissement de ceplan
passe enpremier
lieupar l’estimation locale de la ressource sur l’ensemble de la forêt, effectuée à
partir
d’un inventaire forestier. Laprévision
de la res-source est réalisée par deux méthodes dekrigeage :
l’un est lekrigeage
ordinaire et l’autre,appelé krigeage
stratifié tient compte d’une variable auxiliairequalitative.
Les résultats obtenus par ces diversesprocédures
sontcomparés
à ceux obtenus par les méthodesusuelles relevant de la théorie des
sondages.
Il estégalement possible
dejuger
defaçon plus objective
lapertinence
dechaque
tech-nique
en comparant les estimations des totaux à ceux d’unerégion
échantillonnée exhaustivement. Si le total estimé ne diffèreguère
pour chacune des méthodes les variances sont
plus
faibles pour lesprocédures
dekrigeage.
La distribution des estimations parkrigea-ge stratifié est
plus homogène
que parkrigeage
ordinaire pour un totaléquivalent.
Laprise
en compte de la stratification n’a finale-ment paspermis
d’améliorer les estimations et nous recommandonsplutôt
d’utiliser les estimateurs relevant desplans
desondage.
© 1999
Inra/Éditions scientifiques
et médicales Elsevier SAS.plan
d’aménagement
/ inventaire forestier /krigeage
/post-stratification
1. Introduction
Dans le cadre d’une
gestion
durable de la forêttropi-cale,
les inventaires forestiers servent à établir unplan
*Correspondance
et tirés à part E-mail : dessard@cirad.frd’aménagement.
Au delà de lasimple
estimation de laressource forestière et de sa
précision,
lagestion
des forêtss’appuie
deplus
enplus
[11]
sur ledécoupage
deles autres
pendant
un certain temps. Letemps
de rotationtotal,
c’est-à-dire lapériode
au bout delaquelle
l’exploi-tant revient à la
première
unitéexploitée
doit permettre la reconstitution d’un certain taux de la ressource.Lorsque
leparcellaire
est établi àquantité
de ressourceégale,
en l’occurence à volumeexploitable égal
parunité,
il estbeaucoup plus simple
d’effectuer ledécoupa-ge en unité si l’on
possède
déjàune cartographie
de l’estimation sur l’ensemble de la forêt. Or la construction duparcellaire
est à l’heure actuelle trèsempirique
puisque
les outilspermettant
sonélaboration,
voire sonoptimisation
«automatique
», compte-tenu de diversescontraintes,
quelles
soient de naturegéographiques
oustatistiques,
n’existent pas encore.Classiquement,
les inventaires en forêtstropicales
sont réalisés selon un
plan d’échantillonnage
systéma-tique
en transects continus. Ces transects constituent des unitésprimaires
et sontdécoupés
en unitéssecondaires,
dans ce cas des
placettes rectangulaires contigues,
repé-rées par leur centre
géométrique
et échantillonnées exhaustivement. Le traitementstatistique
devrait enprin-cipe
relever de laprocédure
desingle
stage clustersam-pling
[4]
pour estimer la ressource sur l’ensemble de laforêt. En
revanche,
la délimitation des unitésd’exploita-tion
(UE)
nécessite une estimation locale sur depetites
sous-unités dontl’agrégation
permet
la constitution des UE. Cette estimation localepourrait
être effectuée parexemple
par la méthode des estimateurs à noyaux[ 13] :
il faut
cependant
choisir la taille duvoisinage,
c’est-à-dire un nombre « raisonnable » deplacettes.
Le calcul ducoefficient de variation donnera par la suite une idée de la
précision
de l’estimation. Cette méthode constitue unepremière approche
duproblème
mais reste néanmoins soumise à l’arbitraire duvoisinage.
Traditionnellement,
la méthode
employée,
tout aussi fastidieuse maisplus
simple,
utilise la théorie dessondages
[5]
et consiste pour chacune des UE délimitées apriori,
àappliquer
lesformules de calcul du total
(ou
de lamoyenne)
et de savariance à un échantillon de
placettes
considéré commealéatoire
simple. L’opération
estrépétée
pour diversdécoupages
de la forêt en UEjusqu’à
l’obtention d’UE de volumesapproximativement
égaux
[11].
Une
cartographie
de l’estimation de la ressources’impose
donc comme aide à la constitution duparcellai-re, à condition que la méthode d’estimation soit la
plus
objective
possible,
autrement ditqu’un
critère d’erreur soit minimisé.L’analyse statistique
usuellementemployée néglige
en
général
les corrélations entre les unités secondaires. Cettepratique
estjustifiée
lorsque
la variable d’intérêtest distribuée selon une loi uniforme dans la forêt. En
revanche,
si l’on suppose que la variable mesurée eststructurée
spatialement,
une méthode naturelled’estima-tion
spatiale
qui
prenne encompte
les corrélations est lekrigeage
[1].
On
dispose également
d’une variable auxiliairecor-respondant
autype
de strate forestière déterminée parphoto-interprétation
(carte
de la stratification du massif deSangha-Mbaéré).
On considère que cette informationsupplémentaire
doit apriori
améliorer les estimationslocales
puisque
d’unepart
elle est échantillonnée exhaustivement sur le domaine et d’autrepart
elle estsensée être corrélée avec la variable d’étude.
L’objectif
de ce travail est de comparer deuxapproches
de l’estimation de la ressource :l’une,
baséesur
plan
desondage
et l’autre basée sur un modèle par latechnique
dukrigeage,
compte-tenu
ou non d’une variable auxiliaire de naturequalitative.
Pour
cela,
toutes les estimations sont effectuées ausein d’un bloc du
parcellaire
contenant quatre transectstronqués.
Ce nombre restreint d’unitésprimaires
neper-met pas d’estimer correctement la variance de
l’estima-teur du total de la ressource sur le bloc par
single
stagecluster
[4].
Onexplicitera
donc leshypothèses
émises pour travailler àpartir
deplans
desondage
aléatoirestra-tifié et
post-stratifié.
On aimerait donc
apporter
des élèments deréponse
à deuxquestions :
i)
quelle
est la « meilleure» technique
d’estimation au sens de l’erreurquadratique
moyenne : celle fondée sur unmodèle,
comme dans le cas dukrigeage
ou cellequi
se fonde sur unplan
desondage,
mêmeinadapté
apriori ?
ii)
la stratificationproposée
est ellepertinente,
autre-ment ditpermet-elle
réellement d’améliorer laprécision
des estimateurs de la ressource ? Onpourrait
aussi refor-muler laquestion
dans le sens suivant : la variablerete-nue
explique-t’elle
tout ou enpartie
la stratification ?2.
Matériel
2.1. L’inventaire
d’aménagement
L’inventaire est réalisé selon un
plan
desondage
sys-tématique :
deslayons
de 25 m delargeur espacés
de 1000 m les uns des autres traversent la forêt dans sa
totali-té si bien que la
longueur
dechaque layon
est déterminée par les lisières de la forêt.Chaque layon
estdécoupé
enparcelles
de 100 m delongueur.
Pourchaque parcelle,
2.2. Une variable auxiliaire : la stratification du couvert
Une stratification du couvert forestier a été établie par
[10]
àpartir
del’analyse
dephotographies
aériennes : dix strates ont été déterminées(tableau I).
Les strates 1, 2, 3
représentent
un pourcentage defer-meture du couvert
végétal,
4, 5, 6, 7, 9 caractérisent l’état de la forêt(zones
de recrues, forêtinondable, etc),
tandis que les strates 10 et 11
correspondent
à des forma-tionshomogènes.
2.3. L’inventaire
d’exploitation
Une
parcelle
de 1 500(3
km x 5km)
hectares environ située au centre de la forêt(la
carte de la stratification situel’inventaire)
a été échantillonnéeexhaustivement,
mais à la différence de l’inventaire
d’aménagement,
lescomptages des arbres de diamètre
supérieur
à 120 cmsont tous
regroupés
au sein d’une même classe. Lescomptages
sont effectués au sein dequadrats
de 25 m x25 m de surface. Cet inventaire servira de
jeu
devalida-tion des
techniques
utiliséesaprès
transformation des variables.L’ensemble de l’étude portera sur une essence
com-mercialisée
prioritaire :
leSapelli (Entandrophragma
cylindricum).
Cette essence est à peuprès présente
surl’ensemble de la forêt à raison de 0,5 à 1
tige
par hectare pour des diamètressupérieurs
à 60 cm. Ellereprésente
70 % des
espèces
exploitées
enRépublique
La variable
interpolée
est la surfaceterrière,
c’est-à-dire la surface de la section de tous les arbres à hauteur de1,30
mètre par unitéd’aire,
enprincipe
un hectare. Cette surface sera en fait ramenée à l’unité debase,
c’est-à-dire la
placette
de0,25
hectare. On a choisi la surface terrièreplutôt
que levolume,
usuellementesti-mé,
afin de ne pas utiliser les tarifs decubage qui
ajou-tent un arbitraire aux données brutes.
3.
Méthodes
3.1.
Analyses exploratoires
On
examine,
dans unpremier
temps,
la distribution dela surface terrière à l’aide d’un
histogramme
surl’ensemble de la
forêt,
puis
à l’intérieur des strates pardes
box-plots.
Cesdescriptions
seront suivies d’uneana-lyse
de variance à un facteur à dix modalités enplan
déséquilibré
defaçon
à détecter un effet de lastratifica-tion.
Dans un deuxième
temps,
on examine les données entenant
compte
de leurspatialisation
au moyen duh-scat-terplot.
Introduite par[12],
cetteanalyse
consiste àreprésenter
legraphe
des valeurs observées deZ(x
+h)
contre
Z(x).
Ladispersion
du nuage depoints
autour de la bissectrice reflète la variabilité des mesuresséparées
d’une distance h. La forme du nuage permet de détecter aussi bien des
points qui
présentent
des valeursparticu-lières
qu’une
dérive,
autrementdit,
un écart à lastation-narité.
3.2.
Interpolation
parkrigeage
L’interpolation
est d’abord effectuée parkrigeage
ordinaire
[7],
sans tenir compte de la stratificationpuis
nous utilisons un
système
dekrigeage qui incorpore
unevariable auxiliaire
qualitative.
Ce sont surtout les méthodes decokrigeage
[15],
qui
tiennent compte d’uneou
plusieurs
variables auxiliairesquantitatives, qui
ontfait
l’objet
dedéveloppements théoriques.
Enrevanche,
le cas des variablesexogènes qualitatives
n’est que peu traité[6]
et c’estpourquoi
nous proposons la méthode suivante.3.2.1.
Krigeage stratifié
Modèle
On fait
l’hypothèse
que la variableZ(x)
sedécompose
en une moyenne
m(x)
constante danschaque
strate aupoint
x et un résiduY(x)
qui
vérifiel’hypothèse
station-naire
[15] d’ordre
2 :Avec
Le
covariogramme
C(h)
est donc évalué indifféremment pour toutes lespaires
depoints
x et x +h,
que x et x + happartiennent
à la même strate ou non. Lapart
devaria-bilité
spatiale
éventuellement due à la stratification estdonc
incorporée
dans lecovariogramme.
Système
dekrigeage
On construit de manière
classique
l’estimateur du kri-geageZ
*(x
0
)
aupoint
x0,qui
estlinéaire,
sans biais etdont la variance d’erreur
σ
2
E
=Var(Z*(x
0
) -
Z(x
0
))
estminimale. On note
Z*(x
0
) =
Σ
α
λ
α
Z(x
α
).
La condition denon biais
E[Z*(x
0
) -
Z(x
0
)]
= 0 sedéveloppe
commesuit :
Le
premier
terme de(1)
esttoujours
nul en raison deshypothèses
sur Y. Enrevanche,
pour que le second termesoit
toujours
nul pour tousm
j
etx
α
il suffit que :Il faut noter que
comme Σ
J
j=1
1s
j
(x)
= 1, l’ensemble
despondérateurs
vérifietoujours
Σ
α
λ
α
= 1. Cesystème
depondération
permet donc d’accorder uneimportance
plus
grande
auxpoints
appartenant à la même strateque x
0
(ils
ont unpoids
totalégal
à1)
etplus
faible dans lesautres strates
(le
poids
total y estnul),
tout en les faisant intervenir dans lesystème
dekrigeage.
En notantC
αβ
=E[Y
(x
α
)
Y(x
β
)],
la variance d’erreur s’écrit :La minimisation de
σ
2
E
est
obtenueclassiquement
enles J contraintes
(3).
À
ceteffet,
on introduit lesmultipli-cateurs de
Lagrange
2μ
j
, j
=1,...,
J. On aboutit alors ausystème :
Dans le
système
(4),
C est la matrice n x n descova-riances
C
αβ
,
C
0
est le vecteur de dimension n descova-riances
C
α0
,
A est le vecteur de dimension n despondé-rateurs
λ
α
, μ
est le vecteur de taille J despondérateurs
deLagrange,
et 0 est une matrice J × J dont tous lesélé-ments sont nuls. F est la matrice n x J de l’indicatrice des strates au
point
x
α
:
F
αi
= 1 six
α∈
S
i
etF
αi
= 0 six
α
∉
S
i
.
De la mêmefaçon,
F
0
est le vecteur de taille Jd’appartenance
aux strates.On vérifie aisément que la variance d’estimation vaut
où
σ
2
=Var(Y(x
0
)),
j
0
est la strate aupoint
0 etμ
j
0
lemul-tiplicateur
deLagrange
associé à la strate aupoint
0. 3.2.2. Procédure d’estimation parkrigeage
Ajustement
d’un modèle devariogramme
Il est
plus
usuel de donner lesexpressions
pour levariogramme
mais on retrouve la covariance par la for-muleC(h)
=C(0) -
γ(h).
Levariogramme
retenu est unmodèle
sphérique
deportée
a, de seuilC
1
=C(0),
com-portant un effet de
pépite γ(0),
soit :Il est
plus
usuel de donner lesexpressions
pour le vario-gramme mais on retrouveC(h)
=C
1
-
γ(h).
Le vario-gramme est estimé par :où
N(h) représente
l’ensemble de tous lespoints
i et j
tels qued(x
i
, x
j
)
= h(d
pour la distance
euclidienne)
et
|N(h)|
correspond
au nombre depaires qu’il
contient.Le
variogramme
estajusté
par la méthode desmoindres carrés
[3].
Leparamètre γ(0) appelé
couram-ment « effet de
pépite » correspond
à une discontinuité àl’origine
h = 0. Cettequantité représente
les erreurs demesures, de localisation et surtout la variabilité
résiduel-le du
phénomène qui
s’exprime
aux échelles inférieuresà celles
disponibles
expérimentalement.
Le type de dis-continuité est lié au modèle ets’interprète
en terme derégularité spatiale
du processus étudié. Ainsi dans unmodèle
sphérique,
le comportement àl’origine
estlinéai-re et
témoigne
d’un processus continu mais nondifféren-tiable. La
portée
acorrespond
à la distance au-delà delaquelle
la corrélationspatiale
est nulle etC
1
la valeur maximale atteinte par lacovariance,
c’est-à-direC
1
=C(0)
=γ(∞).
Effet de
support
La formule du
variogramme
donnée ci-dessuscorres-pond
en fait auvariogramme ponctuel,
autrement dit àune variable mesurée sur un support réduit à un
point.
Enpratique,
les données sont engénéral
accessibles àpartir
d’un volume ou d’une
surface,
parexemple
une carottede terre ou une
placette. Implicitement,
on mesure en faitune variable
régularisée,
c’est-à-direintégrée
(ou
moyen-née)
sur sonsupport.
Enprincipe,
l’estimationrequière
l’utilisation d’unvariogramme ponctuel
déduit du vario-grammerégularisé
(estimé
àpartir
desdonnées) [7]
lorsque
l’onprédit
la variable sur un support dedimen-sions différentes. Dans notre cas, nous
prendrons
ceteffet en
compte
lors dukrigeage
de l’inventaire enplein
comme nousl’expliquons
dans leparagraphe
3.4.1.Définition du domaine
d’interpolation
L’interpolation
parkrigeage
sur le bloc est effectuée pour un ensemble de sitesdisposés
selon une maillerégulière
100 m x 25 m entre leslayons
de comptage :ces
points représentent
lebarycentre
desplacettes
inter-polées qui possèdent
alors une surfaceidentique
à celles mesurées. L’estimation est doncponctuelle,
réalisée àpartir
d’un modèle devariogramme (figure
4)
à support considéré commeponctuel. Cependant,
comme les unitésd’échantillonnage
et les unitésprédites
sont en faitrepré-sentées par un
point
pour le même support,l’approxima-tion émise ci-dessus n’a aucune
conséquence
sur lapré-diction.
Calcul de la variance
globale
sur le blocLa variance du total
σ
2
B
prédite
pour le bloc ne sedéduit pas directement de la somme des variances
d’esti-mation
ponctuelles, puisque
lesplacettes
ne sont pasindépendantes.
Soit n le nombre de sites x0d’estimationdu bloc. Pour faciliter la lecture, on
adopte
les notationssuivantes : on note pour les n sites d’estimation
i,
Z*
l’estimateur de la variable au site i et
σ
2
iE
sa varianced’estimation
ponctuelle.
Lespoids
affectés àchaque
observation xαdépendent
du site i si bienqu’ils
sonton a
Les covariances
C
α
iα
l
entre les sites desondage
α
i
etα
l
sont obtenues àpartir
du modèle devariogramme
ajusté
(figure
4).
3.3.
Comparaison
des estimations obtenues pour dessondages
stratifiés etpost-stratifiés
3.3.1.
Explicitation
desapproximations
usuelles L’évaluation de la ressource àpartir
d’inventairestro-picaux
en transects continussystématiques
estusuelle-ment effectuée par
l’emploi
destatistiques simples
maisqui
normalement relèvent deplans
desondage
soit aléa-toiresimple
ou stratifié. Les estimateurs des totaux et de leurs variances sont alors biaisés. Il nousparaît
impor-tant
d’expliciter
leshypothèses
presquetoujours
impli-cites enpratique,
qui
permettent,
enpratique,
l’utilisationde ces
statistiques.
i)
La variable auxiliaire est utilisée comme unepré-stratification alors
qu’en
réalité elleapparaît
comme unepost-stratification.
ii)
Les strates sont considérées commeindépendantes
alors
qu’elles
ont des relationsspatiales qui
laissent sup-poser unecorrélation,
même faible.iii)
Leplan
desondage
est souvent considéré commealéatoire
simple
alorsqu’il
est de typesystématique
simple
à undegré.
Bien que la stratification soit antérieure à la mise en oeuvre de l’inventaire
d’aménagement,
elle n’a pas été utilisée pour la construction d’unplan
desondage
à allo-cationproportionnnelle
ouoptimale
[2] :
eneffet,
les contraintes de terrain en forêttropicale
sont tellesqu’il
est
plus
avantageux
de progresser defaçon
continue,
unefois le
layon
ouvert. Cette information auxiliaire doit donc être en touterigueur
utilisée comme unepost-strati-fication.
L’estimateur
qui
serait apriori
bienadapté
à ce typede
sondage
serait donc un estimateur du total pour unsondage systématique simple
à undegré
où les unités secondaires sontpost-stratifiées.
Toutefois,
l’expression
de la variance de cet estimateur n’est pas
simple
[14]
etson estimation resterait
également approximative
du faitdu nombre de transect trop faible sur le bloc 1
(quatre
transects).
Usuellement,
l’estimateuremployé
est celui du total pour unsondage
aléatoire stratifié. Il comportecepen-dant des biais induits par les
hypothèses
énoncéesci-des-sus. Si
l’objet
de ce travail n’est pas de fournir lesexpressions théoriques
de cesbiais,
il n’en est pas moinsintéressant de comparer les estimations du total et de leur
précision
obtenues pour les estimateurs dukrigeage
et de l’estimateur d’unsondage
post-stratifié.
On note pour la
strate j
indicéepar j :
n
j
le
nombre deplacettes, z
ij
la variable mesurée sur laplacette
α de surfaces
aj
, s
j
la moyenne des surfaces desplacettes, S
j
la surface totale de lastrate j,
z
j
=
1 n
j
α=1
Σ
zαj lavariance
empirique.
Les estimateursrequièrent
uneesti-mation du nombre total d’unités élèmentaires dans
chacune des strates, soit
N
j
=
S
j
s
j
.
Pour les deux types de
sondage,
l’estimateur du totalest
&jadnr;=Σ
N
j
z
j
tandis que les estimateurs de la variance du total sont[4] :
• Stratifié
(S)
• Poststratifié
(P)
Ces deux estimateurs sont sans biais si Nj et
s
2
j
sont
connus, or ces termes ne sont pas forcément accessiblesdans le contexte de cette étude. En
effet,
une UE peuttrès bien contenir une strate non échantillonnée
(figure
5)
puisque
leparcellaire
est conçuaprès
l’inventaire.Ainsi,
Un moyen de
quantifier
les biais introduits par« l’oubli » de la strate 6 est d’utiliser la moyenne de la surface terrière calculée à
partir
de l’échantillon de lastrate 6 sur l’ensemble de la forêt. Ainsi le total dans la
strate 6 est estimé à 16 et la variance est
approchée
de lafaçon
suivante : on alloue un nombre fictif deplacettes
secondaires en
appliquant
à la surface totale de la stratele taux
d’échantillonnage
moyen obtenu sur lebloc,
soit deux à troisplacettes :
la variance serait alorscomprise
entre 671 et 1015. Dans cette
étude,
ce biais estnégli-geable puisque
la surface de la strate 6 étaitpetite
auregard
de la surface du bloc 1 mais il est évident quecelui-ci
peut
très viteaugmenter
avec la taille de lasurfa-ce non-traversée par les
layons.
3.4. Méthode de validation
3.4.1. Procédure de
krigeage
sur l’inventaire enplein
L’inventaire en
plein
permet de comparer lesestima-tions du total et leur
précision
obtenues par lestech-niques
dekrigeage
et desondage.
Les données relevées diffèrent toutefois de celles de l’inventaired’aménage-ment
puisque
d’unepart,
tous les arbres de diamètressupérieurs
à 120 cm sontagrégés
dans une classeunique
et d’autre part, les dimensions de la
placette
unitaire desondage
sont de 25 m x 25 m. On a doncajusté
unmodèle de
variogramme
àpartir
des données de l’inven-taired’aménagement, regroupées
dans une seule classe pour les diamètressupérieurs
à 120 cm. Lekrigeage
aensuite été effectué sur toutes les
placettes
25 m x 25 m.La
procédure
d’interpolation
doit tenir compte de la réduction de la taille desplacettes :
en effet les sitesd’estimation
représentent
en fait une surface(Se)
de0,0625
ha alors que lespoints
desondages
servant à l’estimation duvariogramme
représentent
une surface(S)
de 0.25 ha. On utilise alors latechnique
dukrigeage
par bloc[7]. Concrétement,
chaque
surface est discréti-sée en un certain nombre depoints.
Ondérégularise
levariogramme
γ(h)
estimé sur S pour obtenir levario-gramme
ponctuel
γ
o
(h)
enappliquant
les formulessui-vantes :
et L
correspond
ici à la différence entre laplus grande
longueur
des surfaces soit 75 m.Concrétement,
onremplace
dans lesystème
dekrigea-ge
(4)
C
0
respectivement
parCette déconvolution est basée sur des
règles
empi-riques
et&jadnr;
o
(S,
S)
obtenu à l’aided’abaques
[7].
3.4.2. Mesure de la
qualité
des estimations parkrigeage
La
qualité
de l’estimationpeut
être mesurée par lesquantités
suivantes :et
où
σ
2
(x
α
)
représente
la variance d’estimation aupoint
x
α
due au modèle.
B
correspond
à la moyenne des biais locaux et fournit ainsi une mesure dusur-lissage
ousous-lissage
dukri-geage tandis que
EQP
estimel’adéquation
du modèleaux données.
4.
Résultats
4.1.
Analyses exploratoires
Les
histogrammes
de la surface terrière parplacette
sont
représentés
pour les dix strates(figure
1).
Le
pourcentage
deplacettes
comptant
au moins unarbre de l’essence considérée sur l’ensemble des
pla-cettes appartenant à une même strate est faible
(pour
toutes les
strates),
aussi la classe des valeurs nulles n’est pasreprésentée
afin de pas écraser les autres classes. La distribution de la variableprésente
une formeleptokur-tique classique
en forêttropicale
humide. Lesbox-plot
(figure
2)
par stratesindiquent
des différences dans la distribution de la ressource par strate.L’analyse
de variance à un facteur estsignificative
bien que la
disproportion
des effectifs entre les stratespuisse
diminuer lapuissance
du test.L’analyse
a étéalors reconduite dans un cadre
non-paramétrique :
le testde Kruskal-Wallis
permet
également
derejeter
l’hypo-thèse de l’absence d’un effet strate au seuil de 5 %. Untest de
comparaison multiple
pour toutes les moyennes de type Kruskal-Wallis a étéégalement
effectué au seuilglobal
de 20 % sansqu’aucune
différencesignificative
ne soit détectée. Le résultat de ce test n’est
guère
aucune conclusion hâtive n’est tirée et
l’analyse
estpour-suivie.
Les résultats des
h-scatterplot
sont donnés dans lafigure
3. Ladispersion
des nuages est à la fois assez éta-lée autour de la bissectrice et assez peu variable avecl’augmentation
de l’interdistance hindiquent
des corréla-tionsspatiales
assez faibles. Par contre, aucun écart à lastationnarité n’est détecté.
Quelques
points
ont des fortes valeurs : ilscorrespondent
à desplacettes
contenant des arbres de diamètresexceptionnellement importants
et ontdonc été éliminés de
l’analyse.
4.2.
Comparaison
des estimations obtenues parkrigeage
et parsondage
Les résultats obtenus par les différentes
techniques
dekrigeage
sontcomparés
en les référant à l’estimationpour les
plans
desondage.
Lesparamètres
estimés duvariogramme (figure 4)
sontγ(0)
=0,3245,
C
1
= 0,370 et a = 410 m.Z
T
et V(Z
T
)
correspondent respectivement
à l’estimation du total de la surface terrière sur la zoned’étude et à l’estimation de la variance du total.
Bloc 1
Le total obtenu pour un
plan
desondage
aléatoiresimple
estégal
à 2 159 pour une variance de 160 225. Lavariance obtenue par
post-stratification
et parpré-stratifi-cation sont très
proches
et restentapproximatives
à la fois du fait des estimations du nombre deplacettes,
dutaux moyen de
sondage
et du fait d’une strate nonéchan-tillonnée.
Inventaire en
plein
À
titreindicatif,
nous donnons les estimationssui-vantes. La variance de l’estimateur du total
post-stratifié
est
égale
à 62 102. L’estimation aléatoiresimple
fournitun total de 1 360 avec une variance
égale
à 58 807. La variance pour unéchantillonnage systématique
nonstra-tifié
égale
58 441.Pour les deux
tableaux,
les variances totalesreprésen-tent la somme des variances d’erreurs locales
plus
les covariances entres lesplacettes
calculées àpartir
duvariogramme.
Enrevanche,
si l’on additionne les variancesglobales
obtenues dans les strates, on obtient des totauxlégèrement
inférieurs à ceux obtenus par lecalcul sur le bloc entier : ceci est
simplement
du à la non5. Discussion
5.1. Bloc 1
Les variances obtenues par
post-stratification
et parpré-stratification
sont trèsproches
et restentapproxima-tives à la fois du fait des estimations du nombres de
pla-cettes, du taux moyen de
sondage
et du fait de la strate 6non échantillonnée. Les totaux obtenus par les trois méthodes sont assez
proches
sur l’ensemble du bloc : lesdifférences observées sur les estimations pour les
plans
de
sondage
sont trop faibles pourpréférer
unetechnique
à une autre. En
revanche,
certaines différences sontdes strates pour les
techniques
dekrigeage.
Le total danssinage glissant
utilisé étaitsupérieur
aux dimensions dula strate 6 est
particulièrement
sousestimé,
voireignoré
bloc). Globalement,
lekrigeage
stratifié n’a pasapporté
par la méthode de
krigeage
ordinaire.L’explication
est d’améliorationsintéressantes,
en revanche l’examen dessimilaire à celle donnée dans le cas du
sondage
post-stra-histogrammes
desprédictions
pour les deux méthodes detifié : le nombre de
placettes
entrant dans lesystème
dekrigeage
révèle pourquelques
strates une assezgrande
Les distributions des
prédictions
parkrigeage
stratifiésont
plus
« uniformes » etsymétriques.
Ceci estdirecte-ment lié au
système
de contraintes sur lespoids
des observations :globalement
les observations appartenant à la même strate que le sited’interpolation
sont affectées d’unpoids plus
fort que souskrigeage
ordinaire si bien que l’effet delissage
dukrigeage
estplus important.
Autrement
dit,
àdisposition géomètrique
égale,
les contributions des valeurs faibles des sites de la strates sontplus
élevées que sous KO et diminuent donc ladis-parité
des estimations.Les variances obtenues par
krigeage
sontplus
fortes dans chacune des strates que celles issues d’unplan
desondage :
c’est laprise
encompte
des covariances entreplacettes qui
augmentent les variances intra-strate.Cependant,
les variances estiméesglobales
pour lebloc,
issues du
krigeage
sontbeaucoup plus
faibles que les variances estimées issues dusondage.
Cecis’explique
toutefois par la sous-estimation du seuil duvariogram-me, effet
classique
et inévitable dukrigeage,
et par la minimisationméthodologique
des variances locales. Ainsi[8]
trouve des réductions de variances du même ordre dans une étude similaire en forêttempérée.
5.2. L’inventaire en
plein
Globalement,
laqualité
des résultats obtenus par les deuxtypes
dekrigeage
estidentique
etsatisfaisante,
cequi
corrobore les observationsprécédentes.
Lesurlissage
Une
première comparaison
intéressante montre que leplan
aléatoiresimple
est celuiqui
sous-estime leplus
le total. Les résultats obtenus pour lesprédictions
par kri-geage sont trèslégèrement supérieurs
aux comptagesréels par strates. Ils masquent en réalité un biais local très fort
puisque
sur toutes lesplacettes qui
nepossé-daient pas de
Sapelli,
la méthode dekrigeage
stratifiéprédit
desquantités
dont la somme estégale
à 1 553m
2
(0,25
ha
-1
).
On retrouve évidemment cettecaractéris-tique
avec la méthode desondage
où les erreurs auraient unerépartition
uniforme. On retrouve de nouveau des différences de distribution similaires au bloc 1 despré-dictions par strate entre les deux types de
krigeage
(figures
8 à16).
Les
histogrammes
pour la strate 7 montrent uneten-dance inverse. Ceci
peut
s’expliquer
par le morcellement de la strate 7 encinq petits
ilôts : lekrigeage
stratifiéreporte
davantage
lepoids
sur les observations lesplus
proches
appartenant
à la même strate si bien que les valeurs obtenues sont moinshétérogènes
que dans le casdu
krigeage
ordinaire.6. Conclusion
Dans le cadre de cette
étude,
les méthodes dekrigeage
fournissent des estimationsglobales
moins biaisées que celles fournies par lesplans
desondage.
Néanmoins,
la fiabilité de leur variance reste une sourced’interrogation.
Il semble aussi que la
pertinence
de la stratification soit mise enquestion,
du moins pour évaluer la ressource decette
espèce :
une faible corrélation avec la surfaceter-rière
expliquerait
bien le peu d’améliorations constatéessur les
prédictions lorsqu’elle
utilisée pour les redresser. La détermination des strates est aussisujette
à cautionpuisque
laprécision
des limites est estimée à 100 mètressur le terrain. Le
pourcentage
deplacettes
mal classéesaugmente alors assez vite avec la surface de la strate
(puisque
le nombre deplacettes
en bordure de strateaug-mente)
et par voie deconséquence
la variance du total. Ceci doitexpliquer également
les faibles différencesapportées
par les diverses estimations parsondage
ou parmodèle prenant en
compte
la stratification. L’intérêt de l’utilisation d’un modèledépend
del’objectif
del’utili-sateur : il est évident que si celui-ci ne s’intéresse
qu’à
l’estimation du total sur une zone donnée apriori,
lesméthodes par
sondage
sont de loinpréfèrables
à la fois pour leursimplicité
de mise en oeuvre et pour le tempsde calcul. En
revanche,
si leparcellaire
n’est pas déter-miné apriori,
la méthoded’interpolation
parkrigeage
s’avère fructueuse dans les cas suivants :
- si les corrélations entre
placettes
sont assez fortes pour la variabled’intérêt ;
- si la variable auxiliaire est
assez corrélée à la
variable
d’intérêt,
lekrigeage
stratifiépermet
unemeilleure estimation de la distribution des
prédictions,
sinon lekrigeage
ordinaire est suffisant.Remerciements: Nous remercions G. Cornu pour son
Références
[1] Christman M.C.,
Comparison
of SomeSampling
Designs
forSpatially
ClusteredPopulations, Springer Verlag,
New York, V 122, 1997, pp. 97-101.[2] Cochran W.G.,
Sampling
Technics,Wiley
Series inProbability
and MathematicalStatistics-Applied,
JohnWiley
&Sons, New York, 1977, XVI, 428 p.
[3] Cressie N., Statistics for
Spatial
Data, JohnWiley
&Sons, Inc. New York, 1993.
[4] De Vries P.G.,
Sampling Theory
for ForestInventory,
Springer-Verlag,
1986.[5] F.A.O., Manual of forest
inventory,
withspecial
referen-ce to
tropical
forests, Technical report, Rome, 1973.[6] Goovaerts P., Geostatistics for Natural Resources
Evaluation, Oxford
University
Press, 1997.[7] Journel A.G.,
Huijbregts
C.J.,Mining
Geostatistics,Academic Press, 1978.
[8] Mandallaz D., Geostatistical methods for double
sam-pling
schemes :Application
to combined forest inventories,Technical report, Swiss Federal Institute of
Technology,
Zurich, 1993.
[9] Navarro-Sanchez I., Monestiez P., Allard D., Courault D.,
Kriging
withcategorical
external drift: use of thematicmaps in
spatial prediction
andapplication
to local climateinterpolation
foragriculture,
in:Proceedings
of the SecondEuropean
Conference on Geostastistics for EnvironmentalApplications,
Valencia,Spain,
28-20 nov. 1998.[10] Pain-Orcet M., Stratification de la forêt de
Sangha-mbaéré, Technical report, Cirad-forêt, 1995.
[11] Petrucci B.,
Demarquez
Y., Pland’aménagement
fores-tier du pea n 163
(Sangha-mbaéré),
Manual of forestinventory,
Technical report, CIRAD-Forêt, 1997.[12] Rossi M.E., Assessment of
uncertainty using
geostatis-tics, Environ Metrics 3, 71-79, 1992.
[13] Silverman B.W.,
Density
Estimation,Chapman
andHall, New York, 1986.
[14] Valliant R., Poststratification and conditional variance
estimation, J. Am. Stat. Assoc. 88 (1993) 89-96.