Comparaison d'estimateurs de la ressource forestière tropicale basés sur plan de sondage et sur modèle compte tenu d'une post-stratification

(1)

HAL Id: hal-00883307

https://hal.archives-ouvertes.fr/hal-00883307

Submitted on 1 Jan 1999

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Comparaison d’estimateurs de la ressource forestière

tropicale basés sur plan de sondage et sur modèle

compte tenu d’une post-stratification

Hélène Dessard

To cite this version:

(2)

Article

_original

Comparaison

d’estimateurs

de la

ressource

forestière

tropicale

basés

sur

plan

de

sondage

et

sur

modèle

compte

tenu

d’une

_{post-stratification}

Hélène Dessard*

Cirad-forêt,

Campus

international de

_Baillarguet,

BP 5035, 34 032

_Montpellier

Cedex 1, France

(Reçu

le 17 décembre 1998 ;

_accepté

le 16

_juin

1999)

Abstract -

_Comparison

of

_design-based

and model-based estimates for

_{tropical forestry}

resource with

_{post-stratification.}

Forest resource _management

_{planning provides today}

the

_guide

line for

_harvesting:

the forest is cut in

_{high yield}

units from which forest managers

successively

extract

_quantities

of timber.

_{Management mapping}

needs local assessment of the resource over the whole forest from a forest

_inventory.

Prediction of the resource is made

_by

two methods of

_kriging:

one is

_{ordinary kriging}

and the other one, named stratified

_kriging,

takes into account an

_{auxiliary qualitative}

variable. Results obtained from these technics are

compared

with those

_{yielded by}

classical

_sampling.

Thanks to an

_{exhaustively sampled}

_area,one can

_judge

more

_objectively

the

suitability

of each

_technique.

If the total is similar for the different estimators, variances obtained

_{by kriging}

are smaller. The difference between

_ordinary

and stratified

_kriging

concerns the distribution of the estimation.

_Taking

into account the stratification

was not very efficient and it

might

Inra/Éditions scientifiques

et médicales Elsevier SAS.

management

planning

/ forest inventory / kriging /

_{post-stratification}

Résumé -

_{L’exploitation}

forestière est

_{aujourd’hui guidée}

par un

_{plan d’aménagement,}

c’est-à-dire par un

_découpage

en

_grandes

uni-tés de la forêt d’où

_{l’exploitant}

extrait successivement une certaine

quantité

de bois. L’établissement de ce

_plan

_passeen

_premier

lieu

par l’estimation locale de la ressource sur l’ensemble de la forêt, effectuée à

_partir

d’un inventaire forestier. La

_prévision

de la res-source est _{réalisée par deux méthodes de}

_{krigeage :}

l’un est le

_krigeage

ordinaire et l’autre,

appelé krigeage

stratifié tient _compte d’une variable auxiliaire

_qualitative.

_{Les résultats obtenus par}ces diverses

_procédures

sont

_comparés

à ceux _{obtenus par les méthodes}

usuelles relevant de la théorie des

_sondages.

Il est

_{également possible}

de

_juger

de

_{façon plus objective}

la

_pertinence

de

_chaque

tech-nique

en comparant les estimations des totaux à ceux d’une

_région

échantillonnée exhaustivement. Si le total estimé ne diffère

_guère

pour chacune des méthodes les variances sont

_plus

_{faibles pour les}

_procédures

de

_krigeage.

La _{distribution des estimations par}

krigea-ge stratifié est

_{plus homogène}

_que_par

_krigeage

_{ordinaire pour}un total

_équivalent.

La

_prise

en _comptede la stratification n’a finale-ment _pas

_permis

d’améliorer les estimations et nous recommandons

_plutôt

d’utiliser les estimateurs relevant des

_plans

de

_sondage.

Inra/Éditions scientifiques

et médicales Elsevier SAS.

plan

d’aménagement

/ inventaire forestier /

_krigeage

/

post-stratification

1. Introduction

Dans le cadre d’une

_gestion

durable de la forêt

tropi-cale,

les inventaires forestiers servent à établir un

_plan

*

Correspondance

et tirés à _part E-mail : dessard@cirad.fr

d’aménagement.

Au delà de la

_simple

estimation de la

ressource forestière et de sa

_précision,

la

_gestion

des forêts

_s’appuie

de

_plus

en

_plus

_[11]

sur le

_découpage

de

(3)

les autres

_pendant

un certain _temps.Le

_temps

de rotation

total,

c’est-à-dire la

_période

au bout de

_laquelle

l’exploi-tant revient à la

_première

unité

_exploitée

doit _permettre la reconstitution d’un certain taux de la ressource.

Lorsque

le

_parcellaire

est établi à

_quantité

de ressource

égale,

en l’occurence à volume

_{exploitable égal}

_par

unité,

il est

_{beaucoup plus simple}

d’effectuer le

découpa-ge en unité si l’on

_possède

_{déjàune cartographie}

de l’estimation sur l’ensemble de la forêt. Or la construction du

_parcellaire

est à l’heure actuelle très

_empirique

puisque

les outils

_permettant

son

_{élaboration,}

voire son

optimisation

«

_automatique

_»,_compte-tenude diverses

contraintes,

quelles

soient de nature

_{géographiques}

ou

statistiques,

n’existent _pasencore.

Classiquement,

les inventaires en forêts

_tropicales

sont réalisés selon un

_{plan d’échantillonnage}

systéma-tique

en transects continus. Ces transects constituent des unités

_primaires

et sont

_découpés

en unités

secondaires,

dans ce cas des

_{placettes rectangulaires contigues,}

repé-rées par leur centre

_{géométrique}

et échantillonnées exhaustivement. Le traitement

_statistique

devrait en

prin-cipe

relever de la

_procédure

de

_single

_stagecluster

sam-pling

[4]

pour estimer la ressource sur l’ensemble de la

forêt. En

_revanche,

la délimitation des unités

d’exploita-tion

_(UE)

nécessite une estimation locale sur de

_petites

sous-unités dont

_{l’agrégation}

_permet

la constitution des UE. Cette estimation locale

_pourrait

être effectuée _par

exemple

par la méthode des estimateurs à noyaux

[ 13] :

il faut

_cependant

choisir la taille du

_voisinage,

c’est-à-dire un nombre « raisonnable » de

_placettes.

Le calcul du

coefficient de variation donnera _parla suite une idée de la

_précision

de l’estimation. Cette méthode constitue une

première approche

du

_problème

mais reste néanmoins soumise à l’arbitraire du

_voisinage.

Traditionnellement,

la méthode

_employée,

tout aussi fastidieuse mais

_plus

simple,

utilise la théorie des

_sondages

_[5]

et consiste pour chacune des UE délimitées a

_priori,

à

_appliquer

les

formules de calcul du total

(ou

de la

_moyenne)

et de sa

variance à un échantillon de

_placettes

considéré comme

aléatoire

_{simple. L’opération}

est

_répétée

pour divers

découpages

de la forêt en UE

_jusqu’à

l’obtention d’UE de volumes

_{approximativement}

_égaux

_[11].

Une

_cartographie

de l’estimation de la ressource

s’impose

donc comme aide à la constitution du

parcellai-re, à _{condition que}la méthode d’estimation soit la

_plus

objective

possible,

autrement dit

_qu’un

critère d’erreur soit minimisé.

L’analyse statistique

usuellement

_{employée néglige}

en

_général

les corrélations entre les unités secondaires. Cette

_pratique

est

_justifiée

_lorsque

la variable d’intérêt

est distribuée selon une loi uniforme dans la forêt. En

revanche,

si l’on _{suppose que la}variable mesurée est

structurée

_{spatialement,}

une méthode naturelle

d’estima-tion

_spatiale

_qui

_prenneen

_compte

les corrélations est le

krigeage

[1].

On

_{dispose également}

d’une variable auxiliaire

cor-respondant

au

_type

de strate _{forestière déterminée par}

photo-interprétation

(carte

de la stratification du massif de

_{Sangha-Mbaéré).}

On considère _quecette information

supplémentaire

doit a

_priori

améliorer les estimations

locales

_puisque

d’une

_part

elle est échantillonnée exhaustivement sur le domaine et d’autre

_part

elle est

sensée être corrélée avec la variable d’étude.

L’objectif

de ce travail est de _comparerdeux

approches

de l’estimation de la ressource :

_l’une,

basée

sur

_plan

de

_sondage

et l’autre basée sur un modèle _parla

technique

du

_krigeage,

_compte-tenu

ou non d’une variable auxiliaire de nature

_qualitative.

Pour

cela,

toutes les estimations sont effectuées au

sein d’un bloc du

_parcellaire

contenant _quatretransects

tronqués.

Ce nombre restreint d’unités

_primaires

ne

per-met _{pas d’estimer}correctement la variance de

l’estima-teur du total de la ressource sur _{le bloc par}

_single

_stage

cluster

_[4].

On

_explicitera

donc les

_hypothèses

émises pour travailler à

partir

de

_plans

de

_sondage

aléatoire

stra-tifié et

_{post-stratifié.}

On aimerait donc

_apporter

des élèments de

_réponse

à deux

_{questions :}

i)

quelle

est la « meilleure

» technique

d’estimation au sens de l’erreur

_quadratique

_{moyenne : celle fondée}sur un

_modèle,

comme dans le cas du

_krigeage

ou celle

_qui

se fonde sur un

_plan

de

_sondage,

même

_inadapté

a

priori ?

ii)

la stratification

_proposée

est elle

_pertinente,

autre-ment dit

_permet-elle

réellement d’améliorer la

_précision

des estimateurs de la ressource ? On

_pourrait

aussi refor-muler la

_question

dans le sens suivant : la variable

rete-nue

_{explique-t’elle}

tout ou en

_partie

la stratification ?

2.

Matériel

2.1. L’inventaire

_{d’aménagement}

L’inventaire est réalisé selon un

_plan

de

_sondage

sys-tématique :

des

_layons

de 25 m de

_{largeur espacés}

de 1

000 m les uns des autres traversent la forêt dans sa

totali-té si bien _{que la}

_longueur

de

_{chaque layon}

est déterminée par les lisières de la forêt.

Chaque layon

est

_découpé

en

parcelles

de 100 m de

_longueur.

Pour

_{chaque parcelle,}

(4)

2.2. Une variable auxiliaire : la stratification du couvert

Une stratification du couvert forestier a été établie _par

[10]

à

_partir

de

_l’analyse

de

_{photographies}

aériennes : dix strates ont été déterminées

(tableau I).

Les strates 1, 2, 3

_{représentent}

un _pourcentagede

fer-meture du couvert

_végétal,

4, 5, 6, 7, 9 caractérisent l’état de la forêt

_(zones

de recrues, forêt

inondable, etc),

tandis _queles strates 10 et 11

_{correspondent}

à des forma-tions

_homogènes.

2.3. L’inventaire

_{d’exploitation}

Une

_parcelle

de 1 500

₍₃

km x 5

km)

hectares environ située au centre de la forêt

_(la

carte de la stratification situe

_{l’inventaire)}

a été échantillonnée

_{exhaustivement,}

mais à la différence de l’inventaire

_{d’aménagement,}

les

comptages des arbres de diamètre

_supérieur

à 120 cm

sont tous

_regroupés

au sein d’une même classe. Les

comptages

sont effectués au sein de

_quadrats

de 25 m x

25 m de surface. Cet inventaire servira de

_jeu

de

valida-tion des

_techniques

utilisées

_après

transformation des variables.

L’ensemble de l’étude _porterasur une essence

com-mercialisée

_{prioritaire :}

le

_{Sapelli (Entandrophragma}

cylindricum).

Cette essence est _{à peu}

_{près présente}

sur

l’ensemble de la forêt à raison de 0,5 à 1

_tige

_{par hectare} pour des diamètres

supérieurs

à 60 cm. Elle

_représente

70 % des

_espèces

_exploitées

en

République

(5)

La variable

_interpolée

est la surface

terrière,

c’est-à-dire la surface de la section de tous les arbres à hauteur de

1,30

mètre par unité

d’aire,

en

_principe

un hectare. Cette surface sera en fait ramenée à l’unité de

_base,

c’est-à-dire la

_placette

de

0,25

hectare. On a choisi la surface terrière

_plutôt

que le

volume,

usuellement

esti-mé,

afin de ne _pasutiliser les tarifs de

_{cubage qui}

ajou-tent un arbitraire aux données brutes.

3.

Méthodes

3.1.

_{Analyses exploratoires}

On

_examine,

dans un

_premier

_temps,

la distribution de

la surface terrière à l’aide d’un

_histogramme

sur

l’ensemble de la

forêt,

puis

à l’intérieur des strates _par

des

_box-plots.

Ces

_descriptions

seront suivies d’une

ana-lyse

de variance à un facteur à dix modalités en

_plan

déséquilibré

de

_façon

à détecter un effet de la

stratifica-tion.

Dans un deuxième

_temps,

on examine les données en

tenant

_compte

de leur

_{spatialisation}

au _moyendu

h-scat-terplot.

Introduite par

[12],

cette

_analyse

consiste à

représenter

le

_graphe

des valeurs observées de

Z(x

+

_h)

contre

_Z(x).

La

_dispersion

_{du nuage de}

_points

autour de la bissectrice reflète la variabilité des mesures

_séparées

d’une distance h. La forme _{du nuage}_permetde détecter aussi bien des

_{points qui}

_présentent

des valeurs

particu-lières

_qu’une

dérive,

autrement

dit,

un écart à la

station-narité.

3.2.

_{Interpolation}

_par

_krigeage

L’interpolation

est _{d’abord effectuée par}

_krigeage

ordinaire

_[7],

sans tenir _comptede la stratification

_puis

nous utilisons un

_système

de

_{krigeage qui incorpore}

une

variable auxiliaire

_qualitative.

Ce sont surtout les méthodes de

_cokrigeage

_[15],

_qui

tiennent _compted’une

ou

_plusieurs

variables auxiliaires

_{quantitatives, qui}

ont

fait

_l’objet

de

_{développements théoriques.}

En

_revanche,

le cas des variables

_{exogènes qualitatives}

_{n’est que peu} traité

_[6]

et c’est

_pourquoi

nous _proposonsla méthode suivante.

3.2.1.

_{Krigeage stratifié}

Modèle

On fait

_{l’hypothèse}

_quela variable

_Z(x)

se

_décompose

en une _moyenne

_m(x)

constante dans

_chaque

strate au

point

x et un résidu

_Y(x)

_qui

vérifie

_{l’hypothèse}

station-naire

_{[15] d’ordre}

2 :

Avec

Le

_{covariogramme}

_C(h)

est donc évalué indifféremment pour toutes les

_paires

de

_points

x et x +

h,

que x et x + h

appartiennent

à la même strate ou non. La

_part

de

varia-bilité

_spatiale

éventuellement due à la stratification est

donc

_incorporée

dans le

_{covariogramme.}

Système

de

_krigeage

On construit de manière

_classique

l’estimateur du kri-geage

Z

*(x

0 )

au

_point

_x₀_,

_qui

est

_linéaire,

sans biais et

dont la variance d’erreur

σ

2 E

=

Var(Z*(x

0 ) -

Z(x

0 ))

est

minimale. On note

_Z*(x

₀

_{) =}

_Σ

_α

_λ

_α

_Z(x

_α

_).

La condition de

non biais

E[Z*(x

0 ) -

_Z(x

₀

_)]

= 0 se

_développe

comme

suit :

Le

_premier

terme de

₍₁₎

est

_toujours

nul en raison des

hypothèses

sur Y. En

revanche,

_{pour que le}second terme

soit

_toujours

_{nul pour}tous

m

j

et

x

α

il suffit que :

Il faut noter _que

comme Σ

J

j=1

1s

j

(x)

= 1

, l’ensemble

des

pondérateurs

vérifie

_toujours

_Σ

_α

_λ

_α

= 1. Ce

_système

de

pondération

permet donc d’accorder une

_importance

_plus

grande

aux

_points

_appartenantà la même strate

_{que x}

₀

(ils

ont un

_poids

total

_égal

à

₁₎

et

_plus

faible dans les

autres strates

_(le

_poids

total _yest

_nul),

tout en les faisant intervenir dans le

_système

de

_krigeage.

En notant

C

αβ

=

_E[Y

(x

α

)

Y(x

β

)],

la variance d’erreur s’écrit :

La minimisation de

_σ

₂

_E

_est

obtenue

_{classiquement}

en

(6)

les J contraintes

_(3).

À

cet

effet,

on introduit les

multipli-cateurs de

_Lagrange

_2μ

_j

_{, j}

=

1,...,

J. On aboutit alors au

système :

Dans le

_système

_(4),

C est la matrice n x n des

cova-riances

_C

_{αβ}

_,

_C

₀

est le vecteur de dimension n des

cova-riances

_C

_α0

_,

A est le vecteur de dimension n des

pondé-rateurs

_λ

_α

_{, μ}

est le vecteur de taille J des

_{pondérateurs}

de

Lagrange,

et 0 est une matrice J × J dont tous les

élé-ments sont nuls. F est la matrice n x J de l’indicatrice des strates au

_point

_x

_α

_:

_F

_αi

= 1 si

x

α∈

_S

_i

et

_F

_αi

= 0 si

x

α

∉

_S

_i

_.

De la même

_façon,

_F

₀

est le vecteur de taille J

d’appartenance

aux strates.

On vérifie aisément _quela variance d’estimation vaut

où

σ

2

=

Var(Y(x

0 )),

j

0

est la strate au

_point

0 et

μ

j

0

le

mul-tiplicateur

de

_Lagrange

associé à la strate au

_point

0. 3.2.2. Procédure d’estimation par

krigeage

Ajustement

d’un modèle de

_variogramme

Il est

_plus

usuel de donner les

_expressions

_{pour le}

variogramme

mais on retrouve la covariance _parla for-mule

_C(h)

=

_{C(0) -}

_γ(h).

Le

_variogramme

_{retenu est}_un

modèle

_sphérique

de

_portée

a, de seuil

_C

₁

=

C(0),

com-portant un effet de

_{pépite γ(0),}

soit :

Il est

_plus

usuel de donner les

_expressions

_{pour le} vario-gramme mais on retrouve

_C(h)

=

C

1 -

γ(h).

Le vario-gramme est _{estimé par :}

où

_{N(h) représente}

l’ensemble de tous les

_points

_{i et j}

tels que

_d(x

_i

_{, x}

_j

₎

= h

_(d

pour la distance

euclidienne)

et

|N(h)|

correspond

au nombre de

_{paires qu’il}

contient.

Le

_variogramme

est

_ajusté

_{par la méthode des}

moindres carrés

_[3].

Le

_{paramètre γ(0) appelé}

couram-ment « effet de

_{pépite » correspond}

à une discontinuité à

l’origine

h = 0. Cette

quantité représente

les erreurs de

mesures, de localisation et surtout la variabilité

résiduel-le du

_{phénomène qui}

_s’exprime

aux échelles inférieures

à celles

_disponibles

_{expérimentalement.}

Le _typede dis-continuité est lié au modèle et

_{s’interprète}

en terme de

régularité spatiale

du _processusétudié. Ainsi dans un

modèle

_sphérique,

le _comportementà

_l’origine

est

linéai-re et

_témoigne

d’un processus continu mais non

différen-tiable. La

_portée

a

_correspond

à la distance au-delà de

laquelle

la corrélation

_spatiale

est nulle et

_C

₁

la valeur maximale atteinte _parla

covariance,

c’est-à-dire

C

1

=

_C(0)

=

_{γ(∞).}

Effet de

_support

La formule du

_variogramme

donnée ci-dessus

corres-pond

en fait au

_{variogramme ponctuel,}

autrement dit à

une variable mesurée sur un _supportréduit à un

_point.

En

pratique,

les données sont en

_général

accessibles à

_partir

d’un volume ou d’une

surface,

par

exemple

une carotte

de terre ou une

_{placette. Implicitement,}

on mesure en fait

une variable

_{régularisée,}

c’est-à-dire

_intégrée

(ou

moyen-née)

sur son

_support.

En

_principe,

l’estimation

_requière

l’utilisation d’un

_{variogramme ponctuel}

déduit du vario-gramme

régularisé

(estimé

à

_partir

des

_{données) [7]}

lorsque

l’on

_prédit

la variable sur un _supportde

dimen-sions différentes. Dans notre cas, nous

prendrons

cet

effet en

_compte

lors du

_krigeage

de l’inventaire en

_plein

comme nous

_{l’expliquons}

dans le

_paragraphe

3.4.1.

Définition du domaine

_{d’interpolation}

L’interpolation

par

krigeage

sur le bloc est effectuée pour un ensemble de sites

_disposés

selon une maille

régulière

100 m x 25 m entre les

_layons

de _{comptage :}

ces

_{points représentent}

le

_barycentre

des

_placettes

inter-polées qui possèdent

alors une surface

_identique

à celles mesurées. L’estimation est donc

_ponctuelle,

réalisée à

partir

d’un modèle de

_{variogramme (figure}

4)

à _support considéré comme

_{ponctuel. Cependant,}

comme les unités

d’échantillonnage

et les unités

_prédites

sont en fait

repré-sentées par un

_point

_{pour le même}_support,

l’approxima-tion émise ci-dessus n’a aucune

_conséquence

sur la

pré-diction.

Calcul de la variance

_globale

sur le bloc

La variance du total

_σ

₂

_B

_prédite

_{pour le}bloc ne se

déduit pas directement de la somme des variances

d’esti-mation

_{ponctuelles, puisque}

les

_placettes

ne sont _pas

indépendantes.

Soit n le nombre de sites _x₀d’estimation

du bloc. Pour faciliter la lecture, on

_adopte

les notations

suivantes : on note _{pour les}n sites d’estimation

i,

_Z*

l’estimateur de la variable au site i et

_σ

₂

_iE

sa variance

d’estimation

_ponctuelle.

Les

_poids

affectés à

_chaque

observation _x_α

_dépendent

du site i si bien

_qu’ils

sont

(7)

on a

Les covariances

_C

_α

_iα

_l

entre les sites de

_sondage

_α

_i

et

_α

_l

sont obtenues à

_partir

du modèle de

_variogramme

_ajusté

(figure

4).

3.3.

_Comparaison

_{des estimations obtenues pour} des

_sondages

stratifiés et

_{post-stratifiés}

3.3.1.

_{Explicitation}

des

_{approximations}

usuelles L’évaluation de la ressource à

_partir

d’inventaires

tro-picaux

en transects continus

_{systématiques}

est

usuelle-ment _{effectuée par}

_l’emploi

de

_{statistiques simples}

mais

qui

normalement relèvent de

_plans

de

_sondage

soit aléa-toire

_simple

ou stratifié. Les estimateurs des totaux et de leurs variances sont alors biaisés. Il nous

_paraît

impor-tant

_{d’expliciter}

les

_hypothèses

_presque

_toujours

impli-cites en

_pratique,

_qui

_permettent,

en

_pratique,

l’utilisation

de ces

_{statistiques.}

i)

La variable auxiliaire est utilisée comme une

pré-stratification alors

_qu’en

réalité elle

_apparaît

comme une

post-stratification.

ii)

Les strates sont considérées comme

_{indépendantes}

alors

_qu’elles

ont des relations

_{spatiales qui}

_laissent sup-poser une

_{corrélation,}

même faible.

iii)

Le

_plan

de

_sondage

est souvent considéré comme

aléatoire

_simple

alors

_qu’il

est de _type

_{systématique}

simple

à un

_degré.

Bien _{que la}stratification soit antérieure à la mise en oeuvre de l’inventaire

_{d’aménagement,}

_{elle n’a pas été} utilisée pour la construction d’un

plan

de

_sondage

à allo-cation

_{proportionnnelle}

ou

_optimale

_{[2] :}

en

_effet,

les contraintes de terrain en forêt

_tropicale

sont telles

_qu’il

est

_plus

_avantageux

de _progresserde

_façon

continue,

une

fois le

_layon

ouvert. Cette information auxiliaire doit donc être en toute

_rigueur

utilisée comme une

post-strati-fication.

L’estimateur

_qui

serait a

_priori

bien

_adapté

à ce _type

de

_sondage

serait donc un estimateur du total _pourun

sondage systématique simple

à un

_degré

où les unités secondaires sont

_{post-stratifiées.}

Toutefois,

l’expression

de la variance de cet _{estimateur n’est pas}

_simple

_[14]

et

son estimation resterait

_{également approximative}

du fait

du nombre de transect _tropfaible sur le bloc 1

_(quatre

transects).

Usuellement,

l’estimateur

_employé

est celui du total pour un

_sondage

aléatoire stratifié. Il _comporte

cepen-dant des biais induits _parles

_hypothèses

énoncées

ci-des-sus. Si

_l’objet

de ce travail n’est _pasde fournir les

expressions théoriques

de ces

_biais,

il n’en est _{pas moins}

intéressant de comparer les estimations du total et de leur

précision

obtenues _{pour les}estimateurs du

_krigeage

et de l’estimateur d’un

_sondage

_{post-stratifié.}

On note _pourla

_{strate j}

indicée

_{par j :}

n

j

le

nombre de

_{placettes, z}

_ij

la variable mesurée sur la

placette

α de surface

_s

_aj

_{, s}

_j

la _moyennedes surfaces des

placettes, S

j

la surface totale de la

_{strate j,}

z

j

=

1 n

j

α=1

Σ

_z_αj la

variance

_empirique.

Les estimateurs

_requièrent

une

esti-mation du nombre total d’unités élèmentaires dans

chacune des strates, soit

_N

_j

=

S

j

s

j

.

Pour les deux _typesde

_sondage,

l’estimateur du total

est

&jadnr;=Σ

N

_j

_z

_j

_{tandis que les}estimateurs de la variance du total sont

[4] :

• _Stratifié

_(S)

• _{Poststratifié}

(P)

Ces deux estimateurs sont sans biais si Nj et

s

2 j

sont

connus, or ces termes ne sont _{pas forcément accessibles}

dans le contexte de cette étude. En

effet,

une UE _peut

très bien contenir une strate non échantillonnée

_(figure

₅₎

puisque

le

_parcellaire

est _conçu

_après

l’inventaire.

Ainsi,

(8)

Un moyen de

_quantifier

_{les biais introduits par}

« l’oubli » de la strate 6 est d’utiliser _{la moyenne de la} surface terrière calculée à

_partir

de l’échantillon de la

strate 6 sur l’ensemble de la forêt. Ainsi le total dans la

strate 6 est estimé à 16 et la variance est

_approchée

de la

façon

suivante : on alloue un nombre fictif de

_placettes

secondaires en

_appliquant

à la surface totale de la strate

le taux

_{d’échantillonnage}

_{moyen obtenu}sur le

bloc,

soit deux à trois

_{placettes :}

la variance serait alors

_comprise

entre 671 et 1015. Dans cette

étude,

ce biais est

négli-geable puisque

la surface de la strate 6 était

_petite

au

regard

de la surface du bloc 1 mais il est _{évident que}

celui-ci

_peut

très vite

_augmenter

avec la taille de la

surfa-ce non-traversée par les

_layons.

3.4. Méthode de validation

3.4.1. Procédure de

_krigeage

sur l’inventaire en

_plein

L’inventaire en

_plein

_permetde _comparerles

estima-tions du total et leur

_précision

obtenues _parles

tech-niques

de

_krigeage

et de

_sondage.

Les données relevées diffèrent toutefois de celles de l’inventaire

d’aménage-ment

_puisque

d’une

_part,

tous les arbres de diamètres

supérieurs

à 120 cm sont

_agrégés

dans une classe

_unique

et d’autre _part,les dimensions de la

_placette

unitaire de

sondage

sont de 25 m x 25 m. On a donc

_ajusté

un

modèle de

_variogramme

à

_partir

des données de l’inven-taire

_{d’aménagement, regroupées}

dans une seule classe pour les diamètres

supérieurs

à 120 cm. Le

_krigeage

a

ensuite été effectué sur toutes les

_placettes

25 m x 25 m.

La

_procédure

_{d’interpolation}

doit tenir compte de la réduction de la taille des

_{placettes :}

en effet les sites

d’estimation

_{représentent}

en fait une surface

_(Se)

de

0,0625

ha alors _queles

_points

de

_sondages

servant à l’estimation du

_variogramme

_{représentent}

une surface

(S)

de 0.25 ha. On utilise alors la

_technique

du

_krigeage

par bloc

[7]. Concrétement,

chaque

surface est discréti-sée en un certain nombre de

_points.

On

_{dérégularise}

le

variogramme

γ(h)

estimé sur S _pourobtenir le

vario-gramme

ponctuel

γ

o

(h)

en

_appliquant

les formules

sui-vantes :

et L

_correspond

ici à la différence entre la

_{plus grande}

longueur

des surfaces soit 75 m.

Concrétement,

on

_remplace

dans le

_système

de

krigea-ge

(4)

C

0 respectivement

par

Cette déconvolution est basée sur des

_règles

empi-riques

et

_&jadnr;

_o

_(S,

_S)

obtenu à l’aide

_d’abaques

_[7].

3.4.2. Mesure de la

_qualité

des estimations par

krigeage

La

_qualité

de l’estimation

_peut

être mesurée _parles

quantités

suivantes :

et

où

_σ

₂

_(x

_α

₎

_représente

la variance d’estimation au

_point

_x

_α

due au modèle.

B

_correspond

à la _moyennedes biais locaux et fournit ainsi une mesure du

_sur-lissage

ou

sous-lissage

du

kri-geage tandis que

EQP

estime

l’adéquation

du modèle

aux données.

4.

Résultats

4.1.

_{Analyses exploratoires}

Les

_histogrammes

de la surface terrière _par

_placette

sont

_{représentés}

_{pour les dix}strates

_(figure

_1).

Le

_pourcentage

de

_placettes

_comptant

au moins un

arbre de l’essence considérée sur l’ensemble des

pla-cettes _appartenantà une même strate est faible

_(pour

toutes les

_strates),

aussi la classe des valeurs nulles n’est pas

représentée

afin de pas écraser les autres classes. La distribution de la variable

_présente

une forme

leptokur-tique classique

en forêt

_tropicale

humide. Les

_box-plot

(figure

2)

par strates

_indiquent

des différences dans la distribution de la ressource _parstrate.

L’analyse

de variance à un facteur est

_{significative}

bien que la

disproportion

des effectifs entre les strates

puisse

diminuer la

_puissance

du test.

_L’analyse

a été

alors reconduite dans un cadre

_{non-paramétrique :}

le test

de Kruskal-Wallis

_permet

_également

de

_rejeter

l’hypo-thèse de l’absence d’un effet strate au seuil de 5 %. Un

test de

_{comparaison multiple}

_pourtoutes les _moyennes de _typeKruskal-Wallis a été

_également

effectué au seuil

global

de 20 % sans

_qu’aucune

différence

_{significative}

ne soit détectée. Le résultat de ce test n’est

_guère

(9)

aucune conclusion hâtive n’est tirée et

_l’analyse

est

pour-suivie.

Les résultats des

_{h-scatterplot}

sont donnés dans la

figure

3. La

_dispersion

des _nuagesest à la fois assez éta-lée autour de la bissectrice et assez _peuvariable avec

l’augmentation

de l’interdistance h

_indiquent

des corréla-tions

_spatiales

assez faibles. Par contre, aucun écart à la

stationnarité n’est détecté.

_Quelques

_points

ont des fortes valeurs : ils

_{correspondent}

à des

_placettes

contenant des arbres de diamètres

_{exceptionnellement importants}

et ont

donc été éliminés de

_l’analyse.

4.2.

_Comparaison

des estimations obtenues par

krigeage

et par

sondage

Les _{résultats obtenus par les différentes}

_techniques

de

krigeage

sont

_comparés

en les référant à l’estimation

pour les

plans

de

sondage.

Les

paramètres

estimés du

variogramme (figure 4)

sont

_γ(0)

=

0,3245,

C

1

= 0,370 et a = 410 _m.

Z

T

et V(Z

T

)

correspondent respectivement

à l’estimation du total de la surface terrière sur la zone

d’étude et à l’estimation de la variance du total.

Bloc 1

Le _{total obtenu pour}un

_plan

de

_sondage

aléatoire

simple

est

_égal

_{à 2 159 pour}une variance de 160 225. La

variance obtenue par

post-stratification

et _par

pré-stratifi-cation sont très

_proches

et restent

_{approximatives}

à la fois du fait des estimations du nombre de

_placettes,

du

taux _moyende

_sondage

et du fait d’une strate non

échan-tillonnée.

Inventaire en

_plein

À

titre

_indicatif,

nous donnons les estimations

sui-vantes. La variance de l’estimateur du total

_{post-stratifié}

est

_égale

à 62 102. L’estimation aléatoire

_simple

fournit

un total de 1 360 avec une variance

_égale

à 58 807. La variance pour un

_{échantillonnage systématique}

non

stra-tifié

_égale

58 441.

Pour les deux

tableaux,

les variances totales

représen-tent la somme des variances d’erreurs locales

_plus

les covariances entres les

_placettes

calculées à

_partir

du

variogramme.

En

revanche,

si l’on additionne les variances

_globales

obtenues dans les strates, on obtient des totaux

_légèrement

inférieurs à ceux obtenus par le

calcul sur le bloc entier : ceci est

_simplement

du à la non

(10)

5. Discussion

5.1. Bloc 1

Les variances obtenues _par

_{post-stratification}

et par

pré-stratification

sont très

_proches

et restent

approxima-tives à la fois du fait des estimations du nombres de

pla-cettes, du taux _{moyen de}

_sondage

et du fait de la strate 6

non échantillonnée. Les totaux obtenus _parles trois méthodes sont assez

_proches

sur l’ensemble du bloc : les

différences observées sur _{les estimations pour les}

_plans

de

_sondage

sont trop faibles _pour

_préférer

une

_technique

à une autre. En

revanche,

certaines différences sont

(11)

des strates pour les

techniques

de

_krigeage.

Le total dans

_{sinage glissant}

utilisé était

_supérieur

aux dimensions du

la strate 6 est

_{particulièrement}

sous

estimé,

voire

_ignoré

_{bloc). Globalement,}

le

_krigeage

stratifié n’a pas

_apporté

par la méthode de

krigeage

ordinaire.

_{L’explication}

est d’améliorations

intéressantes,

en revanche l’examen des

similaire à celle donnée dans le cas du

_sondage

_post-stra-

histogrammes

des

prédictions

_pourles deux méthodes de

tifié : le nombre de

_placettes

entrant dans le

_système

de

_krigeage

_{révèle pour}

_quelques

strates une assez

_grande

(12)

Les distributions des

_prédictions

_par

_krigeage

stratifié

sont

_plus

« uniformes » et

_{symétriques.}

Ceci est

directe-ment lié au

_système

de contraintes sur les

_poids

des observations :

_globalement

les observations _appartenant à la même strate _{que le site}

_{d’interpolation}

sont affectées d’un

_{poids plus}

_{fort que}sous

_krigeage

ordinaire si bien que l’effet de

lissage

du

_krigeage

est

_{plus important.}

Autrement

dit,

à

_{disposition géomètrique}

_égale,

les contributions des valeurs faibles des sites de la strates sont

_plus

_{élevées que}sous KO et diminuent donc la

dis-parité

des estimations.

Les variances obtenues _par

_krigeage

sont

_plus

fortes dans chacune des strates que celles issues d’un

plan

de

sondage :

c’est la

_prise

en

_compte

des covariances entre

placettes qui

augmentent les variances intra-strate.

Cependant,

les variances estimées

_globales

_pourle

bloc,

issues du

_krigeage

sont

_{beaucoup plus}

faibles _{que les} variances estimées issues du

_sondage.

Ceci

_s’explique

toutefois par la sous-estimation du seuil du

variogram-me, effet

_classique

et inévitable du

_krigeage,

et _parla minimisation

_{méthodologique}

des variances locales. Ainsi

_[8]

trouve des réductions de variances du même ordre dans une étude similaire en forêt

_tempérée.

5.2. L’inventaire en

_plein

Globalement,

la

_qualité

_{des résultats obtenus par les} deux

_types

de

_krigeage

est

_identique

et

satisfaisante,

ce

qui

corrobore les observations

_{précédentes.}

Le

_surlissage

(13)

(14)

(15)

Une

_{première comparaison}

intéressante montre _{que le}

plan

aléatoire

_simple

est celui

_qui

sous-estime le

_plus

le total. Les résultats obtenus _{pour les}

_prédictions

_par kri-geage sont très

_{légèrement supérieurs}

aux comptages

réels _parstrates. Ils _masquenten réalité un biais local très fort

_puisque

sur toutes les

_{placettes qui}

ne

possé-daient _pasde

_Sapelli,

la méthode de

_krigeage

stratifié

prédit

des

_quantités

dont la somme est

_égale

à 1 553

m

2 (0,25

ha

-1

).

On retrouve évidemment cette

caractéris-tique

avec la méthode de

_sondage

où les erreurs auraient une

_répartition

uniforme. On retrouve de nouveau des différences de distribution similaires au bloc 1 des

pré-dictions par strate entre les deux _typesde

_krigeage

(figures

8 à

_16).

Les

_histogrammes

_pourla strate 7 montrent une

ten-dance inverse. Ceci

_peut

_{s’expliquer}

_{par le morcellement} de la strate 7 en

_{cinq petits}

ilôts : le

_krigeage

stratifié

reporte

davantage

le

_poids

sur les observations les

_plus

proches

appartenant

à la même strate _{si bien que}les valeurs obtenues sont moins

_{hétérogènes}

_{que dans le}cas

du

_krigeage

ordinaire.

6. Conclusion

Dans le cadre de cette

_étude,

les méthodes de

_krigeage

fournissent des estimations

_globales

moins _{biaisées que} celles fournies _parles

_plans

de

_sondage.

Néanmoins,

la fiabilité de leur variance reste une source

_{d’interrogation.}

Il semble aussi _{que la}

_pertinence

de la stratification soit mise en

_question,

du moins pour évaluer la ressource de

cette

_{espèce :}

une faible corrélation avec la surface

ter-rière

_expliquerait

bien le _peud’améliorations constatées

sur les

_{prédictions lorsqu’elle}

_{utilisée pour les redresser.} La détermination des strates est aussi

_sujette

à caution

puisque

la

_précision

des limites est estimée à 100 mètres

sur le terrain. Le

_pourcentage

de

_placettes

mal classées

augmente alors assez vite avec la surface de la strate

(puisque

le nombre de

_placettes

en bordure de strate

aug-mente)

et _parvoie de

_conséquence

la variance du total. Ceci doit

_{expliquer également}

les faibles différences

apportées

par les diverses estimations par

sondage

ou _par

modèle _prenanten

_compte

la stratification. L’intérêt de l’utilisation d’un modèle

_dépend

de

_l’objectif

de

l’utili-sateur : il est _{évident que si celui-ci}ne s’intéresse

_qu’à

l’estimation du total sur une zone donnée a

_priori,

les

méthodes par

sondage

sont de loin

_{préfèrables}

à la fois pour leur

simplicité

de mise en oeuvre et pour le temps

de calcul. En

revanche,

si le

_parcellaire

n’est _pas déter-miné a

_priori,

la méthode

_{d’interpolation}

_par

_krigeage

s’avère fructueuse dans les cas suivants :

- si les corrélations entre

placettes

sont assez fortes pour la variable

d’intérêt ;

- si la variable auxiliaire est

assez corrélée à la

variable

_{d’intérêt,}

le

_krigeage

stratifié

_permet

une

meilleure estimation de la distribution des

_{prédictions,}

sinon le

_krigeage

ordinaire est suffisant.

Remerciements: Nous _{remercions G. Cornu pour}son

(16)

Références

[1] Christman M.C.,

Comparison

of Some

_Sampling

Designs

for

_Spatially

Clustered

_{Populations, Springer Verlag,}

New York, V 122, 1997, pp. 97-101.

[2] Cochran W.G.,

Sampling

Technics,

Wiley

Series in

Probability

and Mathematical

_{Statistics-Applied,}

John

_Wiley

&

Sons, New _{York, 1977, XVI,}_{428 p.}

[3] Cressie N., Statistics for

_Spatial

Data, John

_Wiley

&

Sons, Inc. New York, 1993.

[4] De Vries P.G.,

Sampling Theory

for Forest

_Inventory,

Springer-Verlag,

1986.

[5] F.A.O., Manual of forest

_inventory,

with

_special

referen-ce to

_tropical

forests, Technical _{report, Rome,}1973.

[6] Goovaerts P., Geostatistics for Natural Resources

Evaluation, Oxford

_University

Press, 1997.

[7] Journel _A.G.,

_Huijbregts

_C.J.,

_Mining

_{Geostatistics,}

Academic Press, 1978.

[8] Mandallaz D., Geostatistical methods for double

sam-pling

schemes :

_Application

to combined forest inventories,

Technical report, Swiss Federal Institute of

_Technology,

Zurich, 1993.

[9] Navarro-Sanchez I., Monestiez P., Allard D., Courault D.,

Kriging

with

_categorical

external drift: use of thematic

maps in

spatial prediction

and

_application

to local climate

interpolation

for

_agriculture,

in:

_Proceedings

of the Second

European

Conference on Geostastistics for Environmental

Applications,

Valencia,

Spain,

28-20 nov. 1998.

[10] Pain-Orcet M., Stratification de la forêt de

Sangha-mbaéré, Technical report, Cirad-forêt, 1995.

[11] Petrucci B.,

Demarquez

Y., Plan

_{d’aménagement}

fores-tier du pea n 163

(Sangha-mbaéré),

Manual of forest

_inventory,

Technical report, CIRAD-Forêt, 1997.

[12] Rossi M.E., Assessment of

_{uncertainty using}

geostatis-tics, Environ Metrics 3, 71-79, 1992.

[13] Silverman B.W.,

Density

Estimation,

Chapman

and

Hall, New York, 1986.

[14] Valliant R., Poststratification and conditional variance

estimation, J. Am. Stat. Assoc. 88 (1993) 89-96.