R EVUE DE STATISTIQUE APPLIQUÉE
P. D AGNELIE
P. F LORINS
Étude du caractère aléatoire de la répartition de points dans des espaces à deux et à trois dimensions
Revue de statistique appliquée, tome 39, n
o1 (1991), p. 11-20
<http://www.numdam.org/item?id=RSA_1991__39_1_11_0>
© Société française de statistique, 1991, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
11
ÉTUDE DU CARACTÈRE ALÉATOIRE
DE LA RÉPARTITION DE POINTS DANS DES ESPACES A DEUX
ET A TROIS DIMENSIONS
P.
DAGNELIE,
P. FLORINSRev.
Statistique Appliquée,
1991, XXXIX iFaculté des Sciences
Agronomiques,
B-5800 Gembloux(Belgique)
RÉSUMÉ
Le
problème
de l’étude du caractère aléatoire de larépartition
depoints
ou d’individus dans des espaces à deux dimensions peut seprésenter également
à trois dimensions.Pour résoudre ce
problème,
lesprincipales
méthodes bidimensionnelles sont trans-posées
à trois dimensions et une méthode nouvelle est introduite(paragraphes
2 et 3). Cesdiverses méthodes sont
comparées
par simulation, en cequi
concerne tant leurs niveaux designification
que leurspuissances (paragraphe
4).Une
application pratique
estégalement présentée (paragraphe
5).Mots-clés : tests du caractère aléatoire à deux et trois dimensions,
répartition
depoints
àdeux et trois dimensions.
ABSTRACT
The
problem
oftesting
the randomness of the distribution ofpoints
or individuals in two-dimensional spaces may also occur in three-dimensional spaces.To solve this
problem,
the mostimportant
two-dimensional methods are extended to three-dimensional spaces and a new method isdeveloped
(sections 2 and 3). All thesemethods are
compared by
simulation,conceming
both theirsignificance
levels and powers (section 4).A
practical application
is alsogiven
(section 5).Key-words :
two- and three-dimensional testsof
randomness, two- and three-dimensional distributionof points.
1. Introduction
L’étude du caractère aléatoire de la
répartition
depoints
ou d’individus(plantes, organismes, etc.)
dans des espaces à deux dimensions est unproblème
classique,
enécologie végétale
notamment[GOUNOT, 1969; GREIG-SMITH,
1967; PIELOU, 1977; etc.].
Ceproblème peut
être traité selon diversesapproches,
comme le montre, entre autres, RIPLEY
[19771.
Un
problème semblable, beaucoup
moinsfréquent
enpratique,
peut se poserégalement
à trois dimensions.Au cours du
paragraphe
2 de cettepublication,
nousprésenterons
brièvementles
principales
méthodes relatives au cas bidimensionnel. Nousenvisagerons
ensuite le cas
tridimensionnel,
en étendant les méthodes bidimensionnelles et enintroduisant une méthode nouvelle
(paragraphe 3),
en exposant lesprincipaux
résultats d’une étude
comparative
réalisée par simulation(paragraphe 4)
et endonnant un
exemple
concretd’application (paragraphe 5).
Nous terminerons enfin parquelques
conclusions(paragraphe 6).
2.
Quelques
tests du caractère aléatoire de larépartition
depoints
dans des espaces à deux dimensions
Les tests
classiques
du caractère aléatoire de larépartition
depoints
ou d’in-dividus dans un espace à deux dimensions sont basés soit sur des
dénombrements,
soit sur des mesures de distances. Dans lapremière catégorie
deméthodes, figurent
le test
d’ajustement
à une distribution de POISSON et le test de l’indice de dis-persion.
Dans la deuxièmecatégorie, figurent
notamment les méthodes basées surl’étude des distances entre individus voisins
(méthode
desplus proches voisins)
ouentre des
points
choisis au hasard et les individus lesplus proches (méthode
desplus proches individus).
2.1. Deux tests basés sur des dénombrements
Les méthodes basées sur des dénombrements supposent
qu’on
aobservé,
dans le domaine
considéré,
un certain nombre d’unités de dimension constante(par exemple
desparcelles
circulaires ou desparcelles carrées, appelées "quadrats"), réparties
de manièrecomplètement aléatoire,
etqu’on
acompté
le nombre depoints
ou d’individus
présents
dans chacune de ces unités.Dans
l’hypothèse
d’unerépartition complètement
aléatoire desindividus,
la distribution des nombres d’individus par unité est une distribution de POISSON etl’hypothèse
émisepeut
être vérifiée par letest X2 d’ajustement [DAGNELIE,
1985-1986].
Dans les mêmes
conditions,
et en fonction despropriétés
des distributions dePOISSON,
la moyenne et la variance du nombre d’individus par unité sont deux valeursthéoriquement égales. L’égalité
de ces deuxparamètres peut
être vérifiée à l’aide du test de l’indice dedispersion,
cet indice étantégal
aurapport
entre lasomme des carrés des écarts observée et la moyenne observée. Pour n unités et
lorsque
larépartition
des individus estcomplètement aléatoire,
la distribution de l’indice dedispersion
est une distributionX2à
n -1degrés
de liberté[DAGNELIE,
1985-1986].
ÉTUDE DU CARACTÈRE ALÉATOIRE DE LA RÉPARTITION DE POINTS 13
On notera que, si le test
d’ajustement
est unilatéral(rejet
del’hypothèse
nullelorsque
la valeur observée de la variablex2
esttrop élevée),
le test de l’indice dedispersion
est au contraire bilatéral(rejet
del’hypothèse
nullelorsque
la valeurobservée de la variable
X2
est soittrop faible,
soittrop élevée).
2.2. Trois tests basés sur des mesures de distances
La méthode des
plus proches
voisins consiste à choisir au hasard un certain nombre d’individus et à mesurer, pour chacun deceux-ci,
la distance auplus proche
voisin[CLARK
etEVANS, 1954].
Si ondésigne par À
le nombre moyen d’individus par unité desurface,
la valeur attendue et la variance de la distance Xau
plus proche
voisin sont :Pour des effectifs suffisamment
élevés,
onpeut
en déduire un testqui permet
de vérifier la conformité de la moyenne observée des distances à la moyenne attendue.L’emploi
de ce test soulèvecependant
diversesdifficultés,
relatives au choix aléatoired’individus,
à l’estimation de la densité A et,lorsque
le nombre de distances mesurées n’est pas suffisammentélevé,
au caractère non normal de la distribution de la distance moyenne.La méthode des
plus proches
individus consiste à choisir aucontraire,
de manièrecomplètement
aléatoireégalement,
un certain nombre depoints
du domaineconsidéré et à
déterminer,
pour chacun de cespoints,
la distance à l’individu leplus proche [MOORE, 1954; SKELLAM, 1952].
Dansl’hypothèse
d’unerépartition complètement
aléatoire desindividus,
laquantité :
c’est-à-dire,
à une constanteprès,
la somme des carrés des distancesYi, possède
une distribution
X2
à 2ndegrés
de liberté. Onpeut
en déduire facilement un test del’hypothèse
du caractère aléatoire de larépartition
des individus.L’emploi
de cette méthode élimine leproblème
du choix aléatoire desindividus,
mais pas celui de l’estimation duparamètre
À.Cette dernière
difficulté,
commune aux deuxméthodes, peut
être écartée encombinant les deux méthodes et en faisant alors
appel
aux distributions F de FISHER-SNEDECOR[HOPKINS, 1954].
Onpeut
en effet démontrer que, pour nul distancesXi
auplus proche
voisin et n2 distancesYi
auplus proche individu,
obtenues
indépendamment
les unes des autres, laquantité :
possède
une distribution F de FISHER-SNEDECOR à2nl
et2n2 degrés
de liberté.Cette
façon
deprocéder
n’éliminecependant
pas leproblème
du choixaléatoire des
individus,
propre au test de CLARK et EVANS.3. Extension à trois dimensions des différents tests 3.1. Tests basés sur des dénombrements
La
transposition
à trois dimensions des deux méthodesprésentées
au para-graphe
2.1(test d’ajustement
à une distribution de POISSON et méthode de l’in- dice dedispersion)
ne soulève aucune difficultéparticulière.
La seule différenceest que les unités dans
lesquelles
doivent êtrecomptés
lespoints
ou les individus considérés sont ici des éléments devolumes, sphériques
oucubiques
parexemple,
au lieu d’être des éléments de
surfaces,
leplus
souvent circulaires ou carrés.3.2. Tests basés sur des mesures de distances
En ce
qui
concerne la méthode desplus proches
voisins(méthode
de CLARKet
EVANS),
onpeut
démontrer que la valeur attendue et la variance de la distanceséparant
un individu choisi au hasard de sonplus proche
voisin est, à trois dimensions :et
Comme à deux
dimensions,
un test du caractère aléatoire de larépartition
desindividus
peut
être réalisé parapproximation normale, quand
le nombre de distances observées est suffisamment élevé.Quant
à l’extension à trois dimensions de la méthode desplus proches
individus
(méthode
de SKELLAM etMOORE),
elle conduit au résultat suivant. SiYi
sont les distances despoints
choisis au hasard aux individus lesplus proches,
la distribution de :
est une distribution
X2
à 2ndegrés
de liberté. Il en résulte un testsimple
del’hypothèse
d’unerépartition complètement
aléatoire des individusconsidérés,
pour autantqu’on
connaisse ouqu’on possède
une bonne estimation de leur densité À(nombre
d’individus par unité devolume).
La méthode de HOPKINS
peut
aussi être étendue à troisdimensions,
d’une manière tout à faitsemblable,
lequotient
des sommes des carrés des distances devant êtreremplacé
par lequotient
des sommes des cubes desdistances,
d’une part entre les individus lesplus proches (méthode
de CLARK etEVANS)
et d’autre15 ÉTUDE DU CARACTÈRE ALÉATOIRE DE LA RÉPARTITION DE POINTS
part
entre lespoints
choisis au hasard et les individus lesplus proches (méthode
de SKELLAM et
MOORE).
3.3. Une méthode nouvelle
En vue de traiter
l’exemple
dont il seraquestion
auparagraphe 5,
nous avonsété amenés à proposer une méthode
nouvelle,
basée sur l’étude des distances des différents individus à leur centre degravité.
Dans le casqui
est considéréci-dessous,
la moyennequadratique
des distances au centre degravité apparaît
eneffet,
toutnaturellement,
comme un bon indice de concentration ou dedispersion
éventuelledes individus.
Pour un ensemble de n
points
de coordonnées(Xi, Yi, Zi),
cette moyennequadratique
est : .X,
y etZ,
etSx, y
etSZ désignant
les moyennes et les variances desXi,
desYi
et desZi.
Dans le cas d’un volume de forme
parallélépipédique,
dont les trois dimen- sions sont wx, wy et wz, onpeut
démontrer quel’espérance mathématique
et lavariance de
Dq
sontapproximativement :
et
ou encore :
lorsque,
enparticulier :
WX = Wy = wu = w.
Ces relations ont été établies en considérant que
D q
est la somme desvariances de trois échantillons aléatoires et
indépendants,
extraits depopulations possédant
des distributions uniformesd’amplitudes respectives
wx, wy et wz.Les
termes -1,05
et-0,5
ont été déterminés de manièreempirique,
dans le but d’assurer une bonneadéquation
des formules pour des effectifs aussi réduits quepossible,
et celaquelles
que soient les valeurs relatives desamplitudes.
A titred’indication,
l’erreur maximum relative àE(Dq)
est de l’ordre de 1% pour 5observations
(n
=5)
et0,5%
pour 10 observations(n
=10), l’approximation
étant donc très
satisfaisante,
même pour des effectifs très réduits.En outre, une étude réalisée par simulation montre que, pour des effectifs
égaux
ousupérieurs
à10,
la distribution deDq peut
être considérée sans aucuninconvénient comme
approximativement
normale.4.
Comparaison
des différentes méthodes relatives aux espaces à trois dimensions4.1.
Principes
Les diverses méthodes décrites au
paragraphe
3 ont étécomparées
parsimulation,
pour différentstypes
derépartitions théoriques.
La
première répartition
étudiée est unerépartition complètement
aléatoirede
points
dans l’ensemble du domaine considéré. L’étude de cetterépartition particulière
a commeobjectif
de vérifier si les niveaux designification
observéspour les différentes méthodes
(erreurs
depremière espèce)
sont bien conformesaux valeurs attendues.
L’étude des autres
répartitions,
detype régulier
et detype agrégatif,
a par contre pourobjectif
de comparer lapuissance
des différentesméthodes,
face à diverses alternatives.Des
répartitions
detype régulier
ont été simulées enpartant
d’un ensemble initial depoints disposés
selon unmaillage
tout à faitsystématique,
et enimposant ensuite,
aux différentspoints,
desdéplacements
aléatoiresplus
ou moinsimportants
par
rapport
à cemaillage.
Quant
auxrépartitions
detype agrégatif,
elles ont été réalisées selon troisprincipes
différents.Le
premier type agrégatif
est constitué de groupes depoints
d’effectifségaux répartis
de manière aléatoire dans le domaine considéré. Le deuxièmetype
derépartition agrégative, qui s’apparente
au modèle de NEYMANtype
A[NEYMAN, 1939],
consiste en unerépartition
aléatoire de groupes depoints
d’effectifsinégaux
distribués selon une loi de POISSON. Et le troisième
type
derépartition agrégative correspond
au modèle POISSON de POISSONprésenté
par THOMAS[1949]
etadapté
par DIGGLE et al.[1976].
4.2. Résultats
En ce
qui
concerne lerisque
depremière espèce,
les résultats obtenus se sont révélés tout à fait satisfaisants pour les différentesméthodes,
au niveau deprobabilité
habituel0,05.
Pour un total deprès
de 2.000simulations,
réalisées dans différentes situations(différentes
densités despopulations notamment),
aucunedifférence
significative
n’est en effet apparue entre lespourcentages
observés derejet
del’hypothèse
du caractère aléatoire et la valeur attendue de 5%.ÉTUDE DU CARACTÈRE ALÉATOIRE DE LA RÉPARTITION DE POINTS 17
En ce
qui
concerne lesrépartitions
nonaléatoires,
detype régulier
et detype agrégatif, plus
de 22.000 simulations ont été réalisées.Globalement,
les conclusions obtenues peuvent être résumées de la manière suivante.Des deux méthodes basées sur des dénombrements
(paragraphe 3.1 ),
laméthode de l’indice de
dispersion
s’avèretoujours plus puissante
que le testd’ajustement
à une distribution de POISSON et,parmi
les trois méthodes baséessur des mesures de distances
(paragraphe 3.2),
les méthodes de SKELLAM etMOORE et de HOPKINS s’avèrent
pratiquement équivalentes
l’une à l’autre ettoujours plus puissantes
que la méthode de CLARK et EVANS. En outre, les méthodes de SKELLAM et MOORE et de HOPKINS sont aussiplus puissantes
que la méthode de l’indice de
dispersion.
Quant
à la méthodeproposée
auparagraphe 3.3,
ellepossède
unepuissance équivalente
à celles des méthodes de SKELLAM et MOORE et deHOPKINS,
enprésence
derépartitions
detype régulier,
et elle se situe entre lesméthodes,
d’unepart,
de SKELLAM et MOORE et deHOPKINS,
et d’autrepart,
de CLARK et EVANS et de l’indice dedispersion,
enprésence
derépartitions
de typeagrégatif.
La
possibilité
d’utiliser simultanément deux méthodes différentes aégalement
été
envisagée,
mais les résultats obtenus dans ce domaine ne se sont pas révélés fort intéressants. Laprincipale
conclusion de cette étudecomplémentaire
est en effetrelative à l’intérêt que peut
présenter
la combinaison des méthodes de CLARK etEVANS et de SKELLAM et MOORE.
Toutefois,
l’utilisationconjointe
de cesdeux méthodes ne fournit pas de conclusions
plus
favorables que la méthode deHOPKINS, qui
estdéjà, elle-même,
une combinaison des deux méthodes considérées.5.
Exemple d’application
5.1. Matériel et méthodes
L’étude dont la
présente publication reprend
certains résultatspartiels
a étéentreprise
initialement en vue de résoudre notamment leproblème
suivant.Des chercheurs s’intéressant au comportement de
poissons cavernicoles,
vivant dans une obscuritétotale,
se demandaient si larépartition
de cespoissons correspond
à un modèlecomplètement
aléatoire ou, aucontraire,
à un modèlede
type régulier
ouagrégatif,
et cela parcomparaison
avec despoissons épigés,
dont le comportement peut être étudié en
présence
ou en absence de lumière[JANKOWSKA
etTHINES, 1982](1).
Dans ce
but,
ces chercheurs ont réalisé unmontage qui
assure, le momentvenu, un éclairement latéral de
l’aquarium
danslequel
lespoissons
sontplacés
etqui
permet deprocéder
à intervallesréguliers
à unephotographie
verticale et unephotographie
transversale del’aquarium,
cesphotographies permettant
elles-mêmes de déterminer danschaque
cas les coordonnées des différentspoissons.
(1) Les données reprises ici sont utilisées avec l’aimable autorisation de ces auteurs, que nous remercions.
Les nombres de
poissons
cavernicolesdisponibles
étant très limités(de
5 à10 individus pour chacune des
espèces considérées),
les méthodes basées sur descomptages (paragraphe 3.1)
étaientinapplicables
et les méthodes basées sur desmesures de distances
(paragraphe 3.2)
étaient elles-mêmes difficilement utilisables.Seule la méthode
présentée
auparagraphe
3.3 est enconséquence
considérée dans la suite à titred’exemple.
5.2. Résultats
Le tableau
qui figure
ci-dessousprésente
les résultats obtenus pourquatre
genre ou
espèces
cavernicoles(Astyanax
gen.,Barbopsis devecchii,
Caecobarbusgeertsi
etUegitglanis zammaranoi),
parcomparaison
avec deuxespèces épigées (Barbus
conchonius etHyphessobricon scholzei),
observées d’unepart
dans l’obs- curité et d’autrepart
en lumièrepermanente.
Pour chacun des cas
considérés,
ce tableaudonne
le nombre d’individus observés n, la distance moyennequadratique
observéedq,
la valeur attendue de la distance moyennequadratique E(Dq ),
la différence entre cesvaleurs,
observéeet
attendue,
l’erreur-standard de la distancemoyenne 03C3(Dq),
et lequotient
dela différence entre les
distances,
observée etattendue,
et l’erreur-standard. Ces différentes informations sont relatives à un volume de 98 x 38 x 38 cm.Le volume réel de
l’aquarium
considéré était en fait de 100 x 40 x 40 cm, mais en fonction de la taille moyenne despoissons,
ce volume a étéconventionnellement réduit d’un centimètre sur toute la surface
extérieure,
de manière à tenircompte
de ce que lespoissons (ou, plus
exactement, lespoints
de
repère
de leurs corpsqui
servaient à leslocaliser)
nepouvaient
pas, enréalité,
être observésjusqu’aux
limites extrêmes del’aquarium.
19 ÉTUDE DU CARACTÈRE ALÉATOIRE DE LA RÉPARTITION DE POINTS
Ce tableau montre que le comportement des
poissons
cavernicoles est nettementplus
aléatoire que lecomportement
despoissons épigés, beaucoup plus grégaires,
et aussi que lecomportement
de ces derniers n’est pas influencé defaçon
sensible par l’existence ou non d’un éclairement
permanent.
Pour lespoissons cavernicoles,
les écarts entre les distances moyennes observées et attendues sont eneffet,
toutes, au maximum de l’ordre degrandeur
del’erreur-standard,
tandisque ces écarts sont de l’ordre de deux fois l’erreur-standard pour B. conchonius et
trois fois l’erreur-standard pour H.
scholzei,
et celaindépendamment
des conditions d’éclairement.6. Conclusions
Le
problème
de l’étude du caractère aléatoire de larépartition
depoints
oud’individus dans des espaces à deux dimensions
peut
être étendu à des espaces à trois dimensions.Les méthodes bidimensionnelles
classiques (test d’ajustement
à une distribu-tion de
POISSON,
test de l’indice dedispersion,
méthode de CLARK etEVANS,
méthode de SKELLAM etMOORE,
et méthode deHOPKINS) peuvent
être trans-posées
à trois dimensions. Les méthodes de SKELLAM et MOORE et de HOP-KINS,
et dans une moindre mesure la méthode de l’indice dedispersion,
s’avèrentles
plus puissantes.
En outre, une méthode
nouvelle,
basée sur l’étude de la moyennequadratique
des distances des individus observés à leur centre de
gravité,
a été introduite. Cette méthode estparticulièrement
bienadaptée
pour traiter le cas d’un nombre réduit d’individus observés dans une enceinte de formeparallélépipédique.
7.
Bibliographie
CLARK P.J. et EVANS F.C.
(1954).
Distance to nearestneighbour
as a measureof
spatial relationships
inpopulations. Ecology 35,
445-453.DAGNELIE P.
(1985-1986).
Théorie et méthodesstatistiques (2 vol.). Gembloux,
Presses
agronomiques,
378 + 463 p.DIGGLE
P.J.,
BESAG J. et GLEAVES J.T.(1976).
Statisticalanalysis
ofspatial point pattern by
means of distance methods. Biometrics32,
659-667.GOUNOT M.
(1969).
Méthodes d’étudequantitative
de lavégétation. Paris, Masson,
314 p.GREIG-SMITH P.
(1967). Quantitative plant ecology. London, Butterworths, 256 p.
HOPKINS B.
(1954).
A new method ofdetermining
the type of distribution ofplant
individuals. Ann. Bot.18,
213-226.JANKOWSKA M. et THINES G.
(1982).
Etudecomparative
de la densité de groupes depoissons
cavernicoles etépigés (Characidae, Cyprinidae,
Clarii-dae).
Behav. Processes7,
281-294.MOORE P.G.
(1954). Spacing
inplant populations. Ecology 35,
222-227.NEYMAN J.
(1939).
On a new class ofcontagious distributions, applicable
inentomology
andbacteriology.
Ann. Math. Stat.10,
35-57.PIELOU E.C.
(1977).
Mathematicalecology.
NewYork, Wiley,
384 p.RIPLEY B.D.
(1977). Modelling spatial
patterns(with discussion).
J.R. Stat. Soc.Ser.
B,
179-212.SKELLAM J.G.
(1952).
Studies in statisticalecology : spatial pattern.
Biometrika39,
346-362.THOMAS M.