R EVUE DE STATISTIQUE APPLIQUÉE
S. C HAMPELY
C H . D ELEUZE
Co-inertie de deux variables aléatoires hilbertiennes et approximation B-spline application en foresterie
Revue de statistique appliquée, tome 43, n
o1 (1995), p. 91-107
<http://www.numdam.org/item?id=RSA_1995__43_1_91_0>
© Société française de statistique, 1995, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
CO-INERTIE DE DEUX VARIABLES
ALÉATOIRES HILBERTIENNES
ET APPROXIMATION B-SPLINE
APPLICATION EN FORESTERIE
S.
Champely,
Ch. DeleuzeBiométrie,
Génétique
etBiologie
desPopulations -
URA 243, UniversitéLyon
I, 43 bd du 11 Novembre 1918, 69622 Villeurbanne Cedex, France.RÉSUMÉ
L’Analyse
enComposantes Principales
(ACP) d’une variable aléatoire hilbertienne est un modèlethéorique
pour définir l’ACP de courbes. Elle nécessite uneapproximation,
iciB-spline,
et une estimation del’opérateur
de covariance pour être réalisable. Enprésence
dedeux collections
appariées
de courbes dont on souhaite étudier les variationsconjointes,
nousproposons un modèle
théorique
de co-inertie (CHESSEL et MERCIER, 1993) de deux variables aléatoires hilbertiennes, extension del’analyse inter-battery (TUCKER, 1958).
Il faut alors unedouble
approximation
par lesB-splines
dans les deux espaces de courbes et une estimationstatistique
del’opérateur
de covariance croisée pour lapratiquer.
La nature des données conduit
parfois
à se limiter à des courbespositives
ou monotones (croissance parexemple).
Des basesparticulières
desplines couplées
à certaines contraintessur les coefficients permettent de respecter la «nature» des courbes estimées. Le retour à une
formulation
B-spline
restepossible.
L’application
concerne l’étude simultanée de la croissance en hauteur et en circonférence d’une centained’Épicéas
communs (Piceaabies).
Mots-clés :
analyse
en composantesprincipales,
co-inertie, courbes de croissance,foresterie,
processus.
SUMMARY
Principal Components Analysis
(PCA) of a random variable with values in aseparable
Hilbert space is a theoretical model to define PCA of curves. It needs an
approximation,
hereprocessed
withB-spline
functions, and an estimation of the covariance operator. We propose a theoretical model of co-inertiaanalysis (CHESSEL
and MERCIER, 1993) for two hilbertian random variables forstudying
simultaneous variations in two matched sets of curves. This isa
straightforward generalization
of TUCKER’sinter-battery analysis (1958).
Weexplain
thedouble
approximation
in each spaceby B-splines
and thesample
estimation of the crossed covariance operator.The very nature of data leads sometimes to
positive
or monotonous curves (for instancegrowth
curves).Special spline
bases can be used with constraints on the parameters toimpose
positivity
ormonotonicity.
These curves can be put into the more convenient form of aB-spline
basis.
The
motivating example
for the present paper is the simultaneousgrowth
inheight
andgirth
of about a hundredNorway
spruces (Picea abies).Keywords :
co-inertiaanalysis, forestry, growth
Curves,principal
componentsanalysis,
process.
1. Introduction
L’étude par des méthodes
d’analyse
multivariée linéaire d’un ensemble de courbes discrétiséespeut
être menée en considérant directement les données sous forme de fonctions. Cette démarche estclassique
enmétéorologie
ou en traitementdu
signal,
sous le nomd’analyse
de Karhunen-Loève(LOÈVE, 1963).
Il n’en va pas de même en foresterie où l’on
peut
seulement citer la contribution d’HOULLIER(1987).
L’auteur propose de réaliser uneapproximation
del’Analyse
en
Composantes Principales (ACP)
de courbes définies par un modèleparamétrique,
par l’intermédiaire d’une ACP sur les
paramètres
du modèlemoyennant
unemétrique
héritée d’un
développement
limité. Ilsouligne
que dans le cas d’un modèle linéaireen ses
paramètres,
cette solution s’avère exacte.Afin d’obtenir une méthode suffisamment
générale d’analyse
decourbes,
ilest bon de s’affranchir de la contrainte que
représente
l’établissement d’un modèleparamétrique unique adéquat,
cequi
n’est pastoujours possible
dans le cas de courbeschaotiques
ou de formes très diversifiées. En outre, des considérations de biaisqualitatifs (GASSER et al., 1984),
du fait que certainescaractéristiques
nepeuvent
êtreprises
encompte
de par la structure du modèlepostulé, peuvent
aussi incliner auchoix d’un modèle
semi-paramétrique.
EL FAOUZI et ESCOUFIER( 1991 ) proposent
un modèle linéaire en ses
paramètres
et« souple » : l’approximation
par lessplines
derégression
que nous reprenons.L’originalité
de l’étude réside dansl’analyse conjointe
de deux mesuresfondamentales de
l’arbre,
la hauteur et lacirconférence,
par une méthode decouplage
de fonctions
appariées.
La section 2 décrit un modèle
théorique d’analyse, englobant
l’ACP de courbes.La suivante en propose un semblable pour le
couplage
de deuxanalyses. L’espace
utilisé pour réaliser l’étude des courbes est ensuite
rapidement présenté.
La section 5rappelle
lespropriétés
essentielles de l’outild’approximation,
les fonctionsB-splines,
tandis que la suivante expose des modèles
dérivés, adaptés
à différentes contraintes naturelles des courbes(monotonie...).
Les sections 7 et 8proposent
lesapproximations B-splines
de l’ACPpuis
ducouplage
des courbes.L’application
au modèlebiologique
fera
l’objet
de la dernière section.2.
Analyse
encomposantes principales
d’une variable aléatoire hilbertienne
Soient
(03A9, A, P)
un espaceprobabilisé
et X(supposée centrée,
sansperte
degénéralité)
une variable aléatoire d’ordre 2 définie sur cet espace à valeurs dans un espace de Hilbert réelséparable
H dont leproduit
scalaire sera noté(.1.) H .
Elle détermine une
application
linéaire continue deHilbert-Schmidt u,
de H dansL2(03A9,A,P), l’espace
de Hilbert des variables aléatoires réelles de carréintégrable :
et son
adjoint
u* :L’ACP de X est définie
(DAUXOIS
etPOUSSE, 1976)
comme la recherche de l’élément a de H de normeunité, appelé
fonctionorthogonale empirique,
tel queu(a)
soit de variancemaximum, et
itérations sous contraintes d’orthonormalité dans H.Soit
l’opérateur
de H dit de covariance. Il est nucléaireauto-adjoint positif.
Les fonctionsorthogonales empiriques
s’obtiennent pardécomposition spectrale
de v :(théorème
deMercer).
Les
composantes principales :
sont des variables aléatoires réelles
centrées,
réduites et non corrélées.3. Co-inertie de deux variables aléatoires hilbertiennes
Soit
(03A9, A, P)
un espaceprobabilisé.
Soient X ety (supposées centrées)
deuxvariables aléatoires d’ordre 2 sur
(03A9, A, P),
à valeurs dans les espaces de Hilbert réelsséparables Hl
etH2,
deproduits
scalaires(.|.)1
et(.1.) 2. D’après
la formule(1),
leurs sont associées lesapplications
linéaires continues de Hilbert-Schmidt uxet uy.
L’analyse
de co-inertie de X ety
est définie comme la recherche des élémentsa de
Hl
et b deH2
de norme unité tels queux (a)
etuy(b)
soient de covariancemaximum,
et itérations sous contraintes d’orthonormalité dansHl
etH2.
Les fonctions
orthogonales empiriques
a et b sont les fonctions propres desopérateurs
nucléairesauto-adjoints positifs :
La covariance maximum est alors :
Cette
proposition
est unegénéralisation
hilbertienne del’analyse
de co-inertie de CHESSEL et MERCIER(1993).
La co-inertieprésente
l’intérêt parrapport
àl’analyse canonique
de deux variables aléatoires hilbertiennes de ne pas entraîner deproblèmes
decompacité
desopérateurs
considérés. Une alternative à la co-inertie de deux ensembles decourbes,
dansl’esprit
del’analyse canonique,
a toutefoisété récemment
proposée
par LEURGANS et al.(1993).
On auraitégalement
pu considérer l’ACPconjointe
de deux ensembles de courbes de RICE et SILVERMAN(1991).
4.
Espaces
de SobolevSi nous nous limitons à l’étude de courbes définies sur un certain intervalle
[a, b],
il suffira que H soit un espace de SobolevHm([03B1, b])
pour couvrir laplupart
de nos besoins.
Cm-1([a, b])
estl’espace
des fonctions dont la dérivée(m - 1)ième
est continue sur[a, b]. f (1)
est la dérivéemième
def.
Les espaces de Sobolev sont des espaces de Hilbert
lorsqu’ils
sont munis deproduits
scalaires dutype :
avec ao = 1 et
0 03B1j ~ 1, 1 ~ j ~
m.Les
analyses
abstraites des sections 2 et 3 ne sont pas, saufexception théorique (par exemple
ACP d’un mouvementbrownien),
réalisables. Enpratique,
il fautchercher une
approximation
à la fois dansl’espace
des variables aléatoires réelles de carréintégrable puisque
seul un nombre fini de courbes a étéobservé,
et dansl’espace
de Hilbert
Hm([03B1, b]) puisqu’on
ne connaît quequelques points
de ces courbes. Afin de lesreconstituer,
nous allonsemployer
des fonctionssplines
etplus particulièrement
une base de
B-splines,
comme BOUHADDOU et al.(1987).
Les bases deB-splines
sont des outils
(généralement)
différents des basessplines
tirées de noyaux auto-reproduisants,
utilisées par BESSE et RAMSAY(1986).
5.
Espace spline
et fonctionsB-splines*
Les fonctions
splines polynomiales
sont des fonctions constituées de morceauxde
polynômes
se raccordantplus
ou moins. Onappelle
espace dessplines polyno-
mialés sur l’intervalle
[a, b]
d’ordre m en les noeudssimples
a = xo xi ...Xk xk+1
= b, l’espace :
P(m) ([03B1, b])
estl’espace
despolynômes
d’ordre m définis sur[a, b].
Sm(0394)
est un sous-espace hilbertien deHm-1([03B1, b])
de dimension r= k+m.
Une base
particulièrement
intéressante de cet espace est celle des fonctionsB-splines polynomiales
normalisées(Bmj(t))j=1,...,r
dont il existeplusieurs définitions,
parexemple
àpartir
de laformule de
DEBOOR-COX-MANSHFIELD :
Il
s’agit
d’une récurrence sur cettepartition :
Pour s =
2, ... ,
m :Les
B-splines possèdent
unsupport restreint,
sontpositives
et forment unepartition
de l’unité.Leur dérivée D
(Bmj (t)) (D
estl’opérateur
dedérivation) s’exprime
en fonctiondes
B-splines
d’ordre inférieur : ,* Les éléments de cette section sont exposés en détail et démontrés dans SCHUMAKER (1981).
FIGURE 1
Base de 6
B-splines
d’ordre 3définie
sur[0,4]
avec trois n0153uds intérieurs(1,2,3).
sachant que pour les deux
B-splines extrêmes,
l’un des termesdisparaît.
Leurintégrale s’exprime
en fonction desB-splines
d’ordresupérieur :
Le
produit
scalaire deLebesgue
de deuxB-splines
se calcule par une
quadrature
de Gauss. Cesproduits
scalaires sontorganisés
dansune matrice
G,
dite de Gram : G =[gij]i,j=1,...,r.
L’interpolation
etl’approximation
aux moindres carrés par les fonctions B-splines
se font au moyen destechniques
habituelles pour les modèles linéaires en leursparamètres,
lessystèmes
linéairesen jeu
étant bien conditionnés(à bandes).
6.
M-splines, 1-splines, B-splines,
étude de diverses contraintesLes
B-splines
sont loin d’être les seules bases desplines
utilisées dans la littératurestatistique.
Si l’onexcepte
les bases tirées de noyauxreproduisants, qui
ressortent d’une théorie
différente,
et que l’on se cantonne auxsplines
derégression,
il est
possible
de citer lesM-splines (CURRY
etSCHOENBERG, 1966),
lesI-splines (RAMSAY, 1988),
les fonctions«puissance tronquée»
ou fonctions «+»(DE BOOR, 1978)...
6.1. Les
M-splines
Elles sont définies à
partir
desB-splines
par :Elles
partagent
le mêmesupport
que lesB-splines,
sontégalement positives,
mais la
propriété
departition
de l’unité estremplacée
par une autre normalisation :~a b Mmj(t)dt
= 1. Cespropriétés
donnent auxM-splines
le statut de densité deprobabilité.
FIGURE 2
Base de 6
M-splines
d’ordre 3définie
sur[0,4]
avec trois n0153uds intérieurs(1,2,3)
6.2. Les
I-splines
La définition
analytique
des1-splines
est :D’où la monotonie de
Im+1j(t)
sur[a, b]
et leségalités : Im+1j(03B1) =
0 etIm+1j(b)
= 1. Ces fonctions ont parconséquent
le statut de fonction derépartition.
FIGURE 3
Base de 6
I-splines
d’ordre 4définie
sur[0,4]
avec trois n0153uds intérieurs(1,2,3)
On
peut
les écrire en fonction desB-splines :
6.3.
Quelques
contraintesMoyennant
des contraintessimples
sur les coefficients(de positivité
ou desomme
unitaire),
il estpossible
de donner des conditions suffisantesd’appartenance
des combinaisons linéaires des éléments de ces bases à des sous-ensembles de
l’espace spline :
fonctionspositives,
fonctions monotones, densités deprobabilité,
fonctionsde
répartition...
TABLEAU 1
Action de
différentes
contraintes(en colonnes)
sur trois bases de
l’espace spline (en lignes) f (t) représente
une combinaison linéaire des éléments des bases respectant les contraintesLes contraintes étant
linéaires,
unalgorithme
detype gradient projeté
convientpour
estimer lesparamètres
aux moindres carrés. Notonségalement
que, du fait dusupport
local de cesfonctions,
il estpossible d’employer
des contraintes depositivité
ou de monotonie seulement sur unepartie
de la courbe(par exemple
audébut d’une courbe de
croissance)
enforçant
lespremiers
coefficients1-splines
à lapositivité.
KELLY et RICE(1990) proposent
un autretype
de contrainte afin de forcer directement lesB-splines
à la monotonie.D’autres contraintes telles que
symétrie
oupériodicité peuvent également
êtreprises
encompte grâce
auxB-splines.
6.4. Retour aux
B-splines
La
procédure
d’estimation des coefficients se déroule doncparfois
depréférence
dans les bases de
M-splines
ouI-splines.
Des formulespermettent
de revenir auxB-splines
afin deréintégrer
les schémasd’analyse proposés
dans les deux sections suivantes.7.
Approximation B-spline
de l’ACP d’une variable aléatoire hilbertienne On considère àprésent
une collection de n courbessplines si(t)
deSm(0394),
résultant d’une
procédure d’interpolation
ou delissage.
Leurs coefficients dans la basede B-splines (Bmj(t))j=1,...,r sont rangés
dans une matrice S =[Sij]i=1...n,j=I...r’ La
probabilité
uniforme(D
=(1/n)In)
estemployée
sur cet espace fini.G(r
xr)
est lamatrice des
produits
scalaires de Sobolev entre les éléments de la base deB-splines,
calculés en combinant formules
(12)
et(14).
En reformulant les
équations (1)
et(2)
avec la restriction deHm-1([a, b])
àS"2 (0), isomorphe
à(Rr, G),
et enemployant l’isomorphisme
entreL2(03A9, A, P)
et(Rn , D),
lesapplications
linéaires continues u et u*s’expriment
comme :Les fonctions
orthogonales empiriques
s’obtiennent(dans
la base deB-splines)
par la
diagonalisation
de la matriceG-symétrique positive :
Soit c,
composante principale, ac
= SGa est de D-norme maximum.On
peut
étudier la convergence de cetteanalyse
vers l’ACP de la variable aléatoire hilbertiennecorrespondante.
8.
Approximation B-spline
de la co-inertie de deux variables aléatoires hilbertiennesOn considère deux ensembles
appariés
de n courbessplines hi(t)
deSm (Ai)
et
gi(t)
deSl(03942).
Leurs coefficients dans les bases deB-splines (Bmj(t))j=1,...,r1 et (B1(t))k=I,...,r2 sont rangés
enlignes
dans des matricesSi
=[Slij]i=1...n,j=1...rl
et
S2 = [S2ik]i=1...n,k=1...r2. Les
matrices de Gramcorrespondantes
sontG1 =
[g1jj’]j,j’=1,...,r1 et G2 = [g2kk’]k,k’=1,...,r2. L’espace probabilisé
conserve laprobabilité
uniforme D.En réécrivant les
équations
de la section 3 dansSm (Ai)
=Hi, Sl(03942)
=H2
(dans
leurs basesB-splines respectives)
et(Rn D) ~ L2(n, 4, P),
on obtient :On cherche à maximiser :
Ces vecteurs h
et g
découlent de ladécomposition
dutriplet statistique (ESCOUFIER, 1987) (S’2DS1, G 1, G2).
Onpeut
étudier la convergence de cetteanalyse
versl’analyse
abstraite de la section 3.9.
Application
à l’étude de la zone forestière d’AmancePour mieux
appréhender
ladynamique
despeuplements forestiers,
il est essentiel d’étudierl’impact
de la structure dupeuplement
à la fois sur la croissanceen circonférence et en hauteur des arbres. En ce
qui
concerne lespeuplements plantés (équiennes**
et souventmonospécifiques),
une des variablesexplicatives
de cettestructure est le nombre de
tiges
à l’hectare : la densité.L’impact
de la densité est différent pour la hauteur et pour la circonférence : il est trèslargement
admis que la croissance en circonférence diminue avec la densité(ASSMANN, 1970; DREYFUS, 1990)
tandis que la croissance en hauteur yparaît beaucoup
moinssensible,
avec desconclusions
parfois
contradictoires. Les fortes densitéspeuvent
avoir un effetpositif, poussant
les arbres à favoriser leur croissance en hauteur pour rester dansl’étage
dominant. ASSMANN
(1970) précise
quel’Épicéa
est une essenceparticulièrement
sensible à de fortes densités pour sa croissance en hauteur. Mais une forte densité a
aussi un effet
négatif
sur lacroissance,
en limitant les ressourcesdisponibles
par arbre(DREYFUS, 1990).
Les études à cesujet
restent rares, les mesures non destructives de hauteur étantplus
délicates à effectuer que celles de la circonférence. Il semble donc intéressant d’étudierconjointement
l’évolution de ces deux croissances.9.1. Le
dispositif expérimental
Les mesures ont été faites sur des arbres abattus dans un clinal
d’Épicéas
communs
(provenance polonaise Istebna)
de la forêtd’Amance, près
deNancy.
Ceclinal avait été mis en
place
en 1970 parl’INRA,
avec ungradient
continu de densité du nord ausud,
sur 60 mètres(les
arbres sont en croissance libre aunord,
et en forte densité ausud;
undescriptif complet
dudispositif peut
être trouvé dansDREYFUS, 1990).
Mise àpart
cette contrainte dedensité,
les arbres sontrépartis
aléatoirement.Les arbres
placés
à l’ouest sontproches
de la lisière etsujets
à des effets de bord.En début d’année
1993,
une très forte éclairciesystématique
a étéfaite,
touchant des arbres de tous les statuts sociaux dans les différentes densités. Elle apermis
deréunir des données
appariées
sur les hauteurs(mesures
des croissances annuellesgrâce
aux cicatrices lelong
du tronc, de 1974 à1990)
et les circonférences(mesures
des cernes annuels d’une
rondelle,
de 1974 à1992),
pourplus
d’une centaine d’arbres d’unevingtaine
d’années.* * terme forestier signifiant que les arbres sont tous du même âge.
Gradient de densité
(tiges
parhectare)
FIGURE 4
Dispositif d’Amance, chaque
carréreprésente
un arbreplanté
9.2. Courbes de croissance en hauteur et en
circonférence
Des
I-Splines
monotones d’ordre 4 ont étéemployées
pour modéliser les crois-sances cumulées
(EL
FAOUZI etESCOUFIER, 1991)
en hauteur et encirconférence,
et rendent
compte
des tendancesgénérales.
FIGURE 5
A
gauche,
modélisationI-spline
de la croissance encirconférence
d’une trentaine
d’Épicéas
sélectionnés aléatoirement(sur 141);
à
droite,
dérivées deces fonctions
FIGURE 6
A
gauche, modélisation I-spline
de la croissance en hauteur d’une trentained’Épicéas
sélectionnésaléatoirement;
à
droite,
les dérivées deces fonctions
La croissance en circonférence a une forme
parabolique,
cequi correspond
à une
augmentation
linéaire de la surface terrière(surface
de la section de tronc àlm30).
La croissance en hauteur est dans sa
phase linéaire,
les arbres étant relativementjeunes,
ils n’ont pas encore atteint lepalier classique
de croissance. Les accroissements montrent que la hauteur a étéplus
durement touchée que la circonférence par la sécheresse de 1976.9.3.
Analyse
de co-inertieIl est courant en foresterie d’étudier les taux de croissance de
préférence
àla croissance elle-même
(HOULLIER et al., 1991). L’analyse
de co-inertie seraeffectuée sur les taux de croissance. Pour ce
faire,
lesI-splines
estimées sur lesdonnées cumulées sont d’abord transformées en
B-splines (formule(19))
afin de sereplacer
dans les schémasd’analyse
définis. On obtient alors les taux de croissanceen dérivant
simplement
les fonctionsB-splines
de croissance(formule (12)).
L’objectif
del’analyse
est degénérer
deux codesa-temporels
de covariancemaximum,
résumant les taux de croissance en hauteur et en circonférence. Maximiser la covariance est uncompromis
entre la maximisation des variances de chacun des codes(objectif
de l’ACP pour ladescription
destructures)
et la maximisation de la corrélation(objectif
del’analyse canonique
pour ladescription
deco-structure).
Pour une
comparaison graphique directe,
les codesappariés
sont normalisés et sontappelés «pseudo-codes canoniques»
pourrappeler
lapart d’analyse canonique qu’ils
contiennent. Comme lesuggèrent
JONES et RICE(1992)
pourl’ACP,
onpeut
sélectionner les valeurs extrêmes de ces codes etreprésenter
les courbescorrespondantes (et
leursdérivées)
pourinterpréter
lespseudo-codes.
Onexprime
ainsi clairement un
aspect
du fouillis desfigures
5 et 6. Lacartographie
de cespseudo-
codes
canoniques permet
ensuitel’interprétation spatiale
des variations.FIGURE 7
A
gauche, représentation
descinq
courbes de hauteurdont le
premier pseudo-code canonique présente
les valeurs minimales et descinq
courbes avec les valeursmaximales;
à
droite,
les dérivées deces fonctions
9.4. Premier code
canonique
Le
premier
code extraitplus
de 95% de la variabilité et traduit un effet taille tout aulong
de la croissance(voir figure 7,
lareprésentation
des courbes pour la circonférence seraitidentique) :
les courbes ne secoupent
pas et le nuage de courbesse
disperse.
Ce résultat estclassique
pour lacirconférence,
moins en cequi
concernela hauteur.
La
répartition spatiale
des codes(Figure 8)
montre une très forte structuration lelong
dugradient
de densité pour la hauteur et pour lacirconférence;
les arbresayant
laplus
forte croissance sont en faible densité. Les deux structuresprésentent
les mêmes
regroupements qui
doiventcorrespondre
à des zones de densité localehomogène.
Ceci estparticulièrement
net pour lapartie
non soumise aux effets debord de la lisière ouest.
Cette forte structure commune est le reflet de la
répartition
sociale des arbres : desgrands
arbres dominants ont unavantage
pour laphotosynthèse
et donc lacroissance. La
pression
socialeaugmentant
avec ladensité,
il estlogique
de trouver lesplus
faibles croissances en hauteur et en circonférence du côté de la forte densité. Enplus
de cet effet du statutsocial,
la distribution des fortes croissances en hauteur montre que la densité a un effetnégatif
sur la croissance en hauteur des arbres dominants.Ceci est très net au delà d’une densité de 4000
t/ha,
mais le passage de 1000 t/ha à 4000 t/ha sur 20mètres,
nepermet
pasd’analyser plus
finement la sensibilité de la hauteur à la densité.9.5. Second code
canonique
Le deuxième code extrait 3% de la variabilité. Il
permet
deséparer
deuxtendances : une croissance
régulière
pour les codes lesplus
faibles ou avec unpalier
pour les codes les
plus
forts(voir figure 9,
là encore seule la hauteur estreprésentée).
FIGURE 8
Cartographie
dupremier pseudo-code canonique,
àgauche
la hauteuret à droite la
circonférence.
Les ronds
(resp. carrés) correspondent
à des valeurspositives (resp. négatives)
de
surface proportionnelle
FIGURE 9
A
gauche, représentation
descinq
courbes de hauteurs dont le secondpseudo-code canonique présente
les valeurs minimaleset à droite les
cinq
courbes avec les valeurs maximalesA
part
deux groupeshomogènes (au
nord-ouest etsud-est),
les deuxrépartitions spatiales (Figure 10)
neprésentent
pas les mêmes similitudes que pour lepremier
code.Pour la croissance en
hauteur,
il sepourrait
que lelong
du bord ouest on retrouveun effet lisière
(meilleur éclairement).
Pour lacirconférence,
la structure lelong
dugradient
de densité est à nouveau trèsforte,
les arbres en faible densitéayant plutôt
une croissance en
palier.
FIGURE 10
Cartographie
du secondpseudo-code canonique,
à
gauche
la hauteur et à droite lacirconférence
Il est
possible d’interpréter
ces résultats en termes de fermeture du couvert forestier et d’installation de relations decompétition.
En effet les arbres en faible densité sontquasiment
en croissance libre lespremières années,
le couvert forestierse refermant assez
tardivement, puis
leur croissance ralentitquand
leshouppiers
entrent en concurrence. Au contraire le couvert se referme très
rapidement
en fortedensité et la croissance des arbres est dès le
départ
ralentie etrégulière.
10. Conclusion
Il est difficile de
poursuivre plus
loin cesinterprétations
car il faudraitplus
dedonnées sur une
plus longue période
decroissance,
enparticulier
pour voir clairement le ralentissement de la croissance en hauteur. Cettepremière
étude montre l’intérêtdans le domaine forestier d’un outil
permettant d’analyser
simultanément deuxaspects
de la croissance des arbres : celle en hauteur et celle en circonférence.Remarquons
à nouveau
qu’il respecte
certaines contraintes naturelles de cescroissances,
comme la monotonie. Parrapport
à laproposition
d’HOULLIER(1987),
cetteapproche semi-paramétrique,
outrequ’elle permet
un résultatexplicite
de convergence, ne nécessite pas l’introduction apriori
d’un modèle de croissance et est en ce sensbeaucoup plus
«libre». Cette libertéprovient
du faitque la
courbe sort des données.Il est donc
impératif
que les mesures soientréparties
sur l’ensemble de l’intervalle considéré. Dans le casoù,
pour certainescourbes,
les données sont localisées sur uneportion
del’intervalle,
la courbe doit sortir d’unmodèle,
si toutefois onpeut
l’exhiber. L’ACP surparamètres
est alors une solution très intéressante. Deplus,
ellepermet
uneinterprétation
directe des résultats en terme deparamètres (peu nombreux) possédant
unesignification biologique.
Onpeut
d’ailleurs concevoir facilement unegénéralisation
de l’ACP surparamètres
d’HOULLIER à une co-inertie de deux modèles différentsappariés
dansl’esprit
de la section 8.Remerciements
Nous tenons à remercier F.
COLIN,
Ph. DREYFUS et F. NINGRE de l’INRA de nous avoirpermis l’acquisition
des données dans ledispositif clinal,
ainsi que F.HOULLIER pour ses remarques constructives sur le manuscrit de cet article.
Références
[1]
ASSMAN E.(1970)
Theprinciples of forest yield study.
Studies in theorganic production,
structure, increment andyield of forest
stands.Pergamon
Press :Oxford.
[2]
BESSE Ph. et RAMSAY J.O.(1986) Principal components analysis
ofsampled
functions.
Psychometrika, 51,
285-311.[3]
BOUHADDOUO.,
OBLED C.H. et DINH T.P.(1987) Principal components analysis
andinterpolation
of stochastic processes : method and simulation.Journal
of applied statistics, 14,
251-267.[4]
CURRY H.B. et SCHOENBERG I.J.(1966)
OnPolya frequency
functions and their limits. Journald’Analyse Mathématique, 17, 71-107.
[5]
CHESSEL D. et MERCIER P.( 1993) Couplage
detriplets statistiques
et liaisonsespèces-environnement.
In Biométrie etenvironnement,
J.D. Lebreton et B.Asselin
(Eds),
SociétéFrançaise
deBiométrie,
Masson :Paris,
15-45.[6]
DAUXOIS J. et POUSSE A.(1976)
Lesanalyses
factorielles en calcul desprobabilités
et enstatistique :
essai d’étudesynthétique.
Thèse de troisièmecycle,
Université PaulSabatier,
Toulouse.[7]
DE BOOR C.(1978) A practical guide to splines. Springer-Verlag :
New-York.[8]
DE BOOR C. et DANIEL J.W.(1974) Splines
with nonnegative B-spline
coefficients. Mathematics
of computation, 28,
565-568.[9]
DREYFUS P.(1990)
Interactiongénotype-densité
etcompétition
dans undispositif
clinald’épicéas
communs. Annales des SciencesForestières, 47, 1-16.
[10]
EL FAOUZI N. et ESCOUFIER Y.(1991)
ModélisationI-spline
et compa- raison de courbes de croissance. Revue deStatistique Appliquée, 39,
51-64.[11]
ESCOUFIER Y.(1987)
Theduality diagram :
a means for betterpractical applications.
InDevelopments
in numericalecology.
P.Legendre
et L.Legen-
dre
(eds).
NATO AdvancedStudy
Institute Series G(Ecological Sciences).
Springer-Verlag : Berlin,
139-156.[12]
GASSERT., MÜLLER H.G., KÖHLER W.,
MOLINARI L. et PRADER A.(1984) Nonparametric regression analysis
ofgrowth
curves. The Annalsof Statistics, 12,
210-229.[13]
HOULLIER F.(1987) Comparaison
de courbes et de modèles de croissance.Statistique
etAnalyse
desDonnées, 12,
17-36.[14]
HOULLIERF.,
BOUCHON J. et BIROT Y.(1991)
Modélisation de lady- namique
despeuplements
forestiers : état etperspectives.
Revue ForestièreFrançaise, 2,
87- 108.[15]
JONES M.C. et RICE J.A.(1992) Displaying
theimportant
features oflarge
collections of similar curves. The American
Statistician, 46,
140-145.[16]
KELLY C. et RICE J.A.( 1990)
Monotonesmoothing
withapplication
to dose-response curves and the assessment of
synergism. Biometrics, 46,
1071-1085.[17]
LEURGANSS.E.,
MOYEED R.A. et SILVERMAN B.W.(1993)
Canonicalcorrelation
analysis
when the data are curves. Journalof Royal
StatisticalSociety B, 55,
725-740.[18] LOÈVE
M.(1963) Probability theory.
Van Nostrand : Princeton.[19]
RAMSAY J.O.(1988)
Monotoneregression splines
in action. StatisticalScience, 3,
425-461(avec discussion).
[20]
RICE J.A. et SILVERMAN B.W.(1991) Estimating
the mean and covariance structurenon-parametrically
when the data are curves. Journalof Royal
Statistical