R EVUE DE STATISTIQUE APPLIQUÉE
P. C AZES D. C HESSEL S. D OLEDEC
L’analyse des correspondances internes d’un tableau partitionné : son usage en hydrobiologie
Revue de statistique appliquée, tome 36, n
o1 (1988), p. 39-54
<
http://www.numdam.org/item?id=RSA_1988__36_1_39_0>
© Société française de statistique, 1988, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (
http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’ANALYSE DES CORRESPONDANCES INTERNES
D’UN TABLEAU PARTITIONNÉ :
SON USAGE EN HYDROBIOLOGIE
P. CAZES
(1),
D. CHESSEL(2)
et S. DOLEDEC(2)
(1)
Université ParisDauphine,
Place du Mal de Lattre deTassigny,
75775, Paris Cedex 16.(2) Ecologie
des eaux douces, UA 367, UniversitéLyon
1, 69622 Villeurbanne Cedex.Statistique Appliquée,
1988,(1),
RÉSUMÉ
Un tableau
d’analyse
descorrespondances
à Ilignes
et J colonnes estpartitionné
en L blocs
lignes
et K blocs colonnes. On ne veut tenir compte dans sadescription
que des structures internes des sous-tableaux définis par les deuxpartitions.
La note introduitdans le schéma de dualité de
l’analyse
descorrespondances
deuxprojecteurs
etprécise
les aides à
l’interprétation qui
en découlent. Les illustrations concernentl’analyse
d’untableau
faunistique décomposé
par groupestaxonomiques
et par saisond’échantillonnage.
Lorsque
les structures observées dupoint
de vue choisi sontfaibles,
par rapport aux structuresglobales
définies parl’analyse
descorrespondances, l’analyse
descorrespondan-
ces internes donne des résultats radicalement différents.
Mots clés : Schéma de
dualité, Projecteurs, Analyse
desCorrespondances, Hydrobiologie.
ABSTRACT
A table with I lines and J
columns,
to beprocessed by
a dualscaling,
was dividedinto L line-units and K column-units. To describe the
table, only
the inner structure of subtables such defined is taken into account. This paper introduces twoprojection
operators in theduality diagram
ofCorrespondence Analysis
andprovides interpretative
assistance thereof. The
analysis
of a faunaltable,
dividedby
taxonomic groups andsampling
seasons, is illustrated. If the structures observed from a choosenpoint
of vieware
weak,
withregard
to the overall structure definedby Correspondence Analysis,
theInternal
Correspondence Analysis gives radically
different results.Keywords : Duality diagramm, Projection
operators,Correspondence Analysis, Hydrobio- logy.
1.
Introduction
Il est habituel de décrire les structures d’un tableau relevés-taxons par
l’analyse
factorielle descorrespondances (AFC),
que l’on y cherche des asso-ciations
d’espèces
et des groupes de relevés(ROUX
etROUX, 1967)
ou que l’on désire y voir une ordinationréciproque
sur ungradient écologique (HILL 1973, 1974).
Introduite enhydrobiologie
parLEVEQUE
et GABORIT(1972),
l’AFCy est devenu un outil de base comme dans les autres secteurs de
l’écologie.
Dansl’étude des
hydrosystèmes cependant
deuxquestions particulières
sont soulevéespar la
description
des tableauxfaunistiques.
40 P. CAZES, D. CHESSEL, S. DOLEDEC
La
première
touche aux difficultés des déterminations. Lesorganismes capturés
dans les relevés nepeuvent
souvent être identifiés àl’espèce
que par desspécialistes
de divers groupesfaunistiques.
Unepartie
des animaux restentidentifiés au genre, ou à la
famille,
voiresimplement
à l’ordre. Le coût des triset des identifications est tel
qu’on s’interroge
en permanence sur la valeurtypologique
des groupes de taxons : il serait souhaitable dansl’analyse
destableaux de ne tenir
compte
que descorrespondances
intervenant à l’intérieur des différents groupesd’espèces.
Le second
problème
a trait auxrythmes
dereproduction
très diversifiés en oeuvre dans lespopulations
naturelles formant les communautésinterspécifiques
étudiées. Les
expérimentateurs
échantillonnent àplusieurs reprises
dans l’annéeces communautés pour assurer la
capture
des individus dechaque espèce indépendamment
desrythmes
deponte, d’émergence,
dedéplacement,...
Onvoudrait alors mesurer la valeur
typologique
d’une dated’échantillonnage, question symétrique
duproblème précédent.
Aquel
moment et pourquel
groupe obtient-on unecapacité optimale
à dissocier les stations sur leur contenufaunistique ?
Latypologie
est-elle stable ? Posée àplusieurs reprises
dans lalittérature
écologique,
parexemple
par DAKKI(1985, 1986),
laquestion
de laprise
encompte
de ces structuresexpérimentales
dansl’analyse
du tableau n’a pas reçu de solutionspratiques. L’objectif
estglobalement
de comparer les structures internes des sous-tableaux définis par un groupefaunistique
et une dated’échantillonnage,
enquelque
sorte d’effectuer simultanément les AFC des sous-tableaux et de mesurerquelle part
chacun d’entre eux estcapable
de restituer de la structure définie en commun. La note propose une solution à ceproblème.
Nous
présenterons
d’abord unjeu
de données de taille limitée pour illustrer laméthode, puis
uneapproche théorique exprimée
dans le cadre du schéma de dualité(CAILLIEZ
etPAGES, 1976)
et uneprocédure
de calcul limitant le travail deprogrammation
à la construction d’un tableau surlequel
on effectuel’AFC;
nous donnons ensuite les
propriétés
de la méthodequi
est une AFC souscontraintes et les
perspectives
ouvertes par cettepratique.
L’exemple
estprésenté
dans lafigure
1 : il concerne 35prélèvements
demacro-invertébrés
benthiques
réalisés au filet detype
Surber(surface
échantillon- née de0,1 m2).
On a conservéparmi
lesorganismes capturés
43espèces réparties
en 4 groupes
taxonomiques.
Les 35prélèvements
serépartissent
sur 6 stationsnotées
A, B, C, D, E,
F et 6 datesd’échantillonnage
numérotées1, 2, ... , 6;
le relevé de la station F à la date 1 estmanquant.
L’ensemble del’expérience
dontsont extraites ces données est
présenté
dans la thèse de DOLEDEC(1986).
Lafigure
1 contient le tableau 43-35 divisé en 24 sous-tableaux par larépartition
desespèces
en 4 groupes et celle des relevés en 6 campagnesd’échantillonnage.
Lafigure
2 résume les codifications desobjets biologiques manipulés.
Soulignons qu’on
désire éliminer les structuresfaunistiques
associées autemps, l’objet
étantd’interpréter
unetypologie
stationnelle etqu’on
souhaitemesurer la
capacité
des groupes à servir d’indicateursbiologiques.
41
FIGURE 1
Tableau d’AFC
partitionné.
43lignes (taxons)
sontréparties
en 4 groupesfaunistiques.
35 colonnes
(relevés)
sontréparties
en 6 groupes(dates d’échantillonnage).
Les lettres A,...,Fdésignent
les stations. On cherche à ne tenir compte que des structures internes dechaque
sous-tableau.
II.
Analyse des correspondances
etprojecteurs
77.7.
Rappels
surl’analyse
descorrespondances
La revue
bibliographique
de BUYSE(1983),
les ouvrages de NISHISATO(1980)
et GREENACRE(1984)
et lasynthèse
de référence de TENENHAUS etYOUNG
(1985)
montrent à la fois lamultiplicité
desapproches possibles
del’AFC et la
prise
encompte
de cette diversité dans le schéma de dualité. Nous utiliserons les notations lesplus
habituelles. T est un tableau de nombrespositifs
ou
nuls,
défini sur leproduit
de deux ensembles 1 etJ, nij
son termegénérique,
ni. et
n.j
les sommesmarginales,
n la somme de tous les éléments dutableau, pij
laquantité nij/n,
pi. etp.j
lesfréquences marginales,
P le tableau despij, DI
etDJ
les matricesdiagonales
contenantrespectivement
les pi. et lesp.j.
42 P. CAZES, D. CHESSEL, S. DOLEDEC
FIGURE 2
Codes des éléments du tableau traité. A : Dates
d’échantillonnage
situées sur lachronique
dudébit de la rivière. B : Stations
d’échantillonnage.
C : Code des taxonsrépartis
par groupesfaunistiques.
43 Pour éviter toute
ambiguïté
onpeut appeler
« AFC-PROGRAMME » laprocédure.
1) Diagonaliser D-1/2J P’ Dj ’ PD-1/2J.
2)
Eliminer laplus grande
valeur propre Jlo = 1 et conserver 03BC1, 03BC2,..., 9f dans la matricediagonale Sf.
3)
Eliminer lepremier
vecteur propre et conserver u1, u2’ ... , uf , vecteurs propresnormés,
en colonnes dans la matriceUf .
4)
CalculerCf = Dî 1/2 Uf Sf’2
etLf = D-1I pCf S-1/2f comptant respective-
ment J
lignes
et f colonnes(coordonnées
factorielles descolonnes)
et Ilignes
etf colonnes
(coordonnées
factorielles deslignes).
Ces calculs sont exécutés dans la
plupart
des programmesd’analyse
descorrespondances
et ils donnent des coordonnées factorielles de varianceségales
aux valeurs propres. Ils ne
préjugent
pas del’emploi qui
en sera fait suivant leproblème
traité. Enparticulier
onpeut
considérer :1) L’ACP(D,’’ PDJ ’, Dj, D,) qui analyse
le tableau des données « corri-gées » pij/(pi.p.j)
avec lespondérations D,
etDJ :
2)
L’ACP(PDJ ’, DJ, Di ’) qui analyse
le nuage des distributions condition- nelles par colonnes avec lamétrique
du Khi2D,’ ’
et lapondération Dj
3)
L’ACP(D-1IP, D-IJ, D,) qui analyse
le nuage des distributions condition- nelles parlignes
avec lamétrique
du Khi2Dj*’
et lapondération D, ;
4) L’ACP (P, Di ’, Di ’)
dont les facteursDj-normés
et les cofacteursD,-normés
sont descodages numériques
des colonnes et deslignes
normaliséspour les distributions
marginales qui
maximisent successivement la corrélation calculée sur la distribution bivariée P(corrélation canonique)
ourespectivement
la variance des moyennes conditionnelles par
lignes (ou
parcolonnes)
du ta-bleau P.
L’exécution de l’une des
quatre analyses
donnent les éléments propres(axes, composantes, facteurs, cofacteurs)
des trois autres à une transformation linéairesimple (mettant
enjeu
une matricediagonale) près.
Seul le schéma de dualité rend trèssimplement compte
des relations entre lesquatre analyses :
Ces remarques
préliminaires permettent
deprévoir
que l’introduction deprojecteurs
dans unquelconque
de ces modèlespermet
de conserver l’essentiel despropriétés
de l’AFC enimposant
des contraintes sur les facteurs.Rappelons
encore que :
1)
Les axes factoriels et lescomposantes principales
de variance 1 issus de lapremière analyse, correspondent
dans laterminologie
de BENZECRI(1982)
aux facteurs de variance 1 sur 1 et J
respectivement,
facteurs que nous noteronsa’, bB
ou a, b suivant laterminologie
de CAILLIEZ et PAGES(1976)
que nousadopterons
ici. Ilscorrespondent également
aux cofacteurs et aux facteurs de laquatrième analyse.
2)
Dans lesquatre analyses précédentes,
ainsi que dans laprocédure AFC-PROGRAMME,
onpeut,
sanschanger
les résultatsremplacer
le tableau Ppar le tableau P- de terme
général :
44 P. CAZES, D. CHESSEL, S. DOLEDEC
FIGURE 3
Schémas de dualité associés à une AFC. Suivant
l’espace qu’on
choisitréférencé
par la basecanonique
on reconnait:1) L’ACP(D-1IPD-1J, Dj, DI). 2) L’ACP(PD-1J, Dj, D-1I), 3) L’ACP(D-1IP, D-1J, DI), 4) L’ACP(P, D-1J, D-1I).
Les matricesqui
yfigurent correspondent
soit à des normes, soit à des
changements
de base.puisque
l’effet de cette transformation est deremplacer
la valeur propre triviale 1(valeur
proprequ’on élimine,
etqui
est associée au facteur dont toutes lescomposantes
valent1)
par la valeur propre nulle.Il.2.
L’analyse
descorrespondances internes
Considérons maintenant une
partition
deslignes
sous la forme d’une variablequalitative qui engendre
un tableaudisjonctif complet
Xcomportant
1lignes
et L colonnes(paquets
delignes)
pour une seule variable à L modalités.De même soit une
partition
des colonnes sous la forme d’une variablequalitative engendrant
un tableaudisjonctif complet
Ycomportant
Jlignes
et K colonnes(paquets
decolonnes)
pour une seule variable à K modalités. X et Y’ sontreprésentés
sur lafigure
4qui précise
les notations utiles.Soit
Px
leD,-projecteur
sur le sous-espace vectorielengendré
par les colonnes du tableau X dansE* = R’.
Dans la basecanonique
la matrice de ceprojecteur
est :où
DL
est la matricediagonale
de termegénéral
Pf+ somme des pi. pour leslignes
i
appartenant
à la classe P. Le termegénéral
de la matricePx
estdéfini,
comme il est aisé de le voir par :(Px)ii,
=pi’./p~+
si i et i’appartiennent
à la même classe P= 0 sinon
Soit
Py
leD,-projecteur
sur le sous-espace vectorielengendré
par les colonnes du tableau Y dansF* - W.
Dans la basecanonique
la matrice de ceprojecteur
est :FIGURE 4
Notations utilisées dans le calcul de P".
où
DK
est la matricediagonale
de termegénéral
p+k somme desp.j
pour lescolonnes j appartenant
à la classe k. On a demême,
pour le termegénéral
dePy : (PY)jj’
=p·j, /p+k si j
etj’ appartiennent
à la même classe k= 0 sinon
Soient
Qx
etQy
lesprojecteurs
définis paroù
Id,
etIdj
sontrespectivement
lesapplications
identités deR’
etRB
Posons :soit
ce
qui permet
d’observer que po est un tableau à 1lignes
et J colonnes de termegénéral P°(i,j) qui
vaut,compte
tenu de la définition dePx
etPy :
avec les notations définies dans la
figure
4 etsi la
ligne
iappartient
à la classe ~ si lacolonne j appartient
à la classe kqui
définissent la « version table decontingence »
du doublecentrage
d’un tableaud’analyse
de variance à deux facteursorthogonaux.
46 P. CAZES, D. CHESSEL, S. DOLEDEC
On
appelera Analyse
desCorrespondances
Internes(ACI)
de P parrapport
à X et Ydont il convient de définir la
procédure
de calcul et lespropriétés.
Cette ACP
correspond
à lapremière
ACP définieau §11.1.,
mais oùD-1I PDJ
estremplacé
parQxDI-1 PD-1J Q’Y.
Ellepeut
donc être considéréecomme une double
analyse
encomposantes principales
sur variables instrumenta- les(BONIFAS et al., 1984),
ou comme une doubleanalyse
factorielleprivilégiante (LAFAYE
DEMICHEAUX, 1978),
ou encore comme une double S.A.C.P.(BOUDOU, 1982).
Compte
tenu de ce queDI-1 Qx
=Qx D-1I
etDi Qy
=Qy D-1J,
l’ACI estidentique
àqui correspond
à lapremière
ACPdu § 11.1.,
mais où P estremplacé
par po. Ilen résulte que l’ACI est aussi
équivalente
aux trois autres ACP définiesau § 11.1.,
à condition de
remplacer
P par po.En fait cette
analyse
revient à comparer le tableau P au tableau modèle S de termegénéral :
et à
analyser
le tableau résiduel po = P - S. Leprincipe général
de cetype d’analyse
est donné par DE FALGUEROLLES et al.(1987).
On
peut
noter que les tableaux P et S ont mêmes marges sur 1 et Jrespectivement,
margesqui
servent, comme dans l’AFC usuelle à définir lesmétriques
pouranalyser
po = P - S.On déduit alors des recherches de ESCOFIER
(1983),
ainsi que de la seconde remarque située à la findu §
II.1. que l’ACI estéquivalente
à l’AFC dutableau R de terme
général
puisque
le tableau R- déduit deR,
comme P- se déduit de P estidentique
à PO.L’ACI est donc
équivalente
auxquatre
ACPdu §11.1.,
à condition deremplacer
P par R. Onpeut
alors définir « l’ACI-PROGRAMME » par laprocédure
suivante :1)
Calculer le tableau po défini par le doublecentrage, puis
le tableau R.2)
Effectuer « l’AFC-PROGRAMME » sur le tableau R.47
III.
Propriétés
del’ACI
III.1. L’ACI
est uneAFC
souscontraintes
Proposition
1Supposons
que l’on recherche lescouples
de fonctions(aI1, b1)
de variance1,
et de corrélation maximale(pour
la mesure définie parP)
sous la contrainteque
aj
etb1
sont de variance interclasse nulle. Notons queaj
etb’
sont centréspar
blocs, i.e.
siIf
etJk désignent respectivement
les éléments de I et J associés à la f e modalités deX,
et à la ke modalité deY,
on a :Alors
(ai, bJ1) correspond
aupremier couple
de facteurs issu de l’ACI deP,
i.e.au
premier couple
de facteurs non triviaux issu de l’AFC de R.Si on recherche un
couple
de fonctions(aI2, b2)
de variance1,
non corréléà
(ai, b)
et de corrélationmaximale,
sous la contrainte queaI2
etbJ2
sont devariance interclasse
nulle,
on obtient le secondcouple
de facteurs associés issus de l’ACI deP,
i.e. de l’AFC deR,
et onpeut
continuer le processusqui
revientà effectuer l’AFC de R.
Démonstration
On sait que
l’analyse
descorrespondances
usuelles revient à fairel’analyse canonique
dansE*~F* = R’ 0 RJ
des sous-espacesE* = R’
etF* = R’
respectivement engendrés
par les fonctionsqui
nedépendent
que de I ou deJ,
ce
qui
revient à chercher les fonctions norméesa’
eR’
etb’
EW,
maximisanta’ Pb =
03A3i,j pij
a;bj, qui
est la corrélation entrea’
etb’ (une
fois retirée la fonction triviale constantequi
se trouve dans l’intersection deRI
etRJ).
Si
maintenant,
onimpose
àa’
etb’
d’être de variance interclassenulle,
on doit avoira’
EQx (R’)
etb’
EQy (RJ), auquel
cas, on a :et maximiser a’ Pb sous la contrainte
précédente
revient à maximisera’QxPQyb
=
a’P°b,
cequi
revient encore(après
élimination de la solution trivialeconstante)
à maximiser a’Rb. R
ayant
mêmes marges queP,
on obtient bien lepremier couple
de facteurs non triviaux issu de l’AFC de R.
Si on réitère la
procédure,
on extrait la suite des facteurs issus de l’AFC de R.c.q.f.d.
On
peut
trouver une étudeplus
détaillée sur la recherche simultanée de facteurs de variance interclasse nulle(qui correspond
àl’ACI,
i.e. à l’AFC deR)
et de variance intraclasse nulle
(AFC
dePx PPy)
dans CAZES(1986a)
et CAZES(1986b).
On déduit de la
proposition
1 et de sa démonstration lespropositions
suivantes :
48 P. CAZES, D. CHESSEL, S. DOLEDEC
Proposition
2L’ACI est
l’analyse canonique
dansRI ~ RJ
des sous-espacesQx (R’)
etQY (RJ).
Proposition 3
Les coordonnées factorielles
FI03B1
etGJ03B1
obtenues dans l’ACI sontcentrées,
centrées par
classe,
et de varianceségales
à la valeur proprecorrespondante 03BB03B1.
De
plus Fa
etGa
sont de corrélation(corrélation intraclasse) égale
àfi:cx,
tandisque pour a =1=
P,
lecouple (F03B1, GJ
est non corrélé aucouple (Fp, G03B2).
La démonstration de cette
proposition
est immédiate si on serappelle
que les coordonnées factorielles sont obtenues enmultipliant
les facteurs de variance 1 par la racine carrée de la valeur propre associée.On sait que
l’analyse
descorrespondances porte
souvent le nom de doublecodage (dual scaling) (NISHISATO 1980)
du faitqu’elle
fournit despaires
decodages lignes
et colonnes maximisant successivement la corrélation calculée surla table de
contingence
P. On a un résultat similaire pourl’ACI,
résultatqui
découle immédiatement de la
proposition
2 etqui
est donné par laproposition
suivante :
Proposition 4
Les facteurs de variance unité issus de l’ACI sont des codes
numériques
deslignes
et des colonnescentrés,
réduits et centrés par classesqui
maximisentsuccessivement la corrélation calculée sur la table de
contingence.
Les maximasuccessifs sont les racines carrées des valeurs propres
(corrélations canoniques)
et l’ACI est une méthode de double
codage (dual scaling)
sous contraintes decentrage
par blocs.Remarque :
Cas où l’on a une
partition
que sur un seul des ensembles 1 et J.Nous supposerons pour fixer les
idées,
que l’on a unepartition
surl’ensemble 1
seulement,
cequi
revient encore à considérer que lapartition
surJ est la
partition
triviale necomportant qu’une
seuleclasse,
à savoir l’ensembleJ tout entier. Dans ce cas,
qui
a été enparticulier
étudié par BENZECRI(1983)
et ESCOFIER
(1983),
le tableau po a pour termegénéral :
et l’ACI revient à
décomposer
defaçon optimale
l’inertie intraclasse du nuage desprofils
deslignes
du tableau P.111.2.
Relations de transition
enA CI
Soit
(al, b’)
uncouple
non trivial de facteursassociés,
de variance 1 et relatifs à la valeurpropre À
issu de l’AFC de R. Lapremière
formule de transition s’écrit(en
notationsmatricielles) :
Compte
tenu de ce que a estcentré,
et que a =Qxa,
on a,puisque Qy D-’
= D-1JQ’Y :
où T =
DJ-I
P’désigne
dansRI ~ RJ l’opérateur
deprojection
deRI
versW.
Pour obtenir
b
àpartir
de a, il suffit doncd’appliquer
la formule detransition usuelle
Ta
dans l’AFC deP, puis
deprojeter
le résultat surQv(R’).
On a de même :
où U =
D-1I
Pdésigne l’opérateur
deprojection
deRJ
versR’.
Les relations a =
(1/03BB) QxD-1I
Pb et b =(1/03BB) Qy D- F a
sont carac-téristiques
de l’ACI.Notons
qu’on
obtient bien sur les mêmes relations(1)
et(2)
si onremplace
a et b par les coordonnées factorielles
F = a03BB et G = b03BB.
Les relationscorrespondantes expriment qu’à
la déformation minimale1/03BB près
leslignes
sontpositionnées
à la moyenne conditionnelle des coordonnées des colonnes recentrée par groupe delignes,
lapropriété symétrique
étant vraie pour les colonnes.Les modes de lecture habituels des cartes factorielles sont donc
valides,
enparticulier :
- pour des valeurs propres
proches
de l’unité lessuperpositions
des cartes sont des lectures par moyennesréciproques.
- dans les autres cas, la lecture des directions
d’éloignement
àl’origine
estacceptable
mais on ne verra quel’éloignement
à la moyenne du groupeauquel appartient
lepoint,
cequi
estl’objectif
choisi.IV.
Illustration
La
figure
5 contient unepremière comparaison
entre AFC et ACI dutableau. Le
plan
1-2 de l’AFC décrit l’évolutiontemporelle
du contenu faunis-tique,
évolutionglobalement cyclique (rythme saisonnier)
etglobalement
com-mune à toutes les stations.
Comme
prévu
l’ACI élimine ces deuxpremières
valeurs propres et décritune
typologie
stationnelle. Mais elle le fait simultanément pour toutes les dates et met directement en évidence trois éléments :1)
La station B(F2
>0)
située sur l’affluent Chassezac est laplus originale;
elle
s’oppose
en permanence aux stations A(F2 0)
et surtout D(F2
0 etF,
>0),
la dernièreayant
une identité propreplus marquée (écotone
à richessespécifique élevée).
On a là lapartie
constante de latypologie
stationnelle àlaquelle
il fautajouter
lacomposition
très moyenne et peuoriginale
de la stationC,
station depollution
insidieuse.50 P. CAZES, D. CHESSEL, S. DOLEDEC
FIGURE 5
Cartes
factorielles
1-2 desanalyses
AFC et ACI du tableau traité. Hormis laposition
hivernale de la station D,l’AFC fait
unetypologie
desrythmes
saisonniers desespèces.
L’ACI éliminece
point
de vue apriori.
On obtient unetypologie
stationnelle dans le genre d’uncompromis
d’une
analyse
multi-tableaux.L’image
de la destruction de la structurefaunistique
par lapremière
crue de novembre montre ladifficulté
del’analyse expérimentale
deshydrosystèmes
d’eaux courantes.
2)
Les stations E et Fprésentent
ensemble deux étatsindiquant
unepartie
instable de latypologie
stationnelle(conditions d’étiage
défavorable en été dans le canyon desGorges
del’Ardèche).
3)
Ennovembre, après
une forte cruecaractéristique
de larivière,
la déstabilisation du substrat entraîne la mise en mouvement desorganismes
dansle cours d’eau et donc une uniformisation du contenu
faunistique.
La valeurtypologique
des relevés à cette date estquasiment
nulle. Enparticulier l’origi-
nalité des stations 2 et 4
disparaît complètement.
Le tableau 1
précise
ladécomposition
des valeurs propres. Onpeut appeler
contribution d’un bloc à l’inertie d’un facteur la
part
de la variance de laTABLEAU I
Décomposition
des valeurs propres par groupes despartitions imposées
au tableau traité. On peut ainsi mesurer la part des groupesfaunistiques
à ladescription
des structures communeset discuter le coût des déterminations et
l’information qu’elles
procurent.BLOCS COLONNES
52 P CAZES, D. CHESSEL, S. DOLEDEC
coordonnée associée aux
lignes, respectivement
auxcolonnes,
formant un blocde
lignes, respectivement
de colonnes.Ce
descriptif
confirme laprésence
d’unetypologie
estivale(facteur 2) principalement
définie par lesColéoptères,
d’unetypologie
hivernale(facteur 1), principalement
associée auxTrichoptères
et se résumant àl’originalité
de lastation D et de l’uniformisation
produite
par la crue. Le tout est résumé dans lafigure
6qui juxtapose
les cartes factorielles par blocs. Cetexemple,
volontaire- ment limité à uneillustration, permet
d’entrevoir quel’analyse
deshydrosystèmes
devrait
beaucoup
gagner à l’utilisation de méthodes dedescription
multivariée distinctes destechniques
de base(ACP, AFC, ACM).
V.
Perspectives
On
peut souligner
pour conclure quel’opération qui
introduit deuxprojecteurs
dans uneanalyse
est «canonique »
au sens de laproposition 5, qui
suit une idée de SABATIER
(1987).
Proposition
5Si E est un espace euclidien de dimension p et de norme
Mp,
si R est unMp-projecteur
deE,
si F est un espace euclidien de dimension n et de normeM,,,
si S est un
Mn-projecteur
deF,
on sait quel’espace
L(E* , F)
est un espace euclidien pour la forme bilinéaireoù Tr
désigne
la trace d’unendomorphisme (JAFFRENOU, 1978). L’application qui
à X associeest un
projecteur orthogonal
dans L(E* , F)
pour cette norme.En effet R’
appartient
àL (E* ,E*) et 03C0(X)
àL (E* , F).
Deplus
et Or
soit :
On pourra donc mesurer avec un coefficient RV
(ROBERT
etESCOUFIER, 1976)
laprise
encompte
desprojecteurs
dansl’analyse
choisie. L’ACI est alors laplus simple
desanalyses
à deuxprojecteurs.
La doubleprojection
nepréjuge
pas totalement du choix des normes, ce
qui
laisse unegrande
liberté dans l’introduction de contraintes destinées àintégrer
desobjectifs expérimentaux.
PARTITIONNÉ
FIGURE 6
Cartes
factorielles juxtaposées
par groupes delignes
et de colonnes. A : structure estivale, B :originalité
de la station D en hiver, C : regroupement des stations en novembre. Le type Aest surtout
défini
par lesColéoptères,
le type B par lesTrichoptères.
Le choixfondamental
deVERNEA UX
(1973)
dedéfinir
unebiotypologie
des eaux courantes àl’étiage
est ici illustré.Références
J.P. BENZECRI
(1982).
2014L’analyse
desdonnées,
Tome 2 :L’analyse
des correspon-dances, Dunod,
4eédition,
620 pp.J.P. BENZECRI
(1983).
2014Analyse
de l’inertie intraclasse parl’analyse
d’un tableau decorrespondances, [ANA. INTRACLASSE],
Cah. de l’An. des Données, 8, 3, 351-358.L.
BONIFAS,
Y.ESCOUFIER,
P.L. GONZALES et R. SABATIER(1984).
2014 Choix de variables enanalyse
en composantesprincipales,
Revue deStatistique Appliquée,
32, 2, 5-15.A. BOUDOU
(1982).
-Analyse
en composantesprincipales partielle,
Stat. et An. des Données, 7, 2, 1-21.54 P. CAZES, D. CHESSEL, S. DOLEDEC
M. BUYSE
(1983).
- Les différentesapproches
conduisant àl’analyse
des correspon- dances. Biom. Praxim. XXIII, 1, 1-26.F. CAILLIEZ et J.P. PAGES
(1976). 2014
Introduction àl’analyse
des données.SMASH,
9 rue
Duban,
75016Paris, 616 pp.
P. CAZES
(1986a). 2014 Correspondance
entre deux ensembles etpartition
de ces deuxensembles
[CORR. PART.],
Cah. de l’An. des Données, 11, 3, 335-340.P. CAZES
( 1986b). 2014
Unegénéralisation
descorrespondances multiples
et des correspon- danceshiérarchiques,
Cahiers du BURO, n° 46-47, 37-64.M. DAKKI
(1985).
- Sur le choix des données enbiotypologie
des eaux courantes parl’analyse
factorielle descorrespondances.
Bull. Ecol., 16, 4, 285-296.M. DAKKI
(1986).
-Biotypologie
etgradient thermique spatio-temporel,
étude sur uncours d’eau du
moyen-atlas (Maroc).
Bull. Ecol., 17, 2, 79-85.S. DOLEDEC
(1986).
- Lespeuplements
de macroinvertébrésbenthiques
du coursinférieur de l’Ardèche.
Dynamique spatio-temporelle.
Thèse dedoctorat,
UniversitéLyon
1, 244 pp.B. ESCOFIER
(1983).
2014Analyse
de la différence entre deux mesures définies sur leproduit
de deux mêmesensembles, [ANA.
DIFF.PROD.],
Cah. de l’An. des Données, 8, 3, 325-329.A. de FALGUEROLLES et P.G.M. van der HEIJDEN
(1987).
2014 Surl’analyse
factorielle descorrespondances
etquelques-unes
de sesvariantes,
Revue deStatistique Appliquée,
35, 3, 7-12.M.J. GREENACRE
(1984).
-Theory
andapplications
ofcorrespondence analysis.
Academic Press,
London,
364 pp.M.O. HILL
(1973).
2014Reciprocal averaging :
Aneigenvector
method of ordination. J.Ecol., 61, 237-249.
M.O. HILL
(1974).
-Correspondence analysis :
Aneglected
multivariate method. J.Roy.
Stat. Soc., Séries C, 23, 340-354.
P.A. JAFFRENOU
(1978). 2014
Surl’analyse
des familles finies de variables vectorielles.Bases
algébriques
etapplications
à ladescription statistique.
Thèse de 3ecycle,
UniversitéLyon
1, 97 pp.D. LAFAYE DE MICHEAUX
(1978).
2014Approximations d’analyses canoniques
nonlinéaires de variables aléatoires.
Analyses
factoriellesprivilégiantes,
Thèse deDocteur-Ingénieur,
Université deNice,
215 pp.C.
LEVEQUE
et M. GABORIT(1972).
- Utilisation del’analyse
factorielle descorrespondances
pour l’étude despeuplements
enMollusques benthiques
du lacTchad. Cah. ORSTOM
Hydrobiol.,
4, 1, 47-66.S. NISHISATO
(1980). - Analysis
ofcategorical
data : dualscaling
and itsapplications.
University
of Toronto Press,London,
276 pp.P. ROBERT et Y. ESCOUFIER
(1976). -
Aunifying
tool for linear multivariate statistical methods : the RV coefficient.Applied
Statistics, 25, 3, 257-265.G. ROUX et M. ROUX
(1967).
- A propos dequelques
méthodes de classification enphytosociologie.
Revue deStatistique Appliquée,
15, 2, 59-72.R. SABATIER
(1987).
-Analyse
factorielle de données structurées etmétriques, (proposé
pour
publication)
17 pp.M. TENENHAUS et F.W. YOUNG
(1985).
2014 Ananalysis
andsynthesis
ofmultiple correspondence analysis, optimal scaling,
dualscaling, homogeneity analysis
andother methods for
quantifying categorical
multivariate data.Psychometrika,
50,1,
91-119.
J. VERNEAUX