Page 99
2.3 Contributions de la biométrie
La notion de 'forme'
n'apparait pas explicitement dans les travaux surI'allométrie
detaille
qui utilisent I'analyse factorielle ou les composantes principales, où elle apparait comme .tout ce qui n'est pastaille'.
Dans de nombreuxjeux
de données morphométriques, les variables et les mesu-res de taillesqui
en sont dérivées sont très corrélées entre elles. Par conséquent,le choix
d,une mesure detaille
est essentiel, carla
'taille'représente souvent une grande fraction de la variation totale observée dansl'échantillon,
et des variations relativement faibles detaille
produisent des changements proportionnellement grands dans cequ'il
reste aprèsqu'on
ait enlevéla ,taille'.
La seconde composante, et les suivantes, d'une analyse en composantes principales(ACp)
en allo-métrie multivariée, sont souvent interprétées comme représentantla
variation due àla
,forme,.Cependant, elles ne reflètent aucun concept géométrique de forme, et deux spécimens ne peuvent être considérés comme géométriquement semblables que si le vecteur de
taille
correspondant est isométrique;I'isométrie signifie
quela
variation detaille
et de forme sont statistiquement indé-pendants, sinon des changements allométriques dansla
forme sont présents(Bookstein,
1989).Des procédures alternatives
d'ACP
ont été proposées pour séparer lataille
de la forme géométri-que' en essayantd'éliminer
la variation isométrique (Daroch et Mosimann, 1985; Somers,l9g6;
Somers, 1989).
L élimination
dela
variation isométrique detaille
ne concernera quela
variation de taille globale, et non pas la variation de forme en relation avec l'âge ou lataille g.
La
morphométrie géométrique présente un cadre d'étude très différent del'allométrie:
I'analyse de Ia forme porte sur les configurations géométriques de points de repère morphologiques (Book-stein,l99l; Bookstein,lgg6a; Rohlf,
1996b) et non plus sur des vecteurs de mesures de longeurs.La
variation detaille
est éliminée des donnéespar
standardisation(voir la
section 2.3.6.2,
ou Bookstein, 1991; Rohl f , etaL,
1993), et seule la variation de forme reste présente dans les analy-ses.L
allométrie peut-être estimée en combinant les résultats d'analyses de forme avec de I'infor-mation additionnelle, comme une régression non-linéaire deI'information
de'forme'
(comme les résiduels d'une analyse Procruste ou les "relative warps", par exemple) sur une mesure detaille (Bookstein,l99I; V/alker,
1993), par exemple. Ce conceptd'allométrie
est plus proche de celui adopté par Gould(1966),
que de celui des relations linéaires enrre log de variables proposé origi-nellement parHuxley
(1932).2.3.3 Les notions de distance et d'homologie
La
notion de distance est sous-jacente à toute technique d'analyse linéaire multivariée. En effet, les dissimilarités entre objets sont appelées des distances, et sont représentées comme telles sur le papier oul'écran d'un
ordinateur. Les distances sont en général issues dela
modélisation d'une somme des différences au cané d'une liste arbitraire de variables, de manière à être représentées comme des distances géométriques ordinaires dans un espace physique simulé. Les résultats de la plupart des analyses linéaires multivariées peuvent s'exprimer dans un langage géométrique, enII. Reconnaissance et Percepliort des Visages
termes de vecteurs et d'angles. Les variances sont des carrés de longueurs, les corrélations des cosinus, etc. Dans cette métaphore, les
/,
variables représentent des axes perpendiculairesd'un
espace Euclidien à n dimensions. La distance est calculée selon I'extension du théorème de Pytha-gore: soit
XçX2,..,
Xn et Y1,Y2,..,Yn,
des mesures de cas dans un espace à n dimensions. La dis-tance au carré entre cas s'exprime comme,(Xr -
Yr12 +(Xz-Y2)2 + ...
+(Xn+Yr)2 pourun
espaceàn
dimensionsDans ces circonstances, les variables et les cas sont décrits par des vecteurs orthonormaux
d'iner-tie
liés par une matrice diagonale de valeurs singulières. Les distances entre cas sont dérivées duproduit
croisé de leurs inerties par rapport à cette matrice diagonale, et les covariances des varia-bles sont les produits croisés de leurs poids par rapport à cette même matrice. Dans la plupart des applications multivariées,il n'y
a pas d'autre définition de distance. En psychologie, par exemple, la distance multivariéeItX, -
Y,)'
entre deux sujets est claire: on ne peut pas observerdirecte-i
ment de distance entre deux
profils
de comportements différents.Il n'y
a donc pas de confusion possible entre la notion de 'distance' statistique et la notion de 'distance'physique du monde réel.La
situation est différente en cequi
concerne les données morphométriques: en effet, les objets même de notre étude coexistent avec nous dans I'espace physique.Il
existe donc unenotion
de distance apriori.
Les distances physiques utilisées en morphométrie ne correspondent pas à des distances entre paires d'organismes entiers, mais expriment davantage les localisations relatives de certaines partiesd'un
organisme par rapport à cellesd'un
autre (Bookstein, 1991).Le
conceptd'homologie
est fondamentalpour I'implémentation
morphométrique de distances physiques dansun
cadre d'analyse statistique multivariée.A I'origine, en biologie
théorique,I'homologie
est une correspondanceformelle
entre parties d'organismes('le
brashumain
est homologue deI'aile du poulet').
Ce concept, sous cetteforme là,
nefournit
pasd'information
géométrique.Si la
longueurd'une
structure linéaire, commecelle d'un
os long, est considérée comme une variable morphométrique en soit, les point entre lesquels elle est mesurée doivent éga-lement être situés sur des sous-structures homologues.D'Arcy
Thompson (1917) élargit la notiond'homologie en biométrie, où les
propriétésbiologiques de l'objet sont mieux
considérées.L
objet de la mesure est la relationper
se entre formes, et non la forme uniquement. Pour passer du contexte biologique au contexte biométrique,il
faut considérer I'homologie comme une fonc-tion de correspondance, de points à points, plutôt que de parties à parties. La notion d'homologie, dans ce sens là, peut s'exprimer comme une déformation, au sens mathématique, et être décrite par ses dérivées (Bookstein, 1978). Dans cette nouvelle version de I'homologie, la notion de'lon-Page
I0l
2.3 Contributiorts de la biométrie
gueur'd'objets
tridimensionnels devientinutile. Elle
suppose que les points entre lesquella
lon-gueur est mesurée sont eux-mêmes déjà homologues. La morphométrie est fondée uniquement surun
langagede
cartographiede
correspondancede points,
sans mesures directesde
variables homologues. Ces variables sont utiles pour I'interprétation des résultats, mais pas pour les calculs.Pour procéder ainsi,
il faut
échantillonner une série de points discrets correspondants à travers toutesles
formes de l'ensembleà
étudier. Ces points sont appelés des coordonnées de points homologues ou poinls-dc-rcperq ("landmarks" voir la section2.3.4.2).Ils
sont caractérisés par des coordonnées de position en deux (x;y)
outrois
dimensions(x;y;
a).Ils
sont considérés biologi_quement homologues comme l'étaient les parties et régions mentionnées plus haut. L'étude
mor-phométrique d'une série d'objets devient l'étude de
descripteursde patrons de
covarianceimpliquant
des ensembles de points (mathématiques) possédant les mêmes noms.C'est à
dire,'Menton: le point le
plusinférieur
dela
mandibule',ou
'Nasion:jonction
des soudures fronto-nasales'.Le
concept d'homologie biologique est inhérant à ces dénominations communes repré-sentées par la correspondance des points ou des ensembles de points.L'analyse morphométrique des contours des formes
(voir la
section2.3.4.I)
suppose I'existence(implicite)
d'une correspondance entre une courbe observée chez un organisme, et toutes celles des autres organismes del'échantillon
considéré.Afin
que l'analyse soit interprétable en termes d'homologie,il
faut identifier un certain nombre de points de repère présents sur les contours de toutes les formes.Le
modèle mathématique d'homologie des contours reposera sur ces points de repère,et
sera ensuite étendu aux autres points du contour par interpolation; dans les casoù il
n'existe
pas de points de repère observables sur les contours considérés,il n'est plus
possible d'interpréter la conespondance en termes d'homologie biologique (Bookstein,l99l).
Les points de repère sont les points sur lesquels les explications de processus biologiques se fon-dent.
Il s'agit
de points frontières, entre tissus différents ou entre un tissu et son environnement immédiat, entre organes, ou entre un organisme et son environnement. Les points de repères inter-viennent dans de nombreuses explications biologiques surla
forme.L'utilisation
de cetype
de donnée présente I'avantage derelier
trois concepts jusqu'alors séparés: (a) la géométrie des don-nées, (b) les mathématiques de leurs déformations, et (c) les explications biologiques (Bookstein,et al.,
1985). Dansun
contexte d'analyse multivariée,un
casd'allométrie
detailles,
peut être interprété comme une déformation dela
'moyenne',ou
peut êtreutilisé pour
transformer une forme en une autre. Les manipulations statistiques de données de points de repère mènent à des explications de naturebiologique, qui
sont localisées dans I'espace, alors queles
données de détourage, traitées par analyse de Fourier, ou autre, ne peuvent pas.IL Reconnaissance et Perceptiorr des Visages
2.3.4 Les différents types de données
2.3.4.1
Les données detype contour ("outline
datau)Ce type de données est en général utilisé dans les cas où