8.5 Propriétés statistiques des clades
8.5.2 Exemple 2 : les amas globulaires de notre Galaxie
Les amas globulaires sont finalement des galaxies simples, sans gaz ni poussière,
dont les propriétés sont presque essentiellement définies par l’environnement dans
le-quel ils se sont formés. Il était connu depuis longtemps que les amas globulaires de
notre Galaxie pouvait se répartir en quelques groupes, entre 2 et 4, mais que surtout
leur diversité nécessitait un second paramètre en plus de la seule métallicité Fe/H.
Se-lon la philosophie de l’astrocladistique, c’est évidemment cet environnement de
for-mation qui constitue ce fameux “second paramètre”.
Sur un échantillon de 54 amas globulaires de notre Galaxie (FRAIX-BURNET
ET AL.,2009), trois paramètres caractérisant l’état physico-chimique des amas ont été
choisis. dans la même philosophie que pour le plan fondamental précédemment. Leur
âge a été ajouté mais il permet seulement de ranger les amas au sein de chaque groupe
évolutif. Dans l’analyse elle-même, l’âge s’est vue attribué un poids d’un demi, car il
est bien clair qu’il représente l’âge des étoiles et ne caractérise donc pas les conditions
physico-chimique dans laquelle les amas observés se sont formés. L’âge ne peut pas
discriminer entre deux populations puisqu’il évolue de la même manière pour tous. Par
contre, au sein d’un même groupe évolutif, la prise en compte de ce paramètre dans
l’analyse, avec un poids moindre, permet de ranger les objets selon une séquence
chro-nologique. La preuve de ceci est que l’analyse effectuée sans l’âge retrouve exactement
les mêmes groupes, mais ces groupes sont alors non résolus (polytomies).
Le résultat de l’analyse cladistique est montré sur la figure8.10. L’échantillon se
découpe aisément en 3 groupes dont les propriétés, analysées de manière statistique
comme pour le plan fondamental précédemment, indiquent sans ambiquité des
condi-tions de formation différentes. Sur les diagrammes binaires obtenus avec les quatre
paramètres de l’analyse (Fig.8.10), les groupes se distinguent nettement et indiquent
à l’évidence des propriétés différentes. En particulier, la métallicité en fonction de
l’âge montre que les trois groupes se sont formés avec des métallicités moyennes
dif-férentes, à des périodes difdif-férentes, et sur des durées différentes. Il est également
frap-pant dans cet exemple de constater que les groupes se distinguent selon des paramètres
totalement différents de ceux utilisés pour l’analyse. La table8.1 montre les valeurs
moyennes (ainsi que la dispersion entre parenthèses) au sein de chaque groupe pour
quelques paramètres essentiellement d’ordre géométrique.
Groupe 1 Groupe 2 Groupe 3
Nombre d’amas 25 11 18
Distance au centre galactique (kpc) 9.4 (7.4) 12.9 (8.0) 4.2 (2.9)
Hauteur au-dessus
du disque galactique (kpc) 4.8 (4.5) 8.6 (7.6) 1.9 (2.0)
Métallicité Fe/H -1.40 (0.35) -1.92 (0.16) -0.92 (0.35)
Magnitude V -8.5 (0.7) -7.6 (0.6) -7.1 (0.9)
Vitesse de rotation dans le plan
de notre Galaxie (km/s) -7. +46. +119.
Dispersion des vitesses radiales
(km/s) 120 (107) 151 (107) 69 (74)
Âge 9.98 (0.96) 11.17 (0.70) 10.18 (0.48)
TABLE 8.1 – Valeurs moyennes (et dispersion) de quelques propriétés pour chaque
groupe d’amas globulaires.
Tout ces points démontrent encore une fois qu’une classification pertinente
(mul-tivariée et évolutive) amène à une interprétation physique pertinente. Cette analyse
démontre également que la diversité des objets, ici les amas globulaires, est bien due
principalement à leur histoire, celle de leur assemblage dans le cas présent. Il est alors
possible de décrire assez précisément les scénarios de formation de ces amas dans
notre Galaxie, apportant naturellement des contraintes sur la manière dont notre
Ga-laxie s’est assemblée. En effet, en utilisant plusieurs caractéristiques de chacun des
groupes, nous pouvons déduire que les amas du groupe 2 sont situés principalement
dans le halo externe et se sont formés en premier lors d’une phase non dissipative
de l’effondrement de notre Galaxie. Les amas du groupe 1, plutôt du halo interne, se
sont formés plus tard dans un environnement un peu plus turbulent. Enfin, les amas
du groupe 3 se sont formés essentiellement dans le disque épais de notre Galaxie dans
une période intermédiaire et plus courte.
FIGURE8.7 – En haut : arbre comprenant 699 galaxies obtenu dans l’analyse
cladis-tique du plan fondamental à partir duquel les groupes sont définis. Chaque groupe est
représenté par une couleur. En bas : projection de l’arbre (traits noirs) et des groupes
dans le plan.
FIGURE8.9 – Dispersions des paramètres au sein de chaque groupe, représentées sous
la forme de "boxplot".
FIGURE 8.10 – Classification cladistique des amas globulaires de notre Galaxie.
Chaque groupe est représenté par une couleur. À gauche : cladogramme à partir duquel
les groupes sont définis. À droite : diagrammes reliant les 4 paramètres utilisés pour
l’analyse cladistique.
Méthodes phylogénétiques : vue
d’ensemble
Nous allons voir dans ce chapitre que la cladistique fait partie des méthodes
phylo-génétiques qui couvrent l’ensemble des approches permettant de reconstruire un arbre
évolutif. En réalité, on distingue les méthodes basées sur les caractères (comme la
parcimonie maximum évoquée tout au long de ce livre) des méthodes basées sur une
distance. De plus, ces méthodes peuvent être non-paramétriques (parcimonie
maxi-mum, évolution minimum) ou paramétriques (dites probabilistes comme le maximum
de vraisemblance ou les méthodes Bayésiennes), ces dernières imposant un modèle
d’évolution. Nous donnons ici un aperçu général de leurs différences sans entrer dans
les détails mathématiques. Les développements théoriques, algorithmiques et
appli-catifs sont assez foisonnants dans ce domaine, l’exploration des limites de chaque
méthode étant en perpétuelle expérimentation. Un aperçu de ces différentes méthodes
peut être trouvé dansDARLU ANDTASSY(1993),CROFT(2008), ou encoreSEMPLE
ANDSTEEL(2003) pour les aspects mathématiques.
En fin de chapitre, nous examinerons les analyses par regroupement ("cluster
ana-lyses" ou analyses de distances multivariées) qui en dehors de toutes considérations
évolutives permettent de regrouper les objets à partir d’une matrice de distances. Ces
analyses multivariées commencent elles aussi à être utiliser en astrophysique. Elles
sont un complément intéressant aux analyses cladistiques.
Ce chapitre, très bref, vise à montrer que l’astrocladistique n’est qu’une porte
ou-verte sur tout un monde extrêmement vaste de méthodes phylogénétiques. Par
l’adop-tion du paradigme de populal’adop-tion en évolul’adop-tion, l’astrocladistique rapproche
l’astrophy-sique d’un autre champ de recherche très dynamique.
9.1 Méthodes de caractères et méthodes de distances
La cladistique telle que nous l’avons pratiquée dans ce livre se fait appeler
géné-ralement méthode de parcimonie maximum. Elle se base sur la matrice de caractères
qui sont des données issues plus ou moins directement des observables et caractérisant
l’état évolutif de chaque taxon. L’arbre final choisi, le plus parcimonieux, comporte
un nombre de changements d’état de caractères minimum. La quantité optimisée est
donc le nombre d’évènements total apparaissant sur le schéma évolutif représenté par
l’arbre. Ce nombre n’a a priori pas les propriétés d’une distance au sens mathématique,
et ne fournit a priori aucune indication temporelle.
Les méthodes de caractères comprennent le maximum de parcimonie (cladistique,
non paramétrique) et le maximum de vraisemblance ("maximum likelihood",
paramé-trique). Cette dernière méthode définit un modèle d’évolution a priori sur lequel la
phylogénie va être ajustée au maximum.
À partir d’une matrice de caractères, il est aisé de construire une matrice de
dis-tances, les caractères représentant des coordonnées dans un espace multidimensionnel.
La métrique de cet espace est caractérisée par le choix de la distance qui n’est pas
unique. Toute la difficulté réside donc dans ce choix qui dépend nécessairement du
type d’objets et de données mais reste quelque peu arbitraire.
À partir de la matrice de distances, il est généralement impossible de retrouver la
matrice de caractères, ce qui prouve qu’une certaine quantité d’information est perdue.
En effet, la distance s’intéresse à la différence globale entre les objets sans se
préoc-cuper du chemin nécessaire pour passer d’un objet à l’autre. La mesure des distances
tend à court-circuiter les évènements évolutifs, lissant les changement trop fréquents
ou apparaissant sur une faible fraction des caractères. Elles supposent donc
nécessai-rement que les homoplasies sont négligeables sans avoir de réel moyen de vérifier
cette hypothèse sous-jacente. En somme les analyses de distances s’intéressent aux
distances dans un espace à la métrique prédéfinie, alors que les analyses de caractères
s’intéressent au cout évolutif (en quelque sorte l’effort à fournir) du chemin à parcourir
dans un relief inconnu. Ce chemin passe par les nœuds de l’arbre qui représentent des
points intermédiaires dans l’évolution de chacun des caractères. Les analyses de
dis-tances ignorent ces points intermédiaires et n’indiquent donc pas l’état des caractères
aux nœuds de l’arbre phylogénétique ni les évolutions trop complexes des caractères.
Ceci dit, lorsque les caractères, à partir desquels les distances sont calculées, sont
bien pertinents vis à vis de la diversification, c’est-à-dire essentiellement dans le cas où
ils comportent peu d’homoplasies, les résultats des deux types d’analyses ne diffèrent
pas toujours dramatiquement. Cela signifie que l’information perdue n’est pas toujours
importante et peut sans doute s’expliquer par un comportement adéquat des caractères.
L’avantage des méthodes de distances est que les algorithmes sont généralement bien
plus rapide que pour la parcimonie maximum, ce qui explique leur usage très répandu.
Dans le document
DE LA DIVERSIFICATION DES GALAXIES
(Page 117-124)