Exemple 2 : les amas globulaires de notre Galaxie

8.5 Propriétés statistiques des clades

8.5.2 Exemple 2 : les amas globulaires de notre Galaxie

Les amas globulaires sont finalement des galaxies simples, sans gaz ni poussière,

dont les propriétés sont presque essentiellement définies par l’environnement dans

le-quel ils se sont formés. Il était connu depuis longtemps que les amas globulaires de

notre Galaxie pouvait se répartir en quelques groupes, entre 2 et 4, mais que surtout

leur diversité nécessitait un second paramètre en plus de la seule métallicité Fe/H.

Se-lon la philosophie de l’astrocladistique, c’est évidemment cet environnement de

for-mation qui constitue ce fameux “second paramètre”.

Sur un échantillon de 54 amas globulaires de notre Galaxie (FRAIX-BURNET

ET AL.,2009), trois paramètres caractérisant l’état physico-chimique des amas ont été

choisis. dans la même philosophie que pour le plan fondamental précédemment. Leur

âge a été ajouté mais il permet seulement de ranger les amas au sein de chaque groupe

évolutif. Dans l’analyse elle-même, l’âge s’est vue attribué un poids d’un demi, car il

est bien clair qu’il représente l’âge des étoiles et ne caractérise donc pas les conditions

physico-chimique dans laquelle les amas observés se sont formés. L’âge ne peut pas

discriminer entre deux populations puisqu’il évolue de la même manière pour tous. Par

contre, au sein d’un même groupe évolutif, la prise en compte de ce paramètre dans

l’analyse, avec un poids moindre, permet de ranger les objets selon une séquence

chro-nologique. La preuve de ceci est que l’analyse effectuée sans l’âge retrouve exactement

les mêmes groupes, mais ces groupes sont alors non résolus (polytomies).

Le résultat de l’analyse cladistique est montré sur la figure8.10. L’échantillon se

découpe aisément en 3 groupes dont les propriétés, analysées de manière statistique

comme pour le plan fondamental précédemment, indiquent sans ambiquité des

condi-tions de formation différentes. Sur les diagrammes binaires obtenus avec les quatre

paramètres de l’analyse (Fig.8.10), les groupes se distinguent nettement et indiquent

à l’évidence des propriétés différentes. En particulier, la métallicité en fonction de

l’âge montre que les trois groupes se sont formés avec des métallicités moyennes

dif-férentes, à des périodes difdif-férentes, et sur des durées différentes. Il est également

frap-pant dans cet exemple de constater que les groupes se distinguent selon des paramètres

totalement différents de ceux utilisés pour l’analyse. La table8.1 montre les valeurs

moyennes (ainsi que la dispersion entre parenthèses) au sein de chaque groupe pour

quelques paramètres essentiellement d’ordre géométrique.

Groupe 1 Groupe 2 Groupe 3

Nombre d’amas 25 11 18

Distance au centre galactique (kpc) 9.4 (7.4) 12.9 (8.0) 4.2 (2.9)

Hauteur au-dessus

du disque galactique (kpc) 4.8 (4.5) 8.6 (7.6) 1.9 (2.0)

Métallicité Fe/H -1.40 (0.35) -1.92 (0.16) -0.92 (0.35)

Magnitude V -8.5 (0.7) -7.6 (0.6) -7.1 (0.9)

Vitesse de rotation dans le plan

de notre Galaxie (km/s) -7. +46. +119.

Dispersion des vitesses radiales

(km/s) 120 (107) 151 (107) 69 (74)

Âge 9.98 (0.96) 11.17 (0.70) 10.18 (0.48)

TABLE 8.1 – Valeurs moyennes (et dispersion) de quelques propriétés pour chaque

groupe d’amas globulaires.

Tout ces points démontrent encore une fois qu’une classification pertinente

(mul-tivariée et évolutive) amène à une interprétation physique pertinente. Cette analyse

démontre également que la diversité des objets, ici les amas globulaires, est bien due

principalement à leur histoire, celle de leur assemblage dans le cas présent. Il est alors

possible de décrire assez précisément les scénarios de formation de ces amas dans

notre Galaxie, apportant naturellement des contraintes sur la manière dont notre

Ga-laxie s’est assemblée. En effet, en utilisant plusieurs caractéristiques de chacun des

groupes, nous pouvons déduire que les amas du groupe 2 sont situés principalement

dans le halo externe et se sont formés en premier lors d’une phase non dissipative

de l’effondrement de notre Galaxie. Les amas du groupe 1, plutôt du halo interne, se

sont formés plus tard dans un environnement un peu plus turbulent. Enfin, les amas

du groupe 3 se sont formés essentiellement dans le disque épais de notre Galaxie dans

une période intermédiaire et plus courte.

FIGURE8.7 – En haut : arbre comprenant 699 galaxies obtenu dans l’analyse

cladis-tique du plan fondamental à partir duquel les groupes sont définis. Chaque groupe est

représenté par une couleur. En bas : projection de l’arbre (traits noirs) et des groupes

dans le plan.

FIGURE8.9 – Dispersions des paramètres au sein de chaque groupe, représentées sous

la forme de "boxplot".

FIGURE 8.10 – Classification cladistique des amas globulaires de notre Galaxie.

Chaque groupe est représenté par une couleur. À gauche : cladogramme à partir duquel

les groupes sont définis. À droite : diagrammes reliant les 4 paramètres utilisés pour

l’analyse cladistique.

Méthodes phylogénétiques : vue

d’ensemble

Nous allons voir dans ce chapitre que la cladistique fait partie des méthodes

phylo-génétiques qui couvrent l’ensemble des approches permettant de reconstruire un arbre

évolutif. En réalité, on distingue les méthodes basées sur les caractères (comme la

parcimonie maximum évoquée tout au long de ce livre) des méthodes basées sur une

distance. De plus, ces méthodes peuvent être non-paramétriques (parcimonie

maxi-mum, évolution minimum) ou paramétriques (dites probabilistes comme le maximum

de vraisemblance ou les méthodes Bayésiennes), ces dernières imposant un modèle

d’évolution. Nous donnons ici un aperçu général de leurs différences sans entrer dans

les détails mathématiques. Les développements théoriques, algorithmiques et

appli-catifs sont assez foisonnants dans ce domaine, l’exploration des limites de chaque

méthode étant en perpétuelle expérimentation. Un aperçu de ces différentes méthodes

peut être trouvé dansDARLU ANDTASSY(1993),CROFT(2008), ou encoreSEMPLE

ANDSTEEL(2003) pour les aspects mathématiques.

En fin de chapitre, nous examinerons les analyses par regroupement ("cluster

ana-lyses" ou analyses de distances multivariées) qui en dehors de toutes considérations

évolutives permettent de regrouper les objets à partir d’une matrice de distances. Ces

analyses multivariées commencent elles aussi à être utiliser en astrophysique. Elles

sont un complément intéressant aux analyses cladistiques.

Ce chapitre, très bref, vise à montrer que l’astrocladistique n’est qu’une porte

ou-verte sur tout un monde extrêmement vaste de méthodes phylogénétiques. Par

l’adop-tion du paradigme de populal’adop-tion en évolul’adop-tion, l’astrocladistique rapproche

l’astrophy-sique d’un autre champ de recherche très dynamique.

9.1 Méthodes de caractères et méthodes de distances

La cladistique telle que nous l’avons pratiquée dans ce livre se fait appeler

géné-ralement méthode de parcimonie maximum. Elle se base sur la matrice de caractères

qui sont des données issues plus ou moins directement des observables et caractérisant

l’état évolutif de chaque taxon. L’arbre final choisi, le plus parcimonieux, comporte

un nombre de changements d’état de caractères minimum. La quantité optimisée est

donc le nombre d’évènements total apparaissant sur le schéma évolutif représenté par

l’arbre. Ce nombre n’a a priori pas les propriétés d’une distance au sens mathématique,

et ne fournit a priori aucune indication temporelle.

Les méthodes de caractères comprennent le maximum de parcimonie (cladistique,

non paramétrique) et le maximum de vraisemblance ("maximum likelihood",

paramé-trique). Cette dernière méthode définit un modèle d’évolution a priori sur lequel la

phylogénie va être ajustée au maximum.

À partir d’une matrice de caractères, il est aisé de construire une matrice de

dis-tances, les caractères représentant des coordonnées dans un espace multidimensionnel.

La métrique de cet espace est caractérisée par le choix de la distance qui n’est pas

unique. Toute la difficulté réside donc dans ce choix qui dépend nécessairement du

type d’objets et de données mais reste quelque peu arbitraire.

À partir de la matrice de distances, il est généralement impossible de retrouver la

matrice de caractères, ce qui prouve qu’une certaine quantité d’information est perdue.

En effet, la distance s’intéresse à la différence globale entre les objets sans se

préoc-cuper du chemin nécessaire pour passer d’un objet à l’autre. La mesure des distances

tend à court-circuiter les évènements évolutifs, lissant les changement trop fréquents

ou apparaissant sur une faible fraction des caractères. Elles supposent donc

nécessai-rement que les homoplasies sont négligeables sans avoir de réel moyen de vérifier

cette hypothèse sous-jacente. En somme les analyses de distances s’intéressent aux

distances dans un espace à la métrique prédéfinie, alors que les analyses de caractères

s’intéressent au cout évolutif (en quelque sorte l’effort à fournir) du chemin à parcourir

dans un relief inconnu. Ce chemin passe par les nœuds de l’arbre qui représentent des

points intermédiaires dans l’évolution de chacun des caractères. Les analyses de

dis-tances ignorent ces points intermédiaires et n’indiquent donc pas l’état des caractères

aux nœuds de l’arbre phylogénétique ni les évolutions trop complexes des caractères.

Ceci dit, lorsque les caractères, à partir desquels les distances sont calculées, sont

bien pertinents vis à vis de la diversification, c’est-à-dire essentiellement dans le cas où

ils comportent peu d’homoplasies, les résultats des deux types d’analyses ne diffèrent

pas toujours dramatiquement. Cela signifie que l’information perdue n’est pas toujours

importante et peut sans doute s’expliquer par un comportement adéquat des caractères.

L’avantage des méthodes de distances est que les algorithmes sont généralement bien

plus rapide que pour la parcimonie maximum, ce qui explique leur usage très répandu.

Dans le document DE LA DIVERSIFICATION DES GALAXIES (Page 117-124)