• Aucun résultat trouvé

Ondelettes et topologie de l'Univers : méthodes

Problématiques, formalisme, méthodes et exemples

3 Ondelettes et étude de l'Univers distant

3.2 Ondelettes et topologie de l'Univers : méthodes

Les premières études (Slezak et al., 1990; Gill and Henriksen, 1990), utilisant la transformée en ondelette pour l'identification de structures dans la distribution des galaxies, sont dues à l'équipe de l'observatoire de la Côte d'Azur (A. Bijaoui, E. Escalera, G. Mars et A. Mazure) et à l'équipe de l'Université de Kingston au Canada (A.G. Gill et R.N Henriksen). Les méthodologies développées ensuite dans d'autres domaines, doivent beaucoup à ces travaux pionniers.

L'utilisation des ondelettes est motivée, d'une part, par leurs propriétés intrinsèques

locale et multi-échelles, et d'autre part, parce qu'elles constituent la base d'une technique objective. En effet, aucune hypothèse est nécessaire tant sur le nombre, la richesse, la forme ou

toute autre caractéristique des structures. Bien que certains auteurs supposent que la distribution des galaxies puisse être décrite en termes de fractals, et appliquent les ondelettes avec succès (Martinez et al., 1993), l'application des ondelettes ne nécessite aucune hypothèse sur la loi de probabilité des données.

L'analyse développée par Slezak et al. (1990) consiste à calculer la transformée en ondelette de la carte de la distribution des galaxies, pour différentes échelles. Pour une échelle donnée a, le chapeau mexicain isotrope explore, en chaque pixel de l'image originale, une zone circulaire d'un rayon approximativement égal à 4a. La plus grande résolution considérée est a = 0.25Rf (où Rf est le rayon du champ d'analyse). La plus petite résolution considérée est, quant à

elle, estimée à partir de la distance inter-particule moyenne; l'aire explorée correspondante contient une unique particule. Ainsi, la plus petite valeur de la résolution est donnée par la relation (4a)2 = Rf2/Ng (où Ng est le nombre de galaxies considérées). Une valeur usuelle de

Ng conduit généralement à une résolution minimale égale à 0.05Rf. D'autre part, les effets de

bord liés à la périodisation de l'image et des filtres ondelettes dans le calcul de la transformée, doivent être pris en compte. Ceci est fait, soit en restreignant le champ d'observation, soit en insérant celui-ci dans une image plus grande (fond blanc ou bien fonction des données originales).

Les résultats sont extraits à partir de l'analyse des maxima locaux (ML) des cartes des coefficients d'ondelettes obtenues à chaque résolution. Les règles sont les suivantes:

1) Une structure donnée est localisée dans l'espace par la position du ML des coefficients ; 2) Sa taille est estimée à partir de l’échelle qui décrit le mieux la structure, i.e., l’échelle produisant la plus grande valeur du ML; dans la suite, une telle échelle optimum sera notée aopt ;

3) La signification statistique, dérivée directement du ML, donne la probabilité individuelle d'existence de la structure concernée (simulations style Monte-Carlo).

Les ondelettes quantifient la validité statistique de la détection d'une sous-structure en la comparant à des structures créées de façon aléatoire via des simulations Monte Carlo. Ces simulations sont faites pour supprimer les éventuelles corrélations due au hasard dans le jeu de données original. Ainsi, un ML associé à une vraie structure ne devrait pas être reproduit dans les simulations. En fait, le test consiste à vérifier combien de fois une structure « semblable » à celle détectée dans le jeu de données réel apparaît dans les simulations. Le paramètre naturel qui permet cette comparaison est la valeur de ML. Cette procédure donne donc, pour l’échelle examinée, la probabilité que la structure détectée apparaisse uniquement par hasard (pour détails voir Escalera et al., 1992).

Ainsi, une structure donnée, même si elle est détectée à différentes échelles, est définie, à son échelle correspondante, aopt, en termes de position-dimension et de probabilité. De cette

manière, toutes les structures peuvent être détectées quelles que soient leur position et leur taille. Un point fondamental de l'analyse, à rappeler, est que les résultats précédents sont obtenus individuellement pour chaque structure présente dans le signal original.

3.3 Illustration

La procédure décrite ci-dessus est illustrée à partir d'exemples tirés de l'article d'Escalera et MacGillivray (1995).

Imaginons une structure circulaire de rayon R (Fig. 4.3a). Dans ce cas idéal, le plus fort niveau de détection, pour cette structure, est obtenu pour une ondelette d’échelle a = R. Pour reprendre la terminologie précédente, le coefficient maximum local, ML, atteint sa valeur optimale, Copt, pour aopt = a = R. Dans ce cas particulier, la carte d'isocontours des coefficients

détectée, un seuillage T= β.Copt est appliqué à l'image (Fig. 4.3c). La valeur de β a été

déduite de l'expression mathématique du Chapeau Mexicain, dans ce travail β = 0.303. La valeur de T correspondante isole une structure circulaire de rayon égale à a, donc R (c'est simplement la taille du filtre ondelette, Fig. 4.3d). En généralisant cette procédure, l'isocontour de valeur T= β.Copt définit les limites de la structure détectée à la résolution aopt .

b

d c

a

Figure 4.3: Exemple d'une structure circulaire. (a) Simulation d'une structure "idéale" représentée par une

distribution circulaire de particules (galaxies). Le champ total d'observation est régulièrement échantillonné selon une grille de 256 x 256 pixels. La partie visible égale 64 x 64 pixels. Le rayon de la structure R = 16 pixels. (b) Transformée en ondelette de l'image à la résolution a = R = 16 pixels. Les lignes continues représentent les isocontours des coefficients d'ondelette positifs, alors que les lignes pointillées représentent les isocontours des coefficients négatifs. Le maximum local (ML) est situé au centre de la structure et a pour valeur Copt. (c) Transformée en ondelette de l'image à laquelle on a appliqué un seuil T = 0.303 x Copt. La

structure sélectionnée est délimitée par l'isocontour externe des coefficients d'ondelette: le rayon obtenu correspond à la dimension de la structure ayant produit Copt. (d) Représentation de la structure détectée par une

paramètrisation de l'isocontour externe de la transformée en ondelette seuillée. La figure finalement obtenue est un cercle de rayon r = R, en parfait accord avec la structure initiale vue en (a). (Escalera et MacGillivray, 1995).

Ces considérations théoriques s'écartent des applications pratiques par les deux points suivants:

(a) la structure détectée peut ne pas être circulaire, et

(b) la correspondance entre l'échelle d'analyse et les dimensions de la structure peut ne pas être parfaite, puisqu'un ensemble discret d’échelles successives, a, est utilisé.

Ces derniers points qui concernent uniquement la valeur et la localisation du ML n'ont pas de conséquence sur la détection. Dans le cas particulier d'une structure anisotrope (par exemple, filament), la détection est obtenue quand au moins une des dimensions de la structure correspond à la résolution de l'ondelette analysante, par exemple la largeur du filament (voir Figs 4.4 et 4.5).

a b c

Figure 4.4: Exemple d'une structure carrée. (a) Simulation d'une structure non réaliste par la distribution de

particules (galaxies) dans un carré de coté A = 32 pixels (champ d'observation total 256 x 256 pixels, champ visible 64 x 64 pixels). (b) Transformée en ondelette de l'image à la résolution a = A/2 = 16 pixels. Les lignes continues représentent les isocontours des coefficients d'ondelette seuillés avec le seuil, T, appliqué. Le maximum local (ML) se situe au centre de la structure, et l'isocontour externe correspond au "rayon" de la structure. (c) Représentation de la structure détectée par la paramétrisation de l'isocontour externe de la transformée en ondelette seuillée. La structure est, finalement, représentée par une ellipse, ici un cercle de rayon R = 17.1 pixels, et donne des informations sur la structure initiale: position, symétrie et une estimation de la taille. La valeur de r est compatible avec l'aire du carré. (Escalera et MacGillivray, 1995).

a b c

Figure 4.5: Exemple d'une structure réaliste non-circulaire. (a) Distribution elliptique de particules (galaxies).

Le champ d'observation total est une grille régulièrement échantillonnée de 256 x 256 pixels. Le champ visible est de 64 x 64 pixels. L'axe long A = 32 pixels, l'axe court B = 16 pixels. (b) Transformée en ondelette de l'image à la résolution a = A = 32 pixels. Les lignes continues représentent les isocontours des coefficients d'ondelette seuillés avec le seuil, T. Le maximum local (ML) se situe au centre de la structure, et l'isocontour externe correspond à l'axe long de la structure. (c) Détection à la résolution a = B = 16 pixels. Représentation de la structure détectée par la paramétrisation de l'isocontour externe de la transformée en ondelette seuillée. La structure est, finalement, représentée par une ellipse, et donne des informations sur la structure initiale: position, asymétrie (orientation), et estimation de la taille (axe court égale à B). (Escalera et MacGillivray, 1995).

L'étape d'identification a pour but de détecter la structure à sa meilleure échelle et d'en estimer ses paramètres géométriques. L’étape de la représentation, doit nécessairement tenir compte des points (a) et (b) précédents. En pratique, le seuillage, T, isolera un isocontour de forme irrégulière délimitant l'extension de la structure responsable du ML observé. Ainsi, dans tous les cas, l'opération de seuillage est compatible avec les principes de détection par les ondelettes. Puisque les ellipses sont bien adaptées à la représentation des structures anisotropes (conservation des informations sur l’allongement et l'orientation de la structures), Escalera et MacGillivray (1995) représentent localement la structure détectée, par l'ellipse qui correspond le mieux à l'isocontour sélectionné par T (Figs 4.3 à 4.5).