• Aucun résultat trouvé

Identification des variations d'échelles

espace fréquenceDomaine

5.6 Identification des variations d'échelles

Identifier les structures significatives d'un signal à partir de composantes passives ou bruitées est un problème omniprésent en traitement du signal. Beaucoup de problémes en géophysique passent par la détection et la caractérisation des structures cohérentes inscrites dans le signal analysé. Nous allons étudier ici la manière d'isoler, dans la représentation espace-échelle, les structures significatives du bruit.

Le spectre global d'ondelette, défini par Meneveau (1991) et Hudgins et al. (1993) par:

∞ ∞ − = C a b db a Gf( ) f( , ) 1.22

a été beaucoup utilisé pour détecter les échelles dominantes ou les modes de variations. Notons que le spectre global condense la représentation espace-échelle (scalogramme) en une seule fonction de l'échelle (fréquence). Gammage et Hagelberg (1993) expliquent que le spectre global d'ondelette peut être comparé au spectre de Fourier (où la variance du signal est décomposée en une fonction de la longueur d'onde). La différence fondamentale entre la décomposition en ondelette et celle de Fourier est le support des fonctions de base respectives. Les coefficients d'ondelette sont influencés par des événements locaux (support fini) alors que les coefficients de Fourier sont influencés par l'ensemble de la fonction signal (support infini). Ceci fait du spectre d'ondelette une meilleure mesure de la variance attribuée à des événements localisés.

Les maxima locaux du spectre local d'ondelette fournissent ainsi des informations sur les échelles auxquelles des structures majeures ou des événements cohérents apparaissent de manière significative. Ceci peut être dû, soit à une structure ayant une importante contribution, soit à plusieurs petites ayant de plus petites contributions. Ces situations peuvent être simultanément présentes dans le signal analysé.

Sur cette base, des variantes de deux techniques, baptisées en anglais « scale threshold partitioning » et « phase-plane threshold partitioning » (voir Hagelberg et Gammage, 1994), ont été employées pour isoler les modes de variation dominants.

Le « scale treshold partioning » consiste, comme son nom l'indique, à reconstruire le signal en utilisant uniquement les coefficients qui contribuent à des maxima locaux du spectre en ondelette si ce dernier présente des limites claires en terme d'échelle. Si ces limites ne sont pas claires, on peut alors utiliser tous les coefficients d'ondelette associés aux échelles perçues comme dominantes. Dans le « phase-plane partitioning », on reconstruit le signal en utilisant les coefficients d'ondelette dont l'amplitude est supérieure à un certain seuil. Dans ce cas, on réalise une séparation entre signal et bruit. Ceci est possible car en présence de bruit blanc dans le signal, sa contribution est estompée à toutes les échelles. Aussi, cette composante bruitée fournit une contribution mineure à toutes les échelles et peut être, ainsi, aisément éliminée par le choix d'une valeur seuil appropriée. Comme discuté en détail dans l'article de Donoho et Johnston (1994) il existe plusieurs manières de choisir ce seuil. Souvent, la

Dans la suite de ce travail, pour les applications 1D, nous suivrons le formalisme proposé par Torrence et Compo (1998). Sur les bases des études de Qiu et Er (1995) sur la moyenne et la variance du spectre de puissance local déduit de la TO, Torrence et Compo (1998) ont étudié le comportement théorique du spectre de puissance local pour un bruit blanc puis pour un bruit rouge, et ont comparé ces résultats avec des simulations style Monte Carlo. Ils ont montré que chaque point du spectre de puissance est statistiquement distribué selon une loi en χ2 autour du spectre moyen de référence (ex: bruit rouge).

Supposant un spectre moyen de référence, P, d’un bruit de référence, s, la distribution pour le spectre de puissance déduit de la TF est, à chaque indice de fréquence ν:

2 2 2 2 2 1 2 ˆ χ σ ν ν P s N ⇒ 1.23

où => signifie « est distribué comme ».

Puisqu'il a été montré que le spectre d'ondelette local suit le spectre de Fourier moyen, la distribution correspondante pour le spectre déduit de la TO est, pour chaque échelle a :

2 2 2 2 2 1 ) ( χ σ a Gx ⇒ 1.24

Le terme 1/2 supprime le facteur degré de liberté de la distribution χ2 (pour une ondelette réelle la distribution de droite aurait été Pνχ12). La valeur de Pν dans l'équation 1.23

est obtenue à partir du spectre de Fourier moyen à la fréquence, ν, correspondant à l'ondelette d'échelle a (voir Torrence et Compo 1998, section 3h pour détails). Des relations entre ν et a, on peut déduire que l'équation 1.24 a l'avantage d'être indépendante de l'ondelette choisie.

En résumé, après avoir trouvé un spectre moyen de référence et choisi un niveau de confiance pour la distribution χ2 (ex. 95% ), on multiplie le spectre de référence (la puissance à chaque fréquence) par le niveau de confiance de la distribution χ2 (Eq. 1.24). Pour un niveau de confiance 95% et une ondelette complexe (2 degrés de liberté), ce nombre est 2.996 (5.991/2). Ce qui signifie que n'importe quel pic du spectre d'ondelette doit être 2.996 fois plus grand que le spectre de référence (à cette échelle) pour être significatif à 5% (Table 1.2). On construit ainsi les lignes de contours pour le(s) niveau(x) de confiance considéré(s).

90% 95% 97.5% 99% 99.5%

1 2.706 3.841 5.024 6.635 7.879

2 4.605 5.991 7.378 9.210 10.597

3 6.251 7.815 9.348 11.345 12.838

Table 1.2: Distribution χ2 pour 1, 2 et 3 degrés de liberté, et pour les niveaux de confiance 90%, 95%, 97.5%, 99% et 99.5%.

Le choix du spectre de référence est la partie délicate de cette technique. En l’absence de critère de choix, Torrence (communication personnelle, 1999) suggère d'utiliser le spectre d'ondelette global (G, moyenne temporelle du spectre de puissance d'ondelette). De manière générale, c'est cette opération que nous effectuons dans l'analyse des séries géophysiques 1D (Chapitre 2). Bien que cette approche soit séduisante, il faut la manipuler avec précaution. Comme le précise Torence et Compo (http://paos.colorado.edu/research/wavelets/) comme n’importe quel test statistique de confiance, le niveau de confiance implique que pour une série aléatoire, 5% des points seront au-dessus de ce seuil uniquement par chance. Aussi, ces niveaux de confiance doivent être interprétés avec prudence. En particulier, on doit regarder - la taille des zones dites statistiquement significatives et

- leur distribution spatiale (aléatoire ou selon un schéma particulier). Les deux observations précédentes sont des mesures subjectives. Dans l’analyse de Fourier, ou dans les techniques de seuillage précédemment présentées, on a le même problème. A-t-on un pic isolé dépassant à peine le seuil critique (il peut alors être suspect) ou bien a t-on un large pic bien au-dessus du seuil?

L’approche suivante proposée par Torrence (communication personnelle, 1999) peut être utile, et nous l’avons humblement adoptée:

1) analyser le signal par Fourier et regarder si il y a des pics « intéressants » (généralement, on connaît ces pics sans avoir à faire cette analyse fréquentielle) ;

2) Inspecter le spectre d’ondelette en concentrant son attention sur les échelles où il y a des pics « intéressants » en guettant tous les signes de non-stationarité, à savoir:

- les modulations d’amplitude: les périodes sont-elles groupées sur un intervalle? - les modulations de fréquence: les périodes changent-elles avec le temps?

Le seuil choisi n’est plus alors qu’une aide pour décider si les résultats sont significatifs.