Principe et application à la minéralogie
3.4 Traitement du signal hyperspectral
De nombreux minéraux, ainsi que les assemblages minéralogiques correspondants, ont été caracté-risés en laboratoire. L’intérêt de la spectroscopie de réflectance est de pouvoir effectuer la démarche inverse, à savoir retrouver la composition et les propriétés de la roche à partir d’un spectre. Comme cela a été décrit dans la partie précédente 3.3.3, il existe une grande variété de composition chimique pour un minéral donné et d’autant plus pour les possibilités d’assemblages minéralogiques dans les roches. Il est donc nécessaire d’utiliser des techniques de traitement pour déconvoluer les données. Quelques-unes de ces différentes techniques seront brièvement présentées dans cette dernière partie pour donner un
3.4 Traitement du signal hyperspectral
Fig. 3.19 – Variabilité spectrale d’un mélange de pyroxènes : les pôles purs enstatite (spectre le plus haut) et diopside (spectre le plus bas) sont ensuite mélangés en proportions variables. Spectres acquis au RELAB (Brown University), série partielle de Sunshine et Pieters (1993)
Fig. 3.20 – Variations spectrales dans le cas d’un mélange d’olivine et de clinopyroxène, d’après Singer (1981)
Fig. 3.21 – Variations spectrales dans le cas d’un mélange d’olivine et d’orthopyroxène, d’après Singer (1981)
aperçu des possibilités existantes, mais seul le Modèle Gaussien Modifié sera présenté en détail, celui-ci étant largement mis en oeuvre dans le cadre de cette thèse.
3.4.1 Différentes techniques de déconvolution spectrale 3.4.1.1 Première approche : les traitements ”exploratoires”
Le développement des techniques de déconvolution (synthétisées notamment par Mustard et Sun-shine, 1999) est étroitement lié au développement des résolutions spectrales des appareillages de me-sures. Le nombre de canaux disponibles, c’est-à-dire le nombre de longueurs d’onde analysées, va fortement conditionner les traitements possibles pour un spectre.
3.4.1.1.1 Classifications statistiques L’objectif principal des traitements statistiques est de ré-duire la dimension des données hyperspectrales afin d’accéder efficacement à la partie intéressante de l’information. L’analyse en composante principale (ACP, ou Principal Component Analysis en anglais), permet d’extraire les spectres les plus extrêmes dans un jeu de données mais ne donne aucunement accès à l’information minéralogique contenue. Cette technique a par exemple été utilisée pour Mars sur les données ISM par Murchieet al.(2000), sur les données TIGER par Martinet al.(1996) ou sur Terre pour le massif péridotitique de Ronda (Chabrillat et al., 2000). L’analyse ACP sera utilisée par la suite pour extraire les spectres les plus différents de Syrtis Major (cf. §6.3.1).
3.4.1.1.2 Rapport de bandes Une seconde technique simple, qui nécessite peu de canaux pour être mise en oeuvre, consiste à analyser la forme des spectres à partir de rapports de bandes. Dans un premier temps, deux canaux peuvent être comparés l’un à l’autre. Une longueur d’onde non comprise dans l’absorption sert de référence par rapport à une seconde située dans le domaine de l’absorption.
Fig. 3.22 – Principe du rapport de bandes : la valeur pour une longueur d’onde hors de l’absorption est comparée à celle pour une longueur d’onde dans l’absorption. Spectres de forstérite, d’enstatite et de mélange (75% Ol - 25% Opx) acquis au RELAB (Brown University).
3.4 Traitement du signal hyperspectral
Dans l’exemple de la figure 3.22, le point gris sert de référence et les points bleus et rouges lui sont comparés. Pour le spectre d’olivine (en bleu), si la longueur d’onde correspondant à l’absorption maxi-mum (point bleu) est comparée à la référence, alors la valeur trouvée est importante. Si au contraire la longueur d’onde comparée correspond à l’absorption maximum de l’orthopyroxène (point rouge) alors la valeur du rapport est plus faible. A l’inverse, sur le spectre de l’orthopyroxène (en rouge), la valeur de rapport la plus élevée correspond à la longueur d’onde de l’absorption maximum de l’enstatite. Dans le cas d’un spectre de mélange (en violet), les absorptions de chacun des minéraux sont présentes et les valeurs de rapport pour les deux constituants sont du même ordre.
Grâce à cette technique, il est possible d’obtenir une estimation de la composition d’une roche. De plus, l’utilisation d’un rapport entre deux bandes permet de s’affranchir au premier ordre des variations photométriques (e.g.relief, éclairement), celles-ci étant considérées comme identiques pour les longueurs d’onde concernées (Chevrel et Pinet, 1990; Chevrel, 1990; Chevrel et Pinet, 1992). Nous utiliserons cette technique par la suite pour avoir une première visualisation des variations minéralogiques sur l’ensemble des données HyMap (cf. §7.3).
Il existe cependant des limitations à cette technique. En effet, il est nécessaire de connaître les positions respectives des absorptions pour chacun des minéraux potentiellement présents dans le spectre et être certain qu’il n’existe pas de superposition de ces absorptions. De plus, les valeurs déterminées à partir des rapports ne correspondent en aucun cas à une représentation physique de la composition et il n’est donc pas possible de quantifier les teneurs respectives de chacun des constituants (e.g.les valeurs de rapport de bandes similaires dans le cas du spectre de mélange alors que l’olivine est présente en proportion trois fois supérieure à l’orthopyroxène).
Pour améliorer l’efficacité de ce type de méthode, il est possible d’utiliser des indices, c’est-à-dire appliquer des coefficients aux valeurs des différentes longueurs d’onde pour faire ressortir l’information liée à une absorption caractérisée sur des données de laboratoire. Poulet et al. (2007) ont ainsi défini des indices pour déterminer la présence de constituants tels que l’olivine, les pyroxènes ou les oxydes ferriques à la surface de Mars.
3.4.1.1.3 Forme des absorptions Pour caractériser la forme des absorptions, il est nécessaire de prendre en compte le continuum (cf. §3.3.1.3). Une fois normalisée, la forme de la bande d’absorption peut être étudiée en utilisant des paramètres simples que sont la profondeur, la largeur à mi-hauteur1
et la symétrie. La largeur à mi-hauteur (en µm ou nm) correspond à la distance entre les deux bords de l’absorption à hauteur de la demi-profondeur. La symétrie est quant à elle définie par les demi-surfaces de l’aire associée à l’absorption, c’est-à-dire les surfaces situées à gauche et à droite du maximum de l’absorption. L’intérêt de ce type de méthode est de réduire considérablement la dimension des données hyperspectrales.
3.4.1.1.4 Comparaison spectrale Lorsque les roches ont une minéralogie plus complexe ou que les absorptions sont moins bien définies, les techniques détaillées précédemment restent limitées. Dans le cas où les données sont suffisamment résolues spectralement, il devient possible de réaliser une étude détaillée à partir de la forme générale d’un spectre, et de comparer celui-ci aux spectres existants dans les différentes librairies spectrales accessibles2.
1
en anglais Full Width at Half Maximum (FWHM). Cet acronyme sera utilisé dans la suite de la thèse.
2
les librairies spectrales USGS et RELAB sont respectivement accessibles aux adresses http://speclab.cr.usgs. gov/spectral-lib.htmlethttp://www.planetary.brown.edu/relabdocs/relab.htm
Deux méthodes peuvent être utilisées pour comparer deux spectres entre eux. La première consiste à mesurer la distance Euclidienne dans un espace àn dimensions,n étant le nombre de longueurs d’onde analysées, c’est-à-dire que pour une longueur d’onde donnée la distance entre le vecteur correspondant au spectre connu et le vecteur correspondant au spectre inconnu est mesurée. La distance spectrale (DS) calculée permet alors de définir un degré de ressemblance, c’est-à-dire que plus la distance spectrale est faible plus les spectres sont similaires. La seconde méthode, correspond à l’utilisation de l’angle spectral (SAM : Spectral Angle Mapper en anglais). Elle est similaire à la première si ce n’est qu’au lieu de mesurer la distance entre les deux vecteurs, c’est l’angle α entre ces derniers qui est mesuré. Launeau et al. (2002) et Combe et al. (2006) ont notamment mis en pratique ce genre de technique respectivement sur le massif péridotitique de Ronda (Espagne) et sur le massif ophiolitique de Sumail. L’inconvénient de ces méthodes est la nécéssité d’établir une librairie spectrale de référence (de laboratoire ou de terrain) en tenant compte de l’ensemble des mélanges possibles pour chacune des conditions d’observations possibles. Le nombre de combinaison étant très important, il est difficile de mettre en oeuvre une telle procédure directe de façon automatique. Il existe toutefois une méthode améliorée, l’algorithme Tetracorder développé par Clark et al. (2003), qui permet de comparer les spectres uniquement dans la gamme de longueur d’onde affectée par une absorption.
3.4.1.2 Vers l’aspect quantitatif
Les techniques de traitement précédentes permettent d’obtenir une estimation des composants d’un spectre. Ils restent toutefois limités en termes de quantification des différents minéraux, surtout dans le cas de mélanges non-linéaires pour lesquels les librairies spectrales manquent de données. Il a donc été nécessaire de développer des techniques plus complexes pour accéder à ces informations.
3.4.1.2.1 Théorie du transfert radiatif La première approche consiste à quantifier les processus de diffusion via l’équation du transfert radiatif. Cette équation permet de calculer l’interaction entre une onde lumineuse et un milieu constitué d’un empilement de couches homogènes en prenant en compte l’absorption et la diffusion. Hapke (1981), complété par une série successive de publications (Hapke et Wells, 1981; Hapke, 1984, 1986, 2002), a proposé une solution analytique au problème de transfert radiatif appliqué aux surfaces particulaires telles que les surfaces planétaires. Sa théorie prend en compte la diffusion anisotrope de la lumière par les particules, les effets d’ombrage et les phénomènes de réflexion à la surface des grains. Elle peut, de plus, être utilisée dans le cas de mélanges.
Bien que ce genre de théorie permette de calculer des spectres en réflectance, il faut tenir compte de l’ensemble des paramètres physiques impliqués pour inverser des données (Poulet et Erard, 2004). Il s’agit notamment de la taille des grains, de l’agencement des grains entre eux et de la géométrie de surface. Cette méthode n’est donc pas la plus aisée à mettre en oeuvre dans le cas de traitements d’images hyperspectrales de surfaces planétaires où ces paramètres sont mal contraints. Elle est de plus également soumises aux informations de laboratoire puisque les constantes optiques, fonction de la composition chimique, doivent être connus auparavant.
3.4.1.2.2 Mélanges linéaires Comme cela a été décrit dans le paragraphe 3.3.3.3.1, il existe deux types possibles de mélanges pour une surface. Les mélanges linéaires correspondent d’un point de vue physique à la juxtaposition de surfaces homogènes au sein d’un même pixel. Le but de cette approche est donc de trouver, pour chaque pixel, la meilleure combinaison linéaire d’une série de spectres de minéraux purs enregistrés en laboratoire, et permettant de reproduire les données acquises. Cette
3.4 Traitement du signal hyperspectral
méthode, initiée par Adams et al. (1986), permet de décrire les variations spatiales de l’information spectrale contenue dans une image. Cependant, en raison des problèmes de non-linéarité selon les types de mélanges, le résultat est utile pour une information au premier ordre mais il apparaît généralement des différences entre les proportions réelles des minéraux et celles calculées. Cette méthode a été très utilisée au cours des vingt dernières années (Pinet et al., 1993; Head et al., 1993; Tompkins et al., 1994; Martin et al., 1996; Martin, 1996...) et a donné lieu à des améliorations successives concernant la détermination et l’optimisation du choix des pôles de mélange, avec l’introduction de la notion de mélanges itératifs (e.g., Roberts et al., 1998; Chabrillat et al., 2000; Pinet et al., 2000; Adams, 2006; Chevrelet al., 2008).
Un algorithme basé sur les mélanges linéaires de spectres a notamment été développé pour une utilisation en contexte martien (Combe et al., 2008). Cette approche utilise des spectres artificiels plats et à pentes pures dans la librairie de départ permettant de prendre en compte au premier ordre des effets liés à la diffusion atmosphérique, à la taille des grains, à l’ombrage et à la photométrie. 3.4.2 Le Modèle Gaussien Modifié (MGM)
Un dernier modèle de déconvolution couramment utilisé est le Modèle Gaussien Modifié, développé par Sunshineet al.(1990). L’intérêt de ce modèle est de prendre en compte directement les processus de transition électronique pour obtenir une quantification des minéraux constitutifs de la surface observée. Il s’applique donc parfaitement dans le cas des olivines et pyroxènes dont les spectres sont marqués par la présence du fer (Sunshine et Pieters, 1993, 1998).
Comme nous l’avons vu précédemment, chacune des techniques de traitement des données hyper-spectrales possède ses avantages et ses inconvénients, leur intérêt respectif résidant dans l’objectif fixé par l’utilisateur. Les différences, en termes de détection des unités lithologiques, ont par exemple été mises en évidence par Gendrin (2004) qui a comparé les résultats obtenus à partir de certaines de ces techniques (SAM, Tetracorder, MGM et transformée en ondelettes) sur des données AVIRIS et ISM (Gendrin, 2004 ; Gendrin et al., 2006b).
L’objectif premier de cette thèse est de caractériser à la fois les variations de composition modale de surfaces planétaires mafiques et ultra-mafiques et les compositions chimiques des minéraux associés. Le Modèle Gaussien Modifié est donc a priori tout à fait adapté, car il peut couvrir l’ensemble de la gamme des compositions envisagées. Le but premier de l’étude ne portant pas sur la comparaison avec d’autres techniques de traitement, nous avons choisis de nous concentrer seulement sur ce modèle prometteur et de tester de façon intensive son applicabilité et ses limites dans le cas de minéralogies complexes, en allant de situations expérimentales de références vers des observations en milieu naturel. Les paragraphes suivants ont donc pour objectif de présenter le principe et les applications du Modèle Gaussien Modifié, tels que décrits dans la littérature. Ce modèle sera ensuite utilisé tout au long de cette thèse.
3.4.2.1 Principe
3.4.2.1.1 Modèle Gaussien classique et Modifié Le travail de Sunshine et al. (1990) repose sur le fait que les variations du spectre dans le visible et proche-infrarouge sont composées de bandes d’absorptions assimilables à des gaussiennes (Clark et Roush, 1984). Le modèle gaussien classique considère que l’énergie est la variable aléatoire pour toutes les absorptions.
Cependant, dans le cas des absorptions dues aux transitions électroniques, l’énergie est fonction de la distorsion des sites cristallographiques et de la longueur moyenne de la liaison ion-ligand (Burns,
1970b). Dans les minéraux naturels, il existe des millions de mailles élémentaires et donc des millions de sites cristallographiques. Bien que ceux-ci présentent des caractères similaires, ils ne vont pas être parfaitement identiques à cause des défauts, des vides ou des substitutions qui peuvent se produire. Ces irrégularités, couplées aux vibrations thermiques, vont mener à une distribution statistique des longueurs moyennes de liaison ion-ligand (Sunshine et Pieters, 1993). La variable aléatoire devient alors cette longueur de liaison (r) et elle peut être reliée à l’énergie de l’absorption (e) par une loi de puissance :
e∝rn
A partir de cette loi, Sunshine et al. (1990) suggère qu’une distribution gaussienne des longueurs moyennes de liaison peut être transformée en une distribution gaussienne ”modifiée” des énergies d’ab-sorption, suivant la relation :
m(x) =S.exp −(xn−νn)2 2σ2 (3.10) avec la distribution gaussienne modifiée m(x) qui s’exprime en fonction de son intensité (S), de son centre (ν) et de sa largeur (σ), x étant alors l’énergie. Modifier l’exposant n revient à modifier la symétrie de la distribution, c’est-à-dire la pente relative des ailes gauche et droite de la gaussienne.
Sunshineet al.(1990) ont pu déterminer la valeur du coefficientn empiriquement : dans le cas d’une gaussienne classiquen= 1, tandis que pour une gaussienne modifiéen' −1. Cette modification permet alors de modéliser une absorption électronique simple avec seulement une distribution gaussienne. La solution est donc plus proche de la réalité physique. Un exemple de différence entre les deux modèles est donné dans la figure 3.23. Le Modèle Gaussien Modifié va donc permettre d’analyser directement les absorptions dues aux transitions électroniques.
Fig. 3.23 – Différence entre la modélisation effectuée par le Modèle Gaussien classique (à gauche) et le Modèle Gaussien Modifié (à droite). Exemple sur une forstérite, d’après Sunshineet al.(1990).
3.4.2.1.2 Procédure mathématique Après avoir présenté la particularité du Modèle Gaussien Modifié, ce paragraphe a pour but de décrire le fonctionnement mathématique général du modèle. Celui-ci est présenté plus en détail dans Sunshineet al.(1990) et Sunshine et Pieters (1993).
Les bandes d’absorption suivent la loi de Beer-Lambert, le spectre doit donc être converti en son logarithme népérien. Il est alors modélisé comme étant une superposition de gaussiennes modifiées et
3.4 Traitement du signal hyperspectral
d’un continuum de forme polynomiale. La formulation mathématique s’exprime de la manière suivante : lnR(x) = m X i=1 Siexp ( − x−1−νi−12 2σ2i ) + ln p0+p1.x+p2.x2 (3.11) où R représente la réflectance, Si,νi etσi respectivement l’intensité, le centre et la largeur de chaque gaussienne, p0,p1,p2 et p3 les paramètres du polynôme et x la longueur d’onde. Chaque gaussienne modifiée est effectivement une fonction gaussienne de la longueur d’onde et la profondeur de bande
Si doit toujours être négative. D’après cette équation, lors de l’inversion, les paramètres associés aux gaussiennes et au polynôme vont évoluer de façon conjuguée. La largeur à mi-hauteur, qui sera utilisé par la suite dès que nous parlerons de largeur de gaussienne, peut être obtenue à partir deσ :
F W HM = 2(2 ln 2σ)12
Les paramètres Si, νi et σi sont optimisés par un algorithme d’inversion non-linéaire basé sur une méthode de moindres carrés appliquée de manière itérative. Sunshine et Pieters (1993) ont choisi d’utiliser la méthode d’inversion stochastique modifiée de Tarantola et Valette (1982). Cette méthode présente l’intérêt d’appliquer des incertitudes aux paramètres initiaux des gaussiennes. En optimisant au préalable la définition de ces incertitudes en fonction des absorptions présentes, le modèle devient à la fois plus réaliste et plus performant du point de vue du temps de calcul. La qualité de la modélisation peut être mesurée par l’erreur résiduelle (root mean square ou rms) :
rms= P ελ n 1 2
Le problème posé est alors de déterminer le nombre de gaussiennes et les paramètres de chacune d’entres elles pour que le modèle reproduise au mieux le spectre observé.
3.4.2.2 Application aux olivines et aux mélanges de pyroxènes
Avant de s’intéresser aux développements effectués par rapport au MGM original, ce paragraphe va brièvement décrire les premiers résultats acquis sur des spectres d’olivines et de pyroxènes (Sunshine et Pieters, 1993, 1998). Ces résultats seront par la suite utilisés comme référence pour des minéralogies simples similaires à celles présentées ici. Les tendances décrites serviront aussi à contrôler la validité physique des solutions mathématiques dans le cas de minéralogies plus complexes.
Pour une série d’olivines de compositions chimiques balayant la gamme de la solution solide forstérite-fayalite, Sunshine et Pieters (1998) ont pu mettre en évidence des tendances systématiques caractéristiques des sites M1 et M2 (Fig. 3.24). La position des centres des gaussiennes se décale vers les plus grandes longueurs d’onde pour les olivines riches en fer selon des tendances linéaires. Il en va de même pour l’intensité relative de l’absorption à 1.05 µm par rapport à celle à 1.20 µm. Cette évolution continue résulte de la substitution entre l’ion Mg2+ et l’ion Fe2+. Les rayons ioniques étant différents, respectivement 0.72 et 0.77 Å, la taille des sites cristallographiques est en conséquence modifiée. Il est à noter que les largeurs des gaussiennes ne montrent pas d’évolution caractéristique, bien que les largeurs associées à M1augmentent légèrement dans les échantillons plus riches en fer. On notera cependant que cette étude exploratoire s’appuie sur des échantillons constitués de poudres ayant des tailles de grains inférieures à 60 µm. Pour des tailles de grains plus importantes, il se peut qu’il ne soit pas possible d’extrapoler ces résultats.
Fig.3.24 – Tendances définies par Sunshine et Pieters (1998) liant la composition chimique de l’olivine aux paramètres spectraux des bandes d’absorptions. En haut : Variations de la position des centres ; En bas à gauche : Variations de la largeur ; En bas à droite : Variations de l’intensité normalisée à l’intensité de l’absorption à 1.22 µm.
Pour les mélanges composés de deux pyroxènes à compositions chimiques fixées, Sunshine et Pieters (1993) ont pu déconvoluer des spectres sous la forme de gaussiennes qui correspondent directement aux absorptions des pôles purs. Par conséquent, les centres et les largeurs des absorptions sont définis par ces pôles purs et ne varient pas en fonction de la composition modale du mélange. Il est également possible d’établir un lien entre l’intensité des absorptions respectives de l’orthopyroxène et du clinopyroxène. Les tendances montrent une évolution inverse de l’intensité de l’absorption d’un pyroxène par rapport à l’autre (Fig. 3.25). Le CBSR (Component Band Strength Ratio) défini par Sunshine et Pieters (1993) s’exprime de la façon suivante :
CBSR= SOpx
SCpx
où SOpxet SCpx correspondent respectivement à l’intensité de la gaussienne associée à l’orthopyroxène et au clinopyroxène. Ce paramètre permet, à partir de l’information spectrale, de remonter à la