R´eduction et analyse de donn´ees - Détection des galaxies à faible brillance de surface et seg

Les méthodes de réduction et d’analyse de données permettent de synthétiser un ensemble réduit de valeurs tout en cherchant à conserver le maximum d’informations présentes dans les observations originales. Notre problématique étant de fournir une représentation synthétique des observations sous la forme d’une composition colorée, une méthode d’analyse de données (l’analyse factorielle discriminante) est étudiée. Une réduction étant nécessaire lorsque c > 10, une méthode basée sur un algorithme de coa- lescences est également présentée.

4.4.1 L’analyse factorielle discriminante

L’analyse factorielle discriminante (AFD [74]) est une méthode classique d’analyse de données supervisée qui permet la projection des données dans un espace maximisant la variance inter-classes tout en minimisant la variance intra-classe. L’utilisation de ces deux critères permet de déterminer les axes de projection séparant linéairement les classes.

Soit Y = (y1, ..., yb) les observations avec c le nombre de bandes et N le nombre de

pixels de chaque image. Chaque site s de Y est associ´e `a une classe ωk avec k ∈ {1..K}.

L’ensemble des sites s de la carte de segmentation X appartenant `a ωk est not´e Jk. On

peut alors représenter Y sous forme matricielle en adoptant les conventions de notation précisées dans la fig. 4.3.

L’AFD consiste `a calculer trois matrices de covariance :

– T (total) : matrice totale de covariance (´eq. (4.2)) ;

– _{B (between) : matrice de covariance inter-classes (´eq. (4.3)) ;} – _{W (within) : matrice de covariance intra-classes (´eq. (4.4)) ;}

Fig. _{4.3 – Représentation matricielle des observations. Le vecteur y}_j _{représente la bande} j de Y mise sous la forme d’un vecteur colonne. ykj correspond aux sites de la bande j appartenant à la classe ωk.

Ces trois matrices vérifient la propriété [74] :

T = W + B (4.1) avec tjj′ = 1 N N X i=1

(yij− ¯yj)(yij′ − ¯y_j′) (4.2)

et bjj′ = K X k=1 ♯Jk N (¯ykj− ¯yj)(¯ykj′ − ¯yj′) (4.3) et wjj′ = 1 N K X k=1 X j∈Jk

(ykj− ¯ykj)(ykj′ − ¯y_kj′) (4.4)

o`u ¯yj est la moyenne de la bande j :

¯ yj = 1 N p X i=1 yij (4.5)

et ¯ykj est la moyenne de la bande j pour tous les sites s appartennant `a la classe ωk :

¯ ykj = 1 ♯Jk ♯Jk X i=1 yij (4.6)

On montre alors que les axes de projection donn´es par les vecteurs propres E ∈ {E1...EN} de T−1B v´erifient [74] :

T−1_BE

i = ΞiEi (4.7)

On supposera par la suite que les vecteurs propres sont ordonnés par valeurs propres décroissantes. Les observations sont ensuite projetées sur cette base de vecteurs propres et seules les n premières images résultantes, correspondantes aux n valeurs propres les plus grandes, sont conservées. On obtient donc les images projetées zl de la manière suivante :

zl ∝ N

j=1

yij × El(j) (4.8)

El(j) étant la composante j du vecteur propre associé à la l-ième plus grande valeur

propre.

Il convient de noter, d’une manière générale, qu’il suffit de k− 1 axes pour séparer k classes.

Notre méthode de visualisation des images astronomiques multispectrales cherche à transcrire dans la composition colorée, les variations de luminance intra-classes. L’analyse factorielle discriminante permet de réaliser ceci au travers des critères de maximisation de la variance intra-classes et de minimisation de la variance inter-classe.

4.4.2 R´eduction des donn´ees

Les méthodes de réduction de données sont généralement utilisées lorsqu’intervient le phénomène de malédiction de la dimensionnalité. Le travail dans un espace réduit permet de faciliter les traitements postérieurs dans un espace de dimension bien inférieure à la dimension de l’espace originale.

Les méthodes ACP et ACI, dérivées des méthodes de poursuites de projection, pro- jetant les données dans un espace maximisant un certain critère, sont généralement uti- lisées pour leur simplicité. Cependant, la projection résultante peut être difficilement interprétable et l’espace obtenu de manipulation peu intuitive. Les méthodes d’approxi- mation de spectres par mélange de lois gaussiennes[24] permettent de représenter un spectre sous la forme d’une combinaison linéaire de lois gaussiennes. Dans [24], l’estima- tion des paramètres du mélange de lois se fait grâce à l’algorithme EM. Ces méthodes restent peu applicables dans le cas de grands cubes de données présentant de nombreuses raies d’émission/absorption.

Lorsque le nombre de bandes dépasse la dizaine, nous adoptons au préalable une stratégie de regroupement de bandes utilisant un algorithme de ”bottom up clustering” avec une mesure de similarité multiéchelles [14, 25]. L’approche consiste à supposer que les bandes dont les longueurs d’ondes sont proches, sont généralement très corrélées et leur apport d’informations est redondant. La méthode se décompose alors en deux phases :

– regroupement des bandes en cluster en fonction d’un crit`ere de similarit´e ;

– projection dans chacun des clusters `a l’aide d’une ACP ou d’une ACI.

L’algorithme utilisé consiste à grouper les bandes deux par deux au fur et à mesure des itérations en fonction d’une mesure de similarité multirésolution basée sur les histo- grammes normalisés[13] combinés avec les moments d’inertie d’ordre 1 (barycentre). Soit

i l’histogramme normalisé d’une image i à l’échelle k, alors la mesure de divergence à

l’´echelle k est : Dk ij = (hki − hkj)log hk i hk j. On pose g k

i comme ´etant le barycentre de l’image

i `a l’´echelle k. On note alors lkij comme la distance euclidienne entre les deux barycentres

i et gkj. En sommant tous les barycentres et toutes les divergences `a toutes les ´echelles,

on obtient alors une mesure de similarité entre deux images i et j. Cette mesure est alors utilisée pour grouper les bandes deux à deux.

L’utilisateur fournit, en entrée de l’algorithme, le nombre de bandes réduites voulues, correspondant ainsi au nombre de clusters à construire.

La réduction au sein de chaque sous-ensemble est alors réalisée par une ACP ou une ACI (algorithme FastICA avec décorrélation déflationniste [35])

Dans le document Détection des galaxies à faible brillance de surface et segmentation hyperspectrale dans le cadre de l'observatoire virtuel (Page 93-96)