• Aucun résultat trouvé

L’implémentation de l’analyse en composantes principales dans la chaîne

2.2 Le développement d’une technique avancée de soustraction basée sur l’analyse en

2.2.2 L’implémentation de l’analyse en composantes principales dans la chaîne

de réduction de l’IPAG

L’analyse en composantes principales repose sur la diagonalisation de la matrice de va-riance/covariance ou de corrélation d’un nuage de points centré, pour former une nouvelle base orthonormale appelée base de Karhunen-Loève (base K-L), dans laquelle les coordonnées des points sont indépendants et de variance maximale. En d’autres termes, on effectue un change-ment de repère de façon à se placer dans un nouveau système de représentation où le premier axe apporte le plus possible d’information sur le nuage de points, le deuxième axe le plus pos-sible d’information non prise en compte par le premier axe, et ainsi de suite. En se limitant aux premiers axes de ce nouveau repère, et en se replaçant dans le repère initial, on conserve alors uniquement la part d’information pertinente. C’est ce principe qui est appliqué en imagerie pour construire une évaluation de la FEP.

L’analyse en composantes principales laisse beaucoup de libertés quant à sa manière d’être implémentée. Je présente la version que j’ai retenue et implémentée dans la chaîne de réduction de l’IPAG, ainsi que les raisons de ces choix.

2.2. Le développement d’une technique avancée de soustraction basée sur l’analyse en composantes principales qui dans le cas de données provenant d’imagerie différentielle angulaire, représente une

séquence temporelle d’images. Nous reprenons les notations de Soummer et al.(2012) et

notons

{Iψk(n)}k=1...K

la bibliothèque initiale contenant K images, où n∈ 1, , N correspond au nième pixel de

l’image (ou de la zone de l’image sur laquelle s’effectue l’analyse) contenant au total N

pixels. Les étapes de construction de la base de Karhunen-Loève sont décrites ci-dessous et illustrées graphiquement par la Figure 2.14.

Formattage Y= y1 1 y1 2 ... y1 K y2 1 y2 2 ... y2 K ... ... ... ... y1N yN2 ... yNK ! " # # # # # $ % & & & & & Pixel 1 Pixel 2 Pixel N Ima g e 1 Ima g e 2 Ima g e K Corrélation Centrage + reduction Diagonalisation V=1 n t X!X Bibliothèque de FEP

•  Vecteurs propres = axes principaux

•  Valeurs propres = variances expliquées par les axes

X

Figure 2.14 – Etapes de construction de la base de Karhunen-Loève pour une bibliothèque de

FEP.

Les données initiales d’une analyse en composantes principales sont généralement

appe-lées des individus et leurs attributs. On les regroupe sous forme d’une matriceY ={yk

n} dont les individus représentent les lignes et les attributs les colonnes. J’ai choisi ici comme

approche de considérer les N pixels comme les individus, et les K images comme les

at-tributs, comme indiqué sur la Figure 2.14. Nous noterons queAmara & Quanz(2012) ont

considéré l’approche opposée. Les deux approches sont duales, les composantes principales dans le premier cas sont les facteurs principaux dans l’autre cas et vis versa. Néanmoins, dans le cas de l’ADI, nous disposons en général de plus de pixels dans la zone de travail

(typiquementN = 100×100 = 104) que d’images dans la librairie (Kest de l’ordre de la

centaine voire du millier si l’on travaille en mode cube3), et l’approche que j’ai retenue

s’avère plus rapide en terme de temps de calcul car l’analyse en composantes principales

implique la diagonalisation d’une matrice de tailleK×K.

La première étape consiste à centrer et réduire les données. On retire à chaque attribut (c’est-à-dire chaque image ou région de travail) sa valeur moyenne et on la divise par son écart-type. L’analyse en composantes principales se fait alors sur la matrice de corrélation. On peut aussi travailler sur la matrice de covariance et ne pas diviser les attributs par leur écart-type. Les tests effectués n’ont pas montré d’améliorations dans ce cas, et, même si l’écart-type est un estimateur particulièrement sensible au bruit des données, j’ai préféré cette implémentation pour différentes raisons :

• Les attributs (images) deviennent ainsi sans dimension et uniformes. Cela permet de comparer quantitativement les bases K-L obtenues pour des données à différentes longueurs d’onde ou prises dans des conditions atmosphériques différentes.

• Les attributs avec les plus grands écarts-types ont un poids plus faible et ne contri-bueront pas autant dans la création des axes principaux.

La matrice initiale Y est donc transformée en une nouvelle matrice X = {xkn} centrée

réduite avec xkn = ykn−Y¯k

σk . On appelle matrice d’inertie la matrice V = N1tXX. Dans le

cas d’un nuage de points centré et réduit, cela correspond donc à la matrice de corrélation

3. Le mode cube signifie que chaque pose individuelle de temps d’exposition DIT est sauvegardée (Girard et al. 2010)

des variablesYk car V = {vkk} avec vkk = Covσ(Y ,Y )

k . On appelle l’inertie des données

l’expression I0 = trace(V) = K. Les axes principaux sont les vecteurs propres de la

matrice d’inertie V, notés iciuαavecα∈[1, K], classés de manière décroissante. La valeur

propreλαreprésente l’inertie de laαième nouvelle composante. La valeur desλα pourα∈

[1, K]est illustrée par la Figure 2.15. Plus concrètement, un axe principal représente une

séquence temporelle (un vecteur de RK) formée à partir d’une combinaison linéaire des

séquences temporelles de chacun des pixels. On appelleαième facteur principal le vecteur

cαdeRN dont les composantes sont les coordonnéescαndes pointsxndeRK. Les facteurs

principaux sont des images dont chaque pixel correspond à la projection des valeurs

temporelles de ce pixel au sein du cube sur leαième axe principal noté∆uα. Ils peuvent

être visualisés plus facilement que les axes principaux sous forme d’images.

u1 a la particularité d’être le vecteur propre qui explique la plus grande part de l’inertie

des données. C’est le vecteur deRK qui minimise les résidus (au sens des moindres carrés

ou de la norme ||.||2) entre les xi et leur projection sur l’axe engendré par u1,∆u1. En

d’autres termes, il décrit l’évolution temporelle moyenne de l’ensemble des pixels. Souvent d’ailleurs, le premier facteur principal est très proche de la moyenne temporelle du cube d’image. Retirer la première composante principale est donc très similaire à effectuer une réduction cADI.

De proche en proche, dans le sous-espace ,(u1),u2 a la propriété d’être le vecteur propre

qui explique la plus grande part d’inertie des données projetées dans ce sous-espace. Interprétation de l’analyse en composantes principales La valeur propreλαest

l’iner-tie expliquée par l’axe principal∆uα engendré paruα. C’est aussi la variance deuα. Plus

elle est élevée, plus l’axe contient d’information. On peut utiliser différents indicateurs pour interpréter une analyse en composantes principales :

• La contribution du nième pixel au αième axe principal : L’inertie expliquée par l’axe

principal ∆uα estI(∆uα) =λα= N1 PN

n=1(cαn)2. La contributionCT Rα(n)du pixel

n à la création de cet axe principal∆uα peut ainsi être définie comme

CT Rα(n) = (c

α n)2/N

λα (2.4)

La somme des contributions de tous les pixels au αème axe est donc par construction

1. La carte des contributions correspond à la 3ième image représentée sur les Figures

2.17 et 2.18.

• Contribution du pixel n à l’inertie totale du nuage :

On peut aussi définir la contribution des pixels individuels à l’inertie totale I0 :

CT R(n) = kxnk2/N

I0 (2.5)

La somme des contributions de tous les pixels à l’inertie totale vaut 1. La carte de la contribution à l’inertie totale est représentée sur la Figure 2.16.

• Qualité de la représentation du nième pixel sur l’axe principal ∆uα :

Cette quantité, notéeCO2α, est définie comme le cosinus carré de l’angle entre l’objet

n et sa projection sur l’axe α. Si l’objet est sur l’axe, cet angle est nul et la qualité

de représentation vaut 1. L’objet est entièrement expliqué par cet axe. On interprète

donc cet indicateur comme la part d’inertie du pixel nexpliquée par l’axe ∆uα.

Formellement, CO2α(n) = (cαn)2

kxnk2. La qualité de représentation est la 2ième image

2.2. Le développement d’une technique avancée de soustraction basée sur l’analyse en composantes principales La contribution représente la décomposition pixel à pixel de l’inertie expliquée par un axe en particulier, Inversement, la qualité de représentation est la décomposition axe par axe de l’inertie d’un pixel en particulier.

Une propriété intéressante est l’indépendance entre contribution et qualité de représen-tation :

• un pixel ayant une forte contribution et une forte qualité de représentation signifie qu’il est bien représentatif de l’axe et ne contribue pas significativement à la création d’autres axes.

• un pixel ayant une forte contribution et une faible qualité de représentation doit être interprété avec beaucoup de prudence, voir être exclu de la région car il possède un comportement inhomogène. Il peut contribuer à la création d’autres axes.

• un pixel peut également avoir une faible contribution mais une bonne qualité de représentation. Il peut être utile pour interpréter cet axe.

Exemple d’application sur l’étoile HD 61005 Je présente ici à titre d’illustration les résultats de l’analyse en composantes principales réalisée sur les données de l’étoile HD 61005 acquise en bande H, déjà utilisées pour illustrer l’étude des corrélations. La région de travail sur laquelle a été réalisée l’analyse en composantes principales est l’anneau

compris entre2×λ/D et10×λ/D. Le centre de l’image étant saturé, il ne contient pas

de signal astrophysique pertinent et a été exclu de la région de travail S. Cette région

contient N = 5488pixels et le nombre d’images est K = 485. Les résultats de l’analyse

en composantes principales sont résumés dans le tableau 2.3 et la part d’inertie expliquée

par chaque axe principal∆uα, noté λα/I0 est tracée sur la Figure 2.15. On constate que

le premier axe principal (encore appelé mode) explique la majeure partie de l’inertie des images, et un point d’inflexion est observé après les trois premiers modes. Cela signifie que le premier mode est très stable au fil du temps et que la plupart des images sont déjà bien décrites par leur projection sur le premier mode.

En effet, dans le cas le plus extrême où toutes les images sont expliquées par le premier

mode, on aurait λ1 = K = 485 et λ2 = ... = λK = 0 : toutes les K images sont

proportionnelles. Dans un cas plus réaliste, on peut imaginer un cube d’images formées par une FEP statique à laquelle s’ajoute un bruit non-corrélé de petite amplitude. Dans ce

cas, nous retrouverions là encore une première valeur propre élevée, puis desλαconstants

pourα≥2puisque aucune direction particulière n’est privilégiée dans l’espace ∆u1. Le

résultat du tableau 2.3 montre donc que la FEP est relativement stable.

Table 2.3 – Les premières 9 valeurs propres λα

α λα Part d’inertie expliquée λα/I0 (%) Part d’inertie cumulée expliquée (%)

1 464.42 95.76 95.76 2 7.36 1.52 97.27 3 3.58 0.74 98.01 4 1.66 0.34 98.35 5 0.81 0.17 98.52 6 0.75 0.16 98.68 7 0.57 0.12 98.79 8 0.49 0.10 98.89 9 0.37 0.08 98.97

La contribution des pixels à l’inertie totale expliquée (équation 2.5) est tracée sur la Figure 2.16. On constate que les pixels centraux contribuent le plus, ainsi que certains

0 10 20 30 40 50 First 50 eigenmodes 0.01 0.10 1.00 10.00

Part of inertia explained by the mode, in %

Figure 2.15 – Part d’inertie

expli-quée par les 50 premiers modes

Figure 2.16 Contribution des

pixels à l’inertie totale

pixels localisés sur le troisième anneau d’Airy.

J’ai enfin reproduit sur la Figure 2.17 pour α [1,2,3,4] et la Figure 2.18 pour α

[5,6,7,8] chaque facteur principal (à gauche), la contribution des pixels à cet axe et la

qualité de représentation des pixels par cet axe.

1. Le premier facteur principal est très proche de la carte des contributions de la Fi-gure 2.16. Cela n’est pas surprenant, puisque le premier mode explique déjà 96% des données. Il est intéressant de noter que des tavelures brillantes sont présentes dans le troisième anneau d’Airy, correspondant à ce qu’on appelle en anglais les "pinned

speckles", évoqués en section 1.5.1 et détaillés parAime & Soummer(2004) etPerrin

et al. (2003). La carte des contributions montre que les pixels ayant contribué à la création de cet axe sont les pixels du deuxième anneau d’Airy et ceux correspondant aux tavelures brillantes du troisième anneau. Ils ont également une bonne qualité de représentation (image de droite) donc on peut légitimement interpréter cet axe comme l’axe qui explique les tavelures quasi-statiques des premiers anneaux d’Airy. Deux ta-velures en particulier sont particulièrement brillantes de part et d’autre de l’étoile. Elle sont donc présentes sur la majorité des images. On constate que certains pixels répartis sur un anneau ont une mauvaise qualité de représentation. Nous verrons qu’il sont en fait expliqués par des modes d’ordre plus élevés.

2. Le second facteur principal est axisymétrique avec des pixels ayant des fortes valeurs sur le côté gauche de la FEP et des faibles valeurs sur le côté droit (en gardant à l’esprit que les donées ont été centrées, donc des valeurs fortes/faibles se traduisent sur les facteurs principaux par des valeurs positives/négatives). Certains pixels du second anneau d’Airy contribuent au second mode, ainsi que d’autres plus éloignés coincidant avec des tavelures brillantes.

3. Le troisième facteur principal est également un mode asymétrique, mais selon une direction perpendiculaire à la direction privilégiée du deuxième facteur principal. Cela vient de la contrainte d’orthogonalité des vecteurs principaux.

2.2. Le développement d’une technique avancée de soustraction basée sur l’analyse en composantes principales

Figure 2.17 – Facteur principal (image de gauche), contribution (image du milieu) et qualité

de représentation (image de droite) relatifs aux quatre premiers modes (α∈[1,2,3,4]). La région

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1

0.0000 0.0033 0.0066 0.0099 0.0131 0.0165 0.0197 0.0230 0.0263 0.0296 0.0329

0.00000 0.00100 0.00199 0.00300 0.00400 0.00500 0.00600 0.00700 0.00801 0.00900 0.01000

0.00000 0.00100 0.00199 0.00300 0.00400 0.00500 0.00600 0.00700 0.00801 0.00900 0.01000

Figure 2.18 – Même représentation que la Figure 2.17 pour les quatre modes principaux

2.2. Le développement d’une technique avancée de soustraction basée sur l’analyse en composantes principales

Eléments supplémentaires pour l’aide à l’interprétation En plus des données

utili-sées pour construire la nouvelle base de Karhunen-Loève, il est courant dans les analyses en composantes principales de considérer des éléments supplémentaires (attributs ou in-dividus supplémentaires) qui ne participent pas à la création des axes principaux mais sont utilisés pour l’interprétation.

Attributs supplémentaires. Des attributs supplémentaires sont dans l’approche

considérée des images supplémentaires, dont on peut calculer par exemple la qualité de représentation par rapport aux différentes composantes principales pour étudier si ces différentes images sont bien expliquées par les modes. On peut par exemple utiliser une image du motif de diffraction de la pupille, ou de tavelures statiques bien iden-tifiées afin d’observer quelle est la ou les composante(s) principale(s) qui contiennent ces structures. En pratique, je n’ai pas fait un usage important de cette fonction-nalité, puisque l’observation des composantes principales permet déjà un diagnostic suffisant pour comprendre quels sont les facteurs qui entraînent la création d’un axe en particulier.

Les attributs supplémentaires peuvent également être des images obtenues sur une autre étoile, mais que nous pensons pouvoir expliquer à partir des facteurs principaux. Cela est développé en détail dans la section suivante, sous le terme la soustraction de référence.

Individus supplémentaires. Dans l’approche considérée ici, les individus sont les

pixels d’une image, dont la séquence temporelle représente un élément de RK. Des

individus supplémentaires sont donc d’autres éléments de RK (pas nécessairement

des pixels) que l’on peut projeter sur la base de Karhunen-Loève pour déterminer la qualité de représentation selon chaque composante principale pour analyser quel(s) mode(s) peut ou peuvent expliquer cet individu. En pratique, deux variables tempo-relles facilement accessibles sont l’angle horaire et l’angle parallactique. J’ai analysé la qualité de représentation de chacun d’eux par les 50 premiers axes principaux (Figure 2.19). On ne distingue pas de comportements particuliers, si ce n’est une dispersion répartie selon les différents modes, indiquant qu’aucun mode en particulier n’est plus corrélé à l’angle horaire ou à l’angle parallactique. Une piste d’étude intéressante est d’utiliser comme individus supplémentaires des variables décrivant les conditions at-mosphériques comme le seeing, temps de cohérence ou vitesse de vent, ainsi que des indicateurs du niveau de performance de l’instrument comme le rapport de rapport de Strehl. Cela permettra d’analyser si certains modes en particulier sont liés à des conditions particulières. Utiliser ici des paramètres internes de l’instrument, en parti-culier de l’optique adaptative représente une perspective très intéressante et constitue un premier pas dans l’utilisation d’indicateurs externes pour optimiser la réduction des données. Cela sera particulièrement pertinent dans le cas de SPHERE pour lequel les informations du système d’OA sont accessibles par télémétrie.