• Aucun résultat trouvé

Nous reprenons la mˆeme approche de classement par famille, mais cette fois pour r´eduire le nombre d’hypoth`eses nous travaillons non pas sur les param`etres stellaires mais sur ce qu’en per¸coit Corot c’est-`a-dire les masques optimaux d´ e-coulant des PSF sur le CCD. Nous ne cherchons plus `a remonter aux param`etres stellaires.

6.4.1 Pertinence de la r´eduction :

Avant toute chose, commen¸cons par v´erifier qu’une r´eduction est bien envisageable. Pour cela, nous nous assurerons que les ´etoiles tol`erent d’autres masque que leur propre masque optimal. J’ai ainsi calcul´e le S/B sur 1 000 ´etoiles d’un ´echantillon t´emoin, lorsqu’on applique `a chacune les 999 masques optimis´es des autres ´etoiles. Le r´esultat est pr´esent´e sous forme de matrice figure 6.2. La dominance de stries verticales (`a ´etoile constante) indique une pr´ e-servation de l’ordre de grandeur duS/Bce qui l´egitime les tentatives de r´eduction.

Le long de cette description, nous expliciterons en gras les notions not´ees en italiques dans la premi`ere m´ethode. Afin de pouvoir comparer les diff´erentes

6.4 M´ethode 2 : Param´etrisation a posteriori 71

Fig. 6.2 – Dans cette matrice 1 000 × 1 000, le point qij repr´esente leS/Bde l’´etoile j (colonnes) `a laquelle on applique le masque de l’´etoile i (lignes). Un pixel clair indique un fortS/B. La dominance de stries verticales montre que la perte reste limit´ee en cas de masque d´esadapt´e. Des lignes sombres horizontales pointent les masques trop sp´ecialis´es qui ne s’adaptent pas `a d’autres ´etoiles. La diagonale qiicontient les masques optimis´es. Elle n’apparaˆıt pas assez contrast´ee dans cette repr´esentation non-logarithmique. En effet la variation de S/Bpour une ´etoile est faible devant les variations entre ´etoiles.

m´ethodes nous garderons le mˆeme ´echantillon d’´etoiles que celui que nous venons d’utiliser.

6.4.2 Dimension sous-jacente

Un masque est symbolis´e par un vecteur −→m dont les coordonn´ees sont binaires (cf. Fig.6.3) Il poss`ede une coordonn´ee par pixel, obtenue en mettant bout `a bout les lignes des imagettes de travail 37 × 16. Une coordonn´ee ´egale `a 1 signifie que le pixel de l’imagette est couvert par le masque. Initialement, −→m poss`ede n = 592 coordonn´ees dans cette base, dite canonique.

On suppose que les patrons utilisent les mˆemes pixels que les masques op-timaux ce qui nous conduit `a travailler dans le sous-ensemble E engendr´e par ces derniers. La vraie dimension de E est certainement inf´erieure `a n. Pour la connaˆıtre on extrait la plus grande famille libre en r´eduisant la matrice 592 × 1 000 form´ee des vecteurs colonne −m

suf-72 R´eduction Optimis´ee du nombre de patrons

Fig. 6.3 – Notation vectorielle des masques : la succession des lignes binaires forme un vecteur.

fisantes pour d´ecrire E . Donc plus de 492 demeurent fixes (li´es `a la taille de la trame de travail) ou varient ensemble (li´es par une cause physique sous-jacente). On effectue le changement de base pour travailler plus simplement. En contrepar-tie, le lien avec les masques est moins direct et les nouvelles coordonn´ees ne sont plus binaires mais ceci n’est pas gˆenant `a ce stade.

6.4.3 Formalisation de la m´ethode utilis´ee pr´ec´edemment

Les “param`etres physiques” a posteriori sont les combinaisons de co-ordonn´ees (i.e d’autres coordonn´ees) dont les variations exp´erimentales sont ind´ependantes les unes des autres. On identifie ces param`etres en proc´edant `a une analyse en composantes principales (PCA).

A partir de l’ensemble des mi masques, construisons la matrice de covariance intra-masque centr´ee : G = E −mi.−mit  (6.1) . Ses ´el´ements constitutifs sont les variances et covariances entre coordonn´ees :

G =       σ2 1 cov(1, 2) · · · cov(1, n0) cov(2, 1) σ2 2 ... .. . . .. ... .. . ... σ2 n0      

L’examen de G montre beaucoup de termes non nuls hors diagonale. Donc les coordonn´ees utilis´ees sont interd´ependantes. G est sym´etrique par construction mais aussi d´efinie et positive en tant que somme de carr´es. Elle est donc diago-nalisable avec des valeurs propres r´eelles et non n´egatives et des vecteurs propres qui forment une base orthogonale. Sa diagonalisation nous fournit les matrices D et P toutes deux de dimension n0 × n0 et telles que :

6.4 M´ethode 2 : Param´etrisation a posteriori 73

D est la matrice diagonale des valeurs propres λi et P est la matrice de passage vers la base des vecteurs propres n−→

V1, . . .−→ Vn0

o

. P est form´ee des n−→ Vio en colonnes, dans l’ordre des λi.

Changeons de base et travaillons dans la base des vecteurs propres. Un masque s’y ´ecrit −→m = P xi

− →

Vi. Dans cette base la nouvelle matrice de covariance est directement D. Les Vi varient ind´ependamment les uns des autres car les termes crois´es cov(xi, xj)i6=j sont tous nuls : Ce sont les param`etres physiques a posteriori recherch´es.

Les “facteurs d’influence” sont parmi ces nouveaux param`etres, ceux qui entraˆınent le plus de diversit´e dans la forme des masques, c’est-`a-dire les composantes qui varient le plus. Les autres peuvent ˆetre consid´er´es comme une constante. L’“influence” d’un facteur Vi est donc mesur´ee par sa variance λi, les facteurs d’influence sont les Vi associ´es aux plus grandes valeurs de λi. En r´eordonnant les λi on obtient la r´epartition de la figure 6.4.

Fig. 6.4 – Classement d´ecroissant des valeurs propres. Le rang de la composante Vi figure en abscisse et sa variance en ordonn´ee. La dispersion σ2i n’est importante que pour un petit nombre de param`etres. La variabilit´e totale est donn´ee par l’aire situ´ee sous la courbe.

Un petit nombre de vecteurs propres, environs 5, suffit `a exprimer la plus grande partie de variabilit´e des masques optimaux. Pour visualiser les Vi sous forme de facteurs d’influence, il faut revenir `a la base canonique par inversion des changements de bases. La figure 6.5 pr´esente un exemple de d´ecomposition.

par-74 R´eduction Optimis´ee du nombre de patrons Masque = facteur 1 + facteur 2 +. . .+ constante

Fig. 6.5 – Le masque m r´esulte de la somme des facteurs d’influence (ici non-pond´er´es), et de la constante. Les “pixels” utilis´es `a ce stade n’ont aucune raison d’ˆetre binaires, ni mˆeme positifs. Ce ne sont que des interm´ediaires de calcul dont la somme ~

m =P xiV~i, elle, doit ˆetre binaire.

tagent des caract´eristiques proches, c’est-`a-dire des coordonn´ees x1, . . . x5 voisines. Pour obtenir 250 familles, on partitionne les valeurs prises par x1 (respectivement x2, . . . ) en k1 (respectivement k2, . . . ) intervalles tels que :

k1× k2× k3× k4× k5 6 250

Chaque combinaison (k1, k2, k3, k4, k5) est une famille a posteriori. Pour d´eterminer les limites d´efinissant la famille i on examine la r´epartition des xi. La figure 6.6 en montre un exemple. Une fois les familles cloisonn´ees, les masques optimaux de chacun de leurs membres sont moyenn´es pour fournir leur patron commun.

Fig. 6.6 – Histogramme des coordonn´ees suivant un ~Vi. Les fronti`eres sont choisies dans les zones les moins peupl´ees.

Arrondi : Ramen´e dans la base canonique, un patron −→p n’a aucune chance d’ˆetre binaire, comme dans l’exemple de gauche de la figure 6.7. Il faut donc identifier le patron binaire−→