• Aucun résultat trouvé

à l’analyse de données

1.5.4 Analyse multivariée

1.5.4.1 Tests sur les matrices de covariances

Nous nous sommes également intéressés dans cette thèse à l’aspect multivarié des données. En ce qui concerne les télémesures, nous avons cherché à détecter des divergences de comportement majeures au sein d’un groupe de plusieurs télémesures. Pour cela, nous

avons choisi de nous intéresser à l’analyse de la matrice de covariance des télémesures entre elles au cours du temps. Dans ce but, nous avons identifié trois tests statistiques existants pour tester l’égalité de deux matrices de covariances. L’hypothèse à tester est donc la suivante H0 : {Γ1 = Γ2}, où Γ1 et Γ2 sont les matrices des covariances entre plusieurs télémesures, pour deux journées ou deux périodes orbitales consécutives, et estimées par les matrices de covariances empiriques ˆΓ1 et ˆΓ2.

• Le premier test, défini par Fremdt [30], consiste à projeter les deux journées de télémesures sur les vecteurs propres d’une matrice de covariance de référence, par exemple la moyenne ou barycentre des deux matrices de covariances empiriques ˆΓ1 et ˆΓ2. Les covariances de ces deux journées de télémesures ˆ∆1 et ˆ∆2 dans cette nouvelle base doivent, sous l’hypothèse nulle, s’approcher de la matrice des vecteurs propres de la matrice de référence, pour les deux périodes considérées. La statistique de test est construite à partir de la différence de ces deux matrices ( ˆ∆1− ˆ∆2). • Un test développé par Ilea [45] consiste à définir une statistique de test à partir de

la somme des logarithmes des valeurs propres de la matrice M = ˆΓ−12 Γˆ1.

• Un test développé par Cai [16] est basé sur la plus grande différence entre les éléments de la matrice ˆΓ1− ˆΓ2. Ce test est conçu pour être robuste dans des conditions sparses, c’est à dire si la matrice ˆΓ1− ˆΓ2 contient en majeure partie des valeurs nulles. • Enfin, nous avons développé, en nous inspirant des deux premiers tests, un nouveau

test statistique pour tester l’égalité des matrices de covariances. Ce test est construit à partir du logarithme du rapport entre les termes diagonaux des matrices ˆ∆1 et

ˆ

2, telles qu’elles ont été définies dans le test de Fremdt. Voir le chapitre 4 pour de plus amples informations.

Afin de déterminer le test le plus adapté à notre problématique et à nos données, nous avons comparé ces quatre tests statistiques, tout d’abord sur une simulation construite à partir de vecteurs Gaussiens, puis sur des télémesures simulées. Nous avons pu com-prendre que le test défini par Ilea ne s’appliquait pas à nos données car, la plupart du temps, les matrices de covariances sont mal conditionnées puisqu’en pratique, certaines télémesures sont presque identiques, et donc très corrélées. Les tests de Fremdt et de Cai renvoient un nombre non négligeable de fausses alarmes. De plus, le test de Fremdt est très sensible au nombre de vecteurs propres que l’on considère. Notre nouveau test, bien qu’il renvoie des résultats similaires au test de Ilea sur des vecteurs Gaussiens, semble être le plus adapté à notre problématique et à nos données. Sur un exemple de télémesures simulées, nous avons illustré la puissance de ces tests grâce à une courbe ROC, représentée Figure 1.23. Nous pouvons constater que lorsqu’on augmente le nombre de composantes principales considérées d, notre test est capable de détecter de plus en plus d’anomalies, dont anomalies locales plus difficiles à discerner. Les autres tests renvoient de nombreuses

Figure 1.23 – Comparaison des trois tests sur des télémesures simulées comportant des anomalies non liées entre elles. Le nouveau test est le plus performant.

fausses alarmes.

Sur de vraies télémesures, l’algorithme réussit à mettre en lumière les changements les plus importants dans la structure de covariance, coïncidant avec des événements connus à bord du satellite.

1.5.4.2 Tests de l’égalité des distributions entre n courbes

Lorsque les courbes que l’on considère sont générées par le même mécanisme, l’approche consistant à comparer les matrices de covariances n’est pas la seule approche possible. Dans notre cas, on s’intéresse à plusieurs réalisations du test Gain-Fréquence sur une chaine d’amplification donnée, dans plusieurs conditions de températures et de pression. On souhaite montrer que l’environnement extérieur n’impacte pas la performance de la chaîne d’amplification, et donc les courbes considérées. Pour cela, nous utilisons une gé-néralisation d’un test défini par Fromont et. al [31] pour tester l’égalité des distributions des courbes Gain-Fréquence correspondant à la même chaîne d’amplification. La loi de la statistique sous l’hypothèse nulle est estimée grâce à des permutations.

Figure 1.24 – Test Gain-Fréquence effectué dans trois environnements différents corres-pondant à la plus grande statistique de test.

Figure 1.25 – Test Gain-Fréquence effectué dans trois environnements différents corres-pondant à la plus petite statistique de test.

rejeté systématiquement. En revanche, la valeur de la statistique de test définie peut être vue comme une mesure de distance entre les courbes. Ainsi, les chaines d’amplification peuvent être classées de manière à mettre en avant celles qui ont le plus changé à tra-vers les différentes phases. Nous représentons Figures 1.24 et 1.25 les courbes issues des chaines d’amplifications correspondant à la plus grande statistique de test, ainsi qu’à la plus petite.

Cette approche permet d’aider l’ingénieur chargé de la validation du satellite à anticiper d’éventuelles détériorations du signal en fonction de l’environnement dans lequel se trouve

1.5.5 Mise en oeuvre opérationnelle des méthodes aux

Documents relatifs