C AHIERS DU B URO
G ILBERT S APORTA
Méthodes exploratoires d’analyse de données temporelles
Cahiers du Bureau universitaire de recherche opérationnelle.
Série Recherche, tome 37-38 (1981), p. 7-194
< http://www.numdam.org/item?id=BURO_1981__37-38__7_0 >
© Institut Henri Poincaré — Institut de statistique de l’université de Paris, 1981, tous droits réservés.
L’accès aux archives de la revue « Cahiers du Bureau universitaire de re- cherche opérationnelle. Série Recherche » implique l’accord avec les condi- tions générales d’utilisation ( http://www.numdam.org/conditions ). Toute utili- sation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
INTRODUCTION
L'étude statistique de données évoluant dans le temps repose classiquement sur 1 a p p l i c a t i o n de la théorie des processus stochastiques et suppose pour cela que les phénomènes étudiés v é r i f i e n t des hypothèses assez c o n t r a i g n a n t e s , telles la stationnarité ou 1 a p p a r t e n a n c e à une classe générale de processus (Markov ou A r i m a par e x e m p l e ) . Les problèmes p r i n c i p a u x sont alors essentiellement des problèmes d'estimation q uTi l sTa g i s s e des paramètres du m o d è l e ou de la d i s t r i - bution s p e c t r a l e .
S1i l est p a r f a i t e m e n t légitime dans une large gamme d'applications (en sciences physiques n o t a m m e n t ) , il faut reconnaître que dans bien d'autres situ- a t i o n s , le recours à des m o d è l e s n'est que la contrepartie n é c e s s a i r e du m a n q u e de données : ainsi les chroniques économiques sont pour la p l u p a r t des r é a l i s a - tions uniques par n a t u r e , de processus n o n r é p é t a b l e s . Si on v e u t estimer par exemple leur fonction d ' a u t o c o r r é l a t i o n , force est bien de les supposer s t a t i o n - naires et mêmes e r g o d i q u e s , fût-ce au prix de transformation des données de d é - p a r t . De p l u s , de nombreuses techniques ont été conçues e s s e n t i e l l e m e n t pour des séries c h r o n o l o g i q u e s , c'est-à-dire pour des observations effectuées sur un ensemble dénombrable d'instants é q u i d i s t a n t s .
O r , depuis quelques a n n é e s , on commence à disposer de m a n i è r e e x p l o i t a b l e , grâce au d é v e l o p p e m e n t des capacités de stockage i n f o r m a t i q u e , de données d'un type n o u v e a u : des séries individuelles t e m p o r e l l e s , c'est-à-dire des " t a b l e a u x "
à trois indices contenant les valeurs x^(ca) de p variables (j = l,2, . . . ,p) aux temps t (t v a r i a n t de 0 à T) pour n individus = l , 2 , , . , n ) .
D i s p o s a n t d'un grand n o m b r e d'individus il devient alors p o s s i b l e d'effec- tuer de v é r i t a b l e s analyses statistiques sans être obligé de recourir à des modèles préétablis : on reconnaît ici la démarche exploratoire (au sens de J.W.
TUKEY [ 6 4 ] ) de l'analyse des données ; cependant il convient d'adapter les m é - thodes existantes et de développer de nouveaux outils pour tenir compte du c a - ractère évolutif des tableaux é t u d i é s . En o u t r e , il d e v i e n t fréquent que les v a r i a b l e s soient repérées en continu et n o n plus à certaines dates f i x e s , que ce soit en raison du caractère p o n c t u e l du processus (naissance, changement
dfé t a t m a t r i m o n i a l par exemple) ou de la m é t h o d e de m e s u r e (courbes de t e m p é - rature, en m é t é o r o l o g i e ) , Il faut donc pouvoir traiter une infinité n o n dénom- b r a b l e de v a r i a b l e s ce qui implique dfu t i l i s e r les résultats de l'analyse f o n c -
tionnelle et de la théorie des p r o c e s s u s .
Si la d é c o m p o s i t i o n de K A R H U N E N - L O E V E , base de l'analyse factorielle des processus date des années 1945-1947 [42] [ 4 3 ] , l'étude par l'analyse des don- nées ou des techniques p r o c h e s , de l'évolution de données individuelles est
cependant a s s e z récente et encore p e u r é p a n d u e .
En F r a n c e , les premiers travaux d a t e n t , nous s e m b l e - t - i l , de 1970 avec la thèse d'Y. E S C O U F I E R [23] qui abordait le p r o b l è m e de façon originale au m o y e n d'opérateurs associés à u n processus ; leur lien avec l'analyse des données fut effectué plus tard par J.M. BRAUN [10] et J.P. PAGES [51] . C'est l'article de J.C. D E V I L L E [17] en 1974 qui m a r q u e à n o t r e avis le d é b u t v é r i t a b l e de
l'application, dans une optique d'analyse de d o n n é e s , de la d é c o m p o s i t i o n de K A R H U N E N - L O E V E d'un p r o c e s s u s , Sous le nom d'analyse h a r m o n i q u e qualitative cette m é t h o d e fut étendue par J,C, D E V I L L E et nous-même [20] aux p r o c e s s u s qualitatifs en 1979. E n t r e temps M. M A S S O N [43] puis J. D A U X O I S et A. POUSSE [16] d é v e l o p p a i e n t la théorie abstraite de l'analyse factorielle des fonctions aléatoires en dépassant le cadre linéaire des m é t h o d e s u s u e l l e s . Ces travaux furent suivis sur le plan théorique par ceux de BESSE [7] , R O M A I N [56] , BOUMAZA [8] , et dans le domaine appliqué par M A Z E R O L L E [46] et OBLED [50] .
C o n c e r n a n t les séries chronologiques m u l t i p l e s , il faut citer les travaux de M , TENENHAUS [62] et J.M. BOUROCHE [9] ainsi que ceux de T. F O U C A R T [27] et E . STEMMELEN [61] sur les évolutions de tableaux de contingence (mais il s'a- git là de données agrégées et n o n i n d i v i d u e l l e s ) ,
Il est n o t o i r e que l'orientation des diverses écoles anglo-saxonnes est fort d i f f é r e n t e . Bien que les relations entre l'analyse spectrale et la d i a g o - n a l i s a t i o n de l'opérateur d'autocorrélation soient bien connues dans le cas discret et f i g u r e n t dans les m a n u e l s consacrés aux séries c h r o n o l o g i q u e s , tel celui de F U L L E R [ 2 8 ] , la d é c o m p o s i t i o n de K A R H U N E N - L O E V E apparaît plus comme une p r o p r i é t é m a t h é m a t i q u e que comme base d'une m é t h o d e s t a t i s t i q u e , m ê m e pour les s p é c i a l i s t e s de la théorie du signal comme PAPOULIS [53] . Il faut attendre
1979 pour en v o i r p u b l i é e une application dans une revue anglo-saxonne (te sta- tistique [3] , encore est-ce dans le cas d'une réalisation unique d'un p r o c e s - sus stationnaire et dans le b u t de proposer aux p r a t i c i e n s une m é t h o d e plus rapide à comprendre que l'analyse s p e c t r a l e . . .
L'utilisation des techniques m u l t i d i m e n s i o n n e l l e s a cependant été d é v e - loppée dans les remarquables travaux de BRILLINGER [11] (régression, analyse en composantes p r i n c i p a l e s , analyse canonique) m a i s transposée dans le d o m a i - ne spectral pour l'étude de filtres invariants pour des processus stationnaires
Les rares travaux concernant des trajectoires individuelles sont p l u t ô t le fait des économètres et relèvent d'une approche m o d é l i s a n t e , on en trouve une bonne synthèse dans le colloque organisé par l'INSEE en 1977 [69] .
Notre travail répond à un double b u t : dresser une synthèse des apports de l'analyse des données dans le domaine des données individuelles temporelles étudiées sur un intervalle de temps fini [0,T] ; proposer et étudier des m é t h o - des nouvelles pour des problèmes n o n encore résolus comme l^étude de processus q u a l i t a t i f s .
Nous espérons ainsi m o n t r e r en particulier la fécondité des m é t h o d e s d'ana lyse factorielle dans le domaine t e m p o r e l , en n e p r é t e n d a n t n u l l e m e n t établir cependant une quelconque supériorité sur les m é t h o d e s classiques pour les r a i - sons s u i v a n t e s . D'abord les données que n o u s voulons traiter ne sont pas les m ê m e s , elles sont à certains égards plus riches p u i s q u ' o n dispose de n trajec-
toires au lieu dTu n e ; en contrepartie elles sont évidemment plus difficiles à o b t e n i r . Et surtout les objectifs n e sont pas les mêmes du moins en ce qui concerne les analyses d e s c r i p t i v e s . En schématisant très f o r t e m e n t , on peut dire en effet qu'à l'inverse des m é t h o d e s de la statistique i n f é r e n t i e l l e , où
l'on s'intéresse p l u t ô t aux v a r i a b l e s et à leurs interrelations (les individus forment alors u n corpus h o m o g è n e d'objets anonymes et interchangeables puisqu'- issus d'un é c h a n t i l l o n n a g e a l é a t o i r e ) , l'analyse des données est orientée prin- cipalement vers les individus et la m i s e en évidence de facteurs d ' h é t é r o g é n é i - té d'une p o p u l a t i o n . Nous traduisons cela en d i s a n t b r i è v e m e n t que l'analyse des données est souvent e s s e n t i e l l e m e n t typologique.
Ainsi le p r o b l è m e ne sera pas tant de découvrir des p é r i o d i c i t é s comme le fait l'analyse s p e c t r a l e , que de trouver les traits dominants de d i f f é - r e n c i a t i o n des évolutions des i n d i v i d u s . Les m é t h o d e s factorielles f o u r n i s - sent a l o r s , selon des variables indépendantes du t e m p s , des p o s i t i o n n e m e n t s m u l t i d i m e r s i o n n e l s des i n d i v i d u s , représentables par des cartes où lfo n v i s u a -
lisera les proximités ou les oppositions entre individus selon qu'ils ont eu des évolutions similaires ou d i v e r g e n t e s . C e p e n d a n t lorsque le p r o c e s s u s é t u - dié p e u t être considéré comme stationnaire les résultats de l'analyse facto- rielle seront équivalents à ceux de l'analyse s p e c t r a l e .
L'étude des liaisons entre v a r i a b l e s fait certes p a r t i e des objectifs de l'analyse des d o n n é e s , avec des m é t h o d e s telles que l'analyse canonique ou l'analyse factorielle des corrélations p a r t i e l l e s , et r e j o i n t en cela les objectifs des techniques classiques d'analyse de p r o c e s s u s , mais il est clair qu'une étude p r é a l a b l e des h é t é r o g é n é i t é s éventuelles est indispensable pour p o u v o i r interpréter les liaisons t r o u v é e s , surtout si on u t i l i s e des m é t h o d e s
linéaires : on connaît la sensibilité des indicateurs de corrélation l i n é a i - res à la n o n - h o m o g é n é i t é des d o n n é e s .
E n f i n lorsqu'on v e u t prévoir le c o m p o r t e m e n t futur d'un p h é n o m è n e , les m o d è l e s p r o b a b i l i s t e s nous semblent indispensables et les techniques d'analy- se de liaison et d'ajustements linéaires déduites de l'analyse des données sont alors insuffisantes bien q u ' i n d i s p e n s a b l e s en première a p p r o c h e .
Bien que les m é t h o d e s de classification constituent une part importante des m é t h o d e s exploratoires d'analyse des d o n n é e s , nous ne les abordons pas dans n o t r e t r a v a i l , nous limitant aux m é t h o d e s factorielles et l i n é a i r e s . La raison en est que la d i m e n s i o n temporelle des p h é n o m è n e s ne nous a pas paru susceptible d'apporter des éléments n o u v e a u x : classer des trajectoires ne sou- lève pas de p r o b l è m e p a r t i c u l i e r dès lors qu'on u t i l i s e une m é t r i q u e adaptée et renvoie à 1'utilisation des mêmes algorithmes que dans le cas n o n - t e m p o r e l .
Vonmatl&mz adopte.
S'agissant dru n travail d'analyse des d o n n é e s , le lecteur p o u r r a être sur- p r i s de n o u s voir u t i l i s e r le v o c a b u l a i r e du calcul des p r o b a b i l i t é s et des p r o -
cessus stochastiques et de n e trouver que des exemples d'école et n o n des dorir nées r é e l l e s . Il convient donc de nous en expliquer : si nous avons choisi de
parler de " p r o c e s s u s1 1 et de " p r o b a b i l i t é s " là où certains n e pourraient v o i r que " c o u r b e s " et ''fréquences", c'est que ce langage nous a semblé le plus sim- ple à u t i l i s e r et le m i e u x adapté au cas d'une infinité n o n dénombrable de v a - r i a b l e s . Il reste cependant que n o u s avons toujours eu à l'esprit le fait que 0, r e p r é s e n t e une p o p u l a t i o n d'individus et u n processus un ensemble de t r a j e c - toires i n d i v i d u e l l e s .
Q u a n t aux exemples t h é o r i q u e s , leur traitement nous a semblé intéressant tout d'abord pour les d é v e l o p p e m e n t s m a t h é m a t i q u e s auxquels il conduisent et p a r c e qu'ils m o n t r e n t que l'on peut résoudre jusqu'au b o u t les équations obte- n u e s . Mais surtout leur p r i n c i p a l intérêt est à notre sens le suivant : on ne p e u t bien comprendre une m é t h o d e d'analyse des données et l'appliquer v a l a b l e - m e n t que si l'on a établi des règles d'interprétation des résultats sur des données p a r f a i t e m e n t connues : les processus s t a n d a r d s , comme le processus de P o i s s o n par e x e m p l e , c o n s t i t u e n t alors d'excellents jeux d ' e s s a i .
Notre travail est donc théorique m a i s nous n e l'avons pas v o u l u abstrait : c'est ainsi que n o u s n'avons pas recherché s y s t é m a t i q u e m e n t les énoncés les plus généraux p o s s i b l e s ni les h y p o t h è s e s m a t h é m a t i q u e s m i n i m a l e s . Non seule- m e n t cela correspond à n o t r e conception p e r s o n n e l l e de la recherche en s t a t i s -
tique qui doit fournir des m é t h o d e s orientées vers les a p p l i c a t i o n s , m a i s e n c o - re à la réalité des phénomènes abordés : ainsi traiter d'abord des processus scalaires puis des processus v e c t o r i e l s p e u t paraître r e d o n d a n t puisque les premiers sont des cas p a r t i c u l i e r s des seconds ; en fait il n'en est rien car en changeant de d i m e n s i o n l e phénomène change de nature et les techniques sont d i f f é r e n t e s . D e m ê m e , il a u r a i t été p o s s i b l e d'étudier des fonctions aléatoires g é n é r a l e s , l'indice t a p p a r t e n a n t alors à un ensemble n o n ordonné q u e l c o n q u e : on y aurait gagné en extensions et p e u t - ê t r e en applications m a i s le support concret fourni par le temps a u r a i t été p e r d u . Nous nous sommes également a t t a - ché à donner p a r t o u t ou cela é t a i t p o s s i b l e des formules explicites pour les calculs ce qui p e r m e t de faire le lien avec les notations usuelles de l'analyse des d o n n é e s .
D'un p o i n t de v u e terminologique nous u t i l i s e r o n s ici le v o c a b l e '^d'analyse f a c t o r i e l l e " sous le sens large qui p r é v a u t actuellement en F r a n c e , et qui r e - couvre diverses m é t h o d e s linéaires comme l'analyse en composantes p r i n c i p a l e s , l'analyse des c o r r e s p o n d a n c e s , e t c . , et n o n dans l'acception limitée du m o d è l e des facteurs communs et s p é c i f i q u e s . Il s'agit certes d'un abus de langage :
l'analyse factorielle au sens strict étant conceptuellement d i f f é r e n t e de l'analyse en composantes p r i n c i p a l e s .
De m ê m e le nom d'"analyse h a r m o n i q u e " introduit par J.C. D E V I L L E pour désigner des analyses en composantes p r i n c i p a l e s de processus p e u t prêter à confusion avec la théorie m a t h é m a t i q u e du m ê m e nom (à laquelle elle se rat- tache il est v r a i ) : c e p e n d a n t l'usage en étant m a i n t e n a n t b i e n établi en a n a - lyse des données c h r o n o l o g i q u e s , nous n o u s y conformons é g a l e m e n t .
Rétamé du tAavall
Les trois p r e m i e r s chapitres sont consacrés à des g é n é r a l i s a t i o n s de l'a- n a l y s e factorielle à trois types de p r o c e s s u s .
Le chapitre I traite des processus s c a l a i r e s , c'est-à-dire du cas où on observe sur une population l'évolution d'une v a r i a b l e aléatoire réelle au cours du temps. Il s'agit essentiellement d'un chapitre de s y n t h è s e . Après des r a p - pels c o n c e r n a n t la d é c o m p o s i t i o n de K A R H U N E N - L O E V E d'un processus ( Xt) observé sur un intervalle de temps fini [0,T] on examine les rapports de cette dernière avec l'analyse spectrale des processus s t a t i o n n a i r e s . On m o n t r e que les deux analyses sont identiques p o u r des processus spécifiques étudiés sur un i n t e r v a l - le de temps fini et q u?e l l e s c o ï n c i d e n t , m o y e n n a n t une g é n é r a l i s a t i o n de l'ana- lyse en composantes p r i n c i p a l e s , lorsque la période d'étude est étendue à IR tout e n t i e r . L'intérêt de considérer des processus stationnaires en analyse des données n o u s p a r a î t lié au p r o b l è m e suivant souvent posé par des praticiens : ayant effectué l'analyse factorielle d'un processus jusqu'à une date T peut-on extrapoler jusqu'à T+h et que se p a s s e - t - i l si h tend vers l'infini ? Ce pro- b l è m e n'a de sens à n o t r e avis que si le comportement du processus n'est pas susceptible de v a r i e r f o n d a m e n t a l e m e n t après T , sinon il est évident que les facteurs de l'analyse v o n t c h a n g e r . Il doit donc exister une certaine permanen- ce de la structure de d é p e n d a n c e entre les ce qui conduit assez n a t u r e l l e m e n t à des h y p o t h è s e s de s t a t i o n n a r i t é .
L e cas où fi est fini est l:o c c a s i o n de préciser les notions de dualité entre l'A.C.P. du p r o c e s s u s (X ) dont on connaît n réalisations et celle de la chronique n - d i m e n s i o n n e l i e constituée des n trajectoires.
Un des concepts f o n d a m e n t a u x en analyse des données est celui de m é t r i q u e
associée à un ensemble de v a r i a b l e s , qui p e r m e t de définir une distance entre i n d i v i d u s . L e s contributions originales dans ce chapitre concernent principa- lement lTe x t e n s i o n de la n o t i o n de m é t r i q u e à des processus afin de comparer des t r a j e c t o i r e s . Nous proposons une formulation générale permettant de trai- ter les divers cas de m é t r i q u e s applicables à des processus (dont les m é t r i - ques de Sobolev en p a r t i c u l i e r ) ; le fait de s'écarter du cas élémentaire d'une m é t r i q u e d é f i n i e par un homéomorphisme de LZ( T ) (traité par J. DAUXOIS et A. POUSSE [ 1 6 ] ) introduit des problèmes spécifiques de l'analyse fonction- nelle car les opérateurs associés ne sont pas forcément b o r n é s . On étudie ensuite plus s p é c i a l e m e n t la m é t r i q u e D j/a2 , conduisant à un processus ré- d u i t , en m o n t r a n t sur un exemple son intérêt pour des processus à variance croissante : cette m é t r i q u e permet d'éliminer dans une certaine m e s u r e la p r e - m i è r e composante triviale liée à la c h r o n o l o g i e . Le traitement m a t h é m a t i q u e des p r o c e s s u s à accroissements indépendants fait alors intervenir certaines propriétés des fonctions de B e s s e l .
Le chapitre s'achève par une partie consacrée à la m i s e en oeuvre de la m é t h o d e sur des données concrètes et étudie p a r t i c u l i è r e m e n t les problèmes posés par 1:a p p r o x i m a t i o n et l'interpolation. On y reprend certains travaux récents effectués par P. BESSE [7] .
Les processus v e c t o r i e l s sont étudiés au chapitre I I . La donnée d'un processus m - d i m e n s i o n n e l № ^ ) étant la g é n é r a l i s a t i o n du cas de l'analyse s i m u l - tanée de plusieurs tableaux de d o n n é e s , nous rappelons b r i è v e m e n t les résultats que nous avions établis a n t é r i e u r e m e n t concernant l'analyse canonique g é n é r a l i - sée. L ' e x t e n s i o n , n o u v e l l e , au cas d'une infinité n o n dénombrable de vecteurs aléatoires est effectuée sous le nom d'analyse ''harmonique'' v e c t o r i e l l e pour reprendre un terme introduit par J.C. D E V I L L E bien que n o t r e m é t h o d e en diffè- re par l'introduction d'une m é t r i q u e "glissante' d é c o r r é l a n t à tout instant les composantes de .
L'introduction de cette m é t r i q u e est indispensable pour assurer la c o h é - rence de l'analyse , :harmonique': v e c t o r i e l l e avec l'analyse canonique g é n é r a l i - sée et l'analyse des processus qualitatifs conçue comme analyse des indica- trices des é t a t s .
Cette m é t r i q u e de plus rend l'analyse invariante par changement de b a s e , pour des processus à valeurs dans un espace vectoriel V . Contrairement à
1'analyse d'un processus s c a l a i r e , on n e trouve pas de liens directs avec l'analyse spectrale des processus s t a t i o n n a i r e s , le type de d é c o m p o s i t i o n en v a r i a b l e s scalaires (coordonnées d'individus) et facteurs v e c t o r i e l s de n o t r e analyse étant d i f f é r e n t de celui de la représentation de Cramer des processus v e c t o r i e l s . Bien que l'analyse " h a r m o n i q u e " v e c t o r i e l l e soit la m é t h o d e , à notre a v i s , la plus intéressante pour l'étude des trajectoires individuelles il existe cinq autres p o s s i b i l i t é s d'analyse factorielle de tableaux à 3 indices que nous étudions s y s t é m a t i q u e m e n t et dont une p r é s e n t e un intérêt indéniable pour l'étude des v a r i a t i o n s des dépendances entre composantes de (X^_) : il s'agit d'une extension d'une m é t h o d e proposée par M . T E N E N H A U S [6]
pour les chroniques m u l t i d i m e n s i o n n e l l e s .
Chaque m é t h o d e est alors caractérisée par des propriétés d'optimalité : que ce soit celles d e v e c t e u r s aléatoires obtenus par combinaisons dans le
temps du type Y = / X f(t) dt ou de processus scalaires obtenus par combinaison linéaire des composantes de (X ) du type £ = < X ; f(t) > ou
. t
5t = < Xt ; a > .
Enfin on p r o p o s e deux m é t h o d e s , . p l u s g l o b a l e s , fondées sur l'utilisation des opérateurs introduits par Y . E S C O U F I E R , l'une p e r m e t t a n t de comparer les m processus scalaires associés aux m composantes de (X ) , l'autre étudiant la chronologie d u processus en associant à chaque instant u n opérateur ce qui revient à étudier un processus à valeurs o p é r a t e u r s .
Le chapitre III développe et complète sur de n o m b r e u x points la m é t h o - de d'analyse des processus qualitatifs que nous avions p r o p o s é avec J.C.
D E V I L L E [20] sous le nom d'analyse h a r m o n i q u e q u a l i t a t i v e . Cette m é t h o d e b a s é e sur l'introduction d'un opérateur caractéristique d*un p r o c e s s u s qualitatif analogue à un opérateur de c o v a r i a n c e , mais en plus c o m p l e x e , a p p a r a î t comme une extension de l'analyse des correspondances m u l t i p l e s à un continuum de v a r i a b l e s qualitatives et comme une a p p l i c a t i o n de l'analyse h a r m o n i q u e v e c t o - rielle au processus des indicatrices des é t a t s . On m o n t r e comment on p a s s e de l'obtention de processus scalaires propres transformant p a r codage le processus qualitatif (X^) en un processus n u m é r i q u e (X^) optimal en u n certain s e n s , à celle des " g é n é r a t r i c e s " ou composantes p r i n c i p a l e s p e r m e t t a n t le p o s i t i o n n e - m e n t des individus dans les plans f a c t o r i e l s , puis à celle des codages propres ou f a c t e u r s . Nous donnons ensuite des p r o p r i é t é s spécifiques des p r o c e s s u s à deux états en t r a i t a n t , à titre d ' e x e m p l e , un processus simple avec changement
d'état irréversible u n i f o r m é m e n t réparti dans le temps. Le traitement n u m é r i - que est e n s u i t e abordé avec n o t a m m e n t une n o u v e l l e d é m o n s t r a t i o n de la m é t h o d e d'approximation p r o p o s é e en [20] .
Un p r o c e s s u s qualitatif étant un cas p a r t i c u l i e r d'un processus v e c t o - riel nous reprenons les cinq autres analyses p o s s i b l e s des tableaux cubiques pour aboutir à une conclusion opposée à celle dû cas v e c t o r i e l : ici seule une a n a l y s e m a r g i n a l e , celle des temps passés dans chaque état entre [ 0 et T] pré- sente un intérêt certain alors qu'elle en était dénuée pour les processus v e c t o - riels tandis que celle retenue pour les processus vectoriels aboutit à des r é - sultats triviaux. Ces diverses analyses sont illustrées par l'exemple du pro- cessus à deux états déjà utilisé .
Ici une seule analyse g l o b a l e , par o p é r a t e u r s , à un sens : c'est celle du o
processus dont les éléments E sont les opérateurs d'espérance conditionnelle
à x
t.
E n f i n on p r o p o s e et on justifie des m é t h o d e s pour le p r o b l è m e , n o n encore t r a i t é , des p r o c e s s u s qualitatifs m u l t i p l e s où l'on observe p variables q u a l i - tatives au cours du t e m p s . Une de ces m é t h o d e s est l'extension de l'analyse har- m o n i q u e q u a l i t a t i v e et revient à une double analyse canonique généralisée : une à chaque instant sur les variables ( X * , X ^ , . . . , X ^ ) , l'autre sur le processus v e c - toriel des composantes issues de la p r e m i è r e .
Les trois types d'analyse " h a r m o n i q u e " étudiés dans ces trois chapitres forment un ensemble dont la cohérence a p p a r a î t , en p a r t i c u l i e r , dans le tableau suivant donnant les critères d'optimalité des composantes principales associées à chaque type de p r o c e s s u s , où r, R, r\ d é s i g n e n t r e s p e c t i v e m e n t le coefficient de corrélation s i m p l e , le c o e f f i c i e n t de corrélation m u l t i p l e , et le r a p p o r t de c o r r é l a t i o n .
A n a l y s e " H a r m o n i q u e " A n a l y s e " H a r m o n i q u e " A n a l y s e " H a r m o n i q u e1 1
scalaire r é d u i t e v e c t o r i e l l e qualitative
(x
t> ex
t) ( y
m a x / r (z;X ) dt m a x / R (z;X ) dt m a x / T? (z;X ) dt
z ^ 0 z
"0
zJQ
Notre travail n'aurait pas été complet sans une étude des liaisons p o u v a n t exister entre un processus et diverses variables ou entre deux p r o c e s s u s . Il s'agit donc au sens large de ce qu'on p e u t appeler des p r o b l è m e s de régression où un p r o c e s s u s p e u t être soit prédicteur soit p r é d i c t a n d . Le chapitre IV concerne donc des généralisations de la régression m u l t i p l e , de l'analyse c a n o - n i q u e , de l'A.C.P. sur covariances p a r t i e l l e s , e t c .
Le p a s s a g e à la d i m e n s i o n infinie pose alors des problèmes d'une n a t u r e d i f f é r e n t e de ceux rencontrés jusqu'alors en analyse f a c t o r i e l l e . En e f f e t , si
2 les facteurs de l'A.C.P. d'un processus (X ) étaient des fonctions f(t) de L (T)
t
r
Tet les composantes principales des v a r i a b l e s de la forme / X f(t) dt il n'en est pas de m ê m e pour les coefficients de régression et la p r o j e c t i o n Y d'une v a r i a b l e Y sur un processus (X ) : ce n'est q u ' e x c e p t i o n n e l l e m e n t que Y
pT 0 t
se m e t sous la forme / X P (t) dt .
Le p r e m i e r p a r a g r a p h e rappelle donc ces aspects spécifiques de la r é g r e s - sion d^une v a r i a b l e sur un processus et en tire les conséquences pour les a p p l i - cations n u m é r i q u e s . On y p r o p o s e é g a l e m e n t diverses m é t h o d e s de r é g r e s s i o n n o n - linéaire conduisant à des solutions c a l c u l a b l e s . L'ensemble des techniques de r é s o l u t i o n n u m é r i q u e repose sur la d é c o m p o s i t i o n préalable de (X^) en composan- tes principales et facteurs p r i n c i p a u x .
On étudie ensuite le cas où la v a r i a b l e à expliquer est v e c t o r i e l l e . C'est l'occasion de définir la p r o c é d u r e p e r m e t t a n t de réaliser l'analyse c a n o - nique d'un processus (X^) et d'un vecteur aléatoire à m dimensions Y
On étend également à un processus la m é t h o d e d'A.C.P. sur v a r i a b l e s i n s - trumentales p r o p o s é e par C.R. RAO [55] ainsi que l'analyse factorielle discri- m i n a n t e .
D i v e r s e s m é t h o d e s pour analyser le p r o b l è m e i n v e r s e , celui de l'influence d'une ou plusieurs v a r i a b l e s aléatoires sur le d é r o u l e m e n t d'un p r o c e s s u s , sont d é v e l o p p é e s . E n t r e autres on insiste sur la technique d'A.C.P. d'un processus
(Xj_) c o n d i t i o n n e l l e m e n t à une v a r i a b l e en r e p r e n a n t l'exemple des processus à accroissements indépendants où on élimine ainsi l'effet dans la v a l e u r finale X^.
L'étude simultanée de d e u x processus ( Xt) et (Yf c) m a r q u e à n o t r e avis les limites de l'analyse des données car les m é t h o d e s déduites de l'analyse canoni-
q u e , outre les difficultés m a t h é m a t i q u e s inhérentes à la dimension i n f i n i e , ne p e r m e t t e n t pas une p r é v i s i o n causale au sens de la théorie du signal et ne sont v a l a b l e s q u:a p o s t e r i o r i . Le p r o b l è m e semble plus relever de techni- ques de filtrage p r o b a b i l i s t e s avec introduction de m o d è l e s .
A j o u t o n s pour terminer que de nombreuses remarques ne concernent pas s e u l e m e n t les données temporelles mais sont également valables pour l'analyse des données en g é n é r a l .
CHAPITRE I
ANALYSE FACTORIELLE D'UN PROCESSUS SCALAIRE
Ce chapitre est consacré à la g é n é r a l i s a t i o n de l'analyse en composantes principales à une famille infinie de v a r i a b l e s aléatoires réelles où t v a r i e dans u n intervalle b o r n é de IR noté [ 0,T] ou simplement T. Le b u t est de traiter des données du type suivant : évolution d'un ensemble d'individus au cours du
temps décrits par une v a r i a b l e X . Ce problème étant f o n d a m e n t a l pour la s u i t e , il n o u s a paru utile de rassembler et de p r é s e n t e r d'abord de m a n i è r e s y n t h é - tique un certain n o m b r e de résultats classiques concernant la d é c o m p o s i t i o n de K a r h u n e n - L o e v e d'un processus et ses l i e n s , moins c o n n u s , avec l'analyse spec-
trale. O u t r e quelques remarques concernant le cas d'une p o p u l a t i o n f i n i e , les développements originaux concernent p r i n c i p a l e m e n t l'usage de m é t r i q u e s q u e l - conques et sont regroupés dans le deuxième p a r a g r a p h e : on y étudie en p a r t i - culier l'influence de la réduction des données dans l'analyse de processus à accroissements i n d é p e n d a n t s . E n f i n le troisième p a r a g r a p h e où sont exposés les problèmes de m i s e en oeuvre constitue une synthèse de travaux récents c o n c e r - n a n t l'approximation et l'interpolation et renferme des c o n s i d é r a t i o n s d'ordre p r a t i q u e .
I- A N A L Y S E EN COMPOSANTES P R I N C I P A L E S D'UN PROCESSUS
1-1 Hypothèses et n o t a t i o n s
L e m o d è l e m a t h é m a t i q u e est le suivant : étant donné un espace p r o b a b i l i s é (fi,a,P) et un intervalle fini [0,T] de IR m u n i de la m e s u r e de L e b e s g u e dt , on se donne une f o n c t i o n m e s u r a b l e de T x fi dans |R n o t é e :
(t,üi) -> X(t,o)) .
2
On suppose que la classe de cette f o n c t i o n appartient à L (T x fi). Par la s u i t e , p o u r éviter des difficultés non essentielles de langage on identifiera
une telle fonction avec sa classe d ' é q u i v a l e n c e . Ceci entraîne que X(t,.}
2
noté encore (X^) d é f i n i t une application de T dans L (Q) c'est-à-dire un processus du second ordre : p o u r toutt>xt est une v a r i a b l e ayant une e s p é - rance m ( t ) et une v a r i a n c e o2( t ) f i n i e s . De m ê m e X(.,œ) définit une a p p l i c a -
2 .
tion de Q dans L (T) , ce qui v e u t dire que pour tout u) , sa trajectoire notée Xt(u)) est de carré i n t e g r a b l e . On supposera désormais le processus (X^) c e n -
tré c'est-à-dire m ( t ) = 0 p o u r tout t .
O n a alors les résultats suivants ([16] [23] par e x e m p l e ) .
Soit U le processus linéaire défini par (X ) , c'est-à-dire l'application 2 2 *"
de L (T) dans L (Q) d é f i n i e par : T
U ( f ) = Y =
f
X f (t) dt .«^0 z
U est alors un opérateur de H i l b e r t - S c h m i d t c'est-à-dire que pour toute 2
base orthogonale (f^) de L (T) z | | U ( f ^ ) | |2 est fini et est indépendant de la
b a s e . 1
* 2 2 Il en est de m ê m e de son adjoint U opérateur de L (fi) dans L (T) défini par : U*(Y) = E ( ( Xt) Y ) = f .
2
L'opérateur de covariance du processus est l'opérateur de L (T) dans lui- m ê m e défini par :
(f | C g ) - E[ (f |(xt)(g|(»t))] = E [ U ( f ) U ( g ) ] v f ,geL 2( T )
où (| ) désigne le produit scalaire de L ^ ( T ) .
C'est l'opérateur inégral de n o y a u C ( t , s ) = E ( X X ) c'est-à-dire que T
f Cf = g • g ( t ) =
f
E ( X X ) f (s) ds .J 0
O n m o n t r e alors que C = U* o U ce qui p r o u v e que C qui est positif et autoadjoint est é g a l e m e n t n u c l é a i r e comme p r o d u i t d'opérateurs de H i l b e r t - S c h m i d t .
2
P o u r toute base orthogonale (f^) de L (T) on a donc :
I (f. |C f.) = Trace C = f C ( t , t ) dt < « .
i 1 1 ^ 0
L'opérateur W = U 0 U* de L^(fi) dans lui-même obtenu en composant ü et
U dans 1 autre sens est é g a l e m e n t n u c l é a i r e et on trouve sans d i f f i c u l t é que
W ( Y ) = y Xt E ( Xt Y) dt . 0
C e t opérateur a été introduit par Y . E S C O U F I E R .
En identifiant les espaces à leurs d u a u x , c'est-à-dire en u t i l i s a n t les 2 2
produits scalaires usuels de L (T) et L (Q) on a le schéma de dualité suivant :
*
2 U 2
LZ( T ) < l/(fi)
i u
c wu
iL2( T ) > L2(fi) U
R e m a r q u e : R i e n n e change si on remplace l'intervalle [ 0,T] m u n i de la m e s u r e dt par u n espace m e s u r a b l e q u e l c o n q u e T m u n i d'une m e s u r e p o s i t i v e f i n i e . Le cas où T est un ensemble fini correspond à la situation de l'analyse des don- nées u s u e l l e s . En p a r t i c u l i e r p o u r une p o p u l a t i o n finie de n individus l'opé- rateur U se confond avec le tableau de données individus - caractères considé- ré comme une m a t r i c e à n lignes et U* avec la transposée de cette m a t r i c e .
I.2 D é c o m p o s i t i o n orthogonale d'un processus
Cherchons une r e p r é s e n t a t i o n du processus (X ) sous forme d'une somme de
00
processus q u a s i - d é t e r m i n i s t e s du type X = L £ f (t) où les sont des
t k=, k k k
variables aléatoires indépendantes du temps et les f, des fonctions certaines 2
du t e m p s . Si on impose aux f^ de former une b a s e orthonormale de L (T) on obtient a i s é m e n t les £ en m u l t i p l i a n t la formule précédente par f^(t) et en intégrant sur t :
T T
X
xt
fk
( t ) d t- X i
h f*
(t) f k ( t ) d t =i
h & k s i = 5k = u(fk)et on m o n t r e alors la convergence en m o y e n n e quadratique de I £^ ^ ^ ^t) vers X^_ pour p r e s q u e tout t .
- 2 1 -
Les v a r i a b l e s aléatoires £ ^ n'ont aucune raison d'être orthogonales c'est-à-dire n o n corrélées ce qui semble une p r o p r i é t é souhaitable s t a t i s t i - q u e m e n t , pour un choix arbitraire des f ; en p a r t i c u l i e r le développement
* - A -o - ç / J _ \ • 2 k ï ï t _ 2 k ï ï t en serie de F o u r i e r obtenu en p r e n a n t pour f^(t) sin — - — et cos — - — ne
donne des £ ^non
córreles
que dans certains cas p a r t i c u l i e r s . Le r é s u l t a t fondamental est alors le suivant :P r o p o s i t i o n 1.1 (Décomposition de K a r h u n e n - L o è v e )
00
Pour que Xt = E m , cl# ou ^es ^ f °rment un système k=l
orthonormal de L (T) et les un système orthogonal de L 2 2 .. (Q) , il faut que les f^ soient les fonctions propres de l'opérateur de c o v a -
riance C du p r o c e s s u s et les || les valeurs propres c o r r e s p o n - dantes .
En effet on a E(X Ç ) - Z E ( Çk C¿) f ^ t ) = f (t) || Ç ^ 2
k
T T et E ( Xt C¿) =E ( X t y Xs f£(s) ds) =
f
E<
Xt Xs} f£
(s) ds'
L'opérateur C é t a n t a u t o a d j o i n t positif et n u c l é a i r e , donc c o m p a c t , son analyse spectrale est p o s s i b l e sans recourir à l'intégrale hilbertienne et il existe bien un système o r t h o n o r m a l dénombrable de fonctions propres f^ associées à des v a l e u r s propres ^ p o s i t i v e s . Si toutes les valeurs p r o - pres sont simples il n'existe donc qu'un seul système orthonormé de fonctions f (définies au signe près) et de v a r i a b l e s aléatoires non corrélées tel
k. K
oo
que X = I £ » est c^a^T clu e siune valeur propre est m u l t i - t k=] k k
pie on p e u t p r e n d r e n'importe quelle base orthonormée du sous-espace propre e n g e n d r é ) .
Les f^ sont les facteurs p r i n c i p a u x de (X^) (appelés harmoniques par J.C. D E V I L L E ) et les ^-e s composantes p r i n c i p a l e s . On a également le :
Théorème de M e r c e r
Si X^_ est continu en m o y e n n e q u a d r a t i q u e
£ ^ k ^ ^ ^ k ^S^ converge u n i f o r m é m e n t v e r s C(t,s) . k
et on sait que [23] :
P r o p o s i t i o n 1.2
Les sont fonctions propres de 1 o p é r a t e u r W de v a l e u r propre Ak .
Si on n u m é r o t e les et ^es ^ décroissants on sait é g a l e m e n t que :
P r o p o s i t i o n 1.3 l
Le p r o c e s s u s £ £> ^ ( O est ^a m e i l l e u r e a p p r o x i m a t i o n en k=l k
m o y e n n e quadratique de (X^) par une somme de £ p r o c e s s u s quasi-déter- ministes .
P r o p o s i t i o n 1.4 X Les extrema de E ( £2) pour £ de la forme / X f(t) dt , avec f
2 ^ t
a p p a r t e n a n t à la b o u l e unité de L (T) , v a l e n t et sont réalisés pour les composantes principales •
O n retrouve ici la d é f i n i t i o n dTH O T T E L I N G des composantes p r i n c i p a l e s en tant que combinaisons linéaires des X ^ de v a r i a n c e m a x i m a l e .
Comme la covariance entre £ et X v a u t E(Ç X ) = A f, (t) on en déduit de m ê m e que les r é a l i s e n t les extrema de / (cov(^;X ) )2 dt ,
K J O T
L e coefficient de corrélation linéaire entre X et E. v a u t t
fk(t)
r ( £ , ; X ) = ce qui p e r m e t 1 i n t e r p r é t a t i o n des composantes princi-
k t a(t)
pales «
1.3 Rapports avec l'analyse spectrale des p r o c e s s u s stationnaires
Considérons un p r o c e s s u s stationnaire au sens large c'est-à-dire que : m ( t ) = m et C(t;s) = < p ( | t - s | ) d'où a2( t ) = a2 ,
Four simplifier nous supposerons m = 0 . Notre propos est de m o n t r e r que dans ce cas lra n a l y s e factorielle fournit une d é c o m p o s i t i o n équivalente à celle de 1Ja n a l y s e s p e c t r a l e . A v a n t d'aborder le cas le plus important sur le plan t h é o r i q u e , c'est-à-dire celui d'un processus défini sur la droite r é e l l e , nous examinerons au p r é a l a b l e le cas où le processus n'a été obser- vé q u e sur un intervalle f i n i . Enfin nous rappellerons les r a p p o r t s , dans le cas où T e s t un ensemble d i s c r e t , entre l'analyse en composantes principales usuelle et lra n a l y s e s p e c t r a l e .
1 . 3 «a) P r o c e s s u s observé sur [ 0,T]
Notons tout d'abord q u e si (X^) n'a été observé que sur un intervalle b o r n é on n e p e u t définir stricto sensu l'analyse spectrale de (X^) car celle- ci suppose que t p a r c o u r t ¡R e n t i e r . Pour l'analyse en composantes p r i n c i p a l e s , le problème est en q u e l q u e sorte inverse : celle-ci n e présente pas de diffi- culté sur [0,T] tandis que sa g é n é r a l i s a t i o n à la droite réelle soulève des problèmes t h é o r i q u e s .
On dira que (X^) est p s e u d o - s t a t i o n n a i r e si sa fonction de covariance C(t;s) est égale à <¿>(t-s) où \p est u n e fonction paire définie sur [-T,T] .
On p e u t toujours décomposer (X^) en une somme de processus harmoniques élémentaires du type : A ^ eos t + sin aj^ t , les forment alors u n ensemble d é n o m b r a b l e .
Notons ici une ambiguïté qui semble p e u explicitée dans la littérature : il existe en fait deux adaptations possibles de l'analyse spectrale selon que l'on u t i l i s e la d é c o m p o s i t i o n de Fourier de ( Xt) ou celle de sa fonction de c o v a r i a n c e . O n a en effet d'une part la d é c o m p o s i t i o n en série de Fourier de
(X^) sur [0,T] sous la forme :
°° / A 2knt „ . 2kïït .
Xt " , \ ( \ C0S T + kSin T k=0
où les v a r i a b l e s A, et B, n e forment pas en général u n système orthogonal de 2 k k
L (fi) : elles sont c o r r é l é e s .
Par contre on obtient des v a r i a b l e s n o n corrélées en utilisant la dé- composition de F o u r i e r de la f o n c t i o n de covariance sur [-T,T] : comme celle-
ci est p a i r e on n ' u t i l i s e que les cosinus et l'intervalle étant de largeur 2T on trouve
n/.- \ v 2 , k l l( t - s ) v C ( t ; s ) = I c£ cos( )= -)
k R 1
T T avec °t = \ J COS dx et Q0 = ï «/ C ^ dX
0 ' 0 , v v 00 /r k n t . kïït
d'où X = £ (£, cos + nv sin - — )
t k= Q k 1 k 1
et les £ ^et les ^ sont des v a r i a b l e s aléatoires n o n corrélées de v a r i a n c e a£ (cf. [65] p . 4 1 2 ) .
n A i k n t _ . kïït . , i C e p e n d a n t les cos et sin n e f o r m e n t pas un s y s t è m e o r t h o g o n a l
2 2
de L (T) m a i s de L ( 2 T ). Il n e p e u t y avoir identité entre ces deux d é c o m p o - sitions que dans le cas d'un p r o c e s s u s de p é r i o d e T en m o y e n n e q u a d r a t i q u e c'est-à-dire tel que C ( t ; s + T ) = C ( t ; s ) car dans la p r e m i è r e d é c o m p o s i t i o n tous les termes impairs d o i v e n t être n u l s .
L'ambiguïté est alors levée : le processus étant défini sur le tore l'ensemble des t a une s t r u c t u r e de groupe abelien localement c o m p a c t ce qui est la condition d'existence de l'analyse s p e c t r a l e .
Dans ces conditions pour u n p r o c e s s u s de p é r i o d e T on a :
~ p 2 k n t ^ . 2 k n t ,
Xt = J ^ k C° S — + \ S i n — } *
L e s fonctions du temps et les v a r i a b l e s aléatoires f o r m e n t alors deux s y s t è - 2 2
mes o r t h o g o n a u x de L (T) et L (fi) r e s p e c t i v e m e n t et sont donc les facteurs p r i n c i p a u x et les composantes p r i n c i p a l e s de (X^) .
O n en déduit la
P r o p o s i t i o n 1.5
Il n'y a identité entre la d é c o m p o s i t i o n de F o u r i e r de (X^) et la d é c o m p o s i t i o n de K a r h u n e n - L o è v e que si et s e u l e m e n t si ( Xt) est p é r i o - dique de p é r i o d e T en m o y e n n e q u a d r a t i q u e .
f(t) = 1 est alors fonction p r o p r e de C associé à la v a l e u r p r o p r e . Xn = / C ( x ) dx . Les fonctions trigonométriques cos et
L J 0 T
siñ pour k=l,2,...,°° sont é g a l e m e n t fonctions propres associées aux v a l e u r s doubles X. = / T C ( x ) cos dx .
k x
La d é m o n s t r a t i o n élémentaire de la deuxième partie de cette proposition figure p a r exemple dans [35] P. 73 .
Notons que dans la p r o p o s i t i o n p r é c é d e n t e les X sont numérotées non pas par importance d é c r o i s s a n t e m a i s selon les fréquences croissantes des fon- tions t r i g o n o m é t r i q u e s .
Pour un processus stationnaire n o n p é r i o d i q u e l'A.C.P. f o u r n i r a d e s " r é - sultats différents des d e u x analyses "spectrales'1. Quels en sont les avantages respectifs ? Les analyses " s p e c t r a l e s " f o u r n i s s e n t des décompositions simples à calculer selon des fonctions trigonométriques mais laquelle choisir ? Tar ailleurs le choix des sinus et cosinus est aussi arbitraire que celui d'une autre famille de fonctions si le p r o c e s s u s n'est pas p é r i o d i q u e . De son côté l'analyse f a c t o r i e l l e n é c e s s i t e la r é d u c t i o n de l'opérateur de c o v a r i a n c e , ce qui n'est pas toujours a i s é , m a i s f o u r n i t rappelons-le encore l'unique décompo- sition en fonctions orthogonales du temps et v a r i a b l e s n o n corrélées ce qui nous semble une p r o p r i é t é a g r é a b l e .
1.3.b) E x t e n s i o n _ à _ l a _ d r o i t e _ r e e l l e
Nous allons v o i r que si on étend à R l'intervalle d'étude du p r o c e s s u s , l'analyse en composantes principales de (X ) , m o y e n n a n t u n e g é n é r a l i s a t i o n , se confond avec l'analyse spectrale de (X^) . Nous supposerons pour simplifier que est continu en m o y e n n e q u a d r a t i q u e et que sa fonction de covariance C(t-s) est a b s o l u m e n t s o m m a b l e . O n sait qu'il existe alors une densité s p e c t r a - le s(œ) qui est une fonction b o r n é e et continue définie par la relation :
8(u) =
~èr J
c ( x ) e l u x dxet que le p r o c e s s u s (X ) a d m e t la r e p r é s e n t a t i o n de Cramer :
Xt = f+" ei ( J J t dZ(to) U — OO
où Z(o)) e s t un processus complexe à accroissements orthogonaux (processus s p e c t r a l ) .
(Note : nous u t i l i s o n s , pour simplifier les é c r i t u r e s , la n o t a t i o n complexe m a i s (X^) é t a n t r é e l , il est b i e n e n t e n d u que la d é c o m p o s i t i o n de Cramer en sinus et cosinus est r é e l l e ) .
L'analyse en composantes principales c o n s i s t e r a i t , en g é n é r a l i s a n t les résultats des paragraphes p r é c é d e n t s , à rechercher les solutions de l'équa- tion :
J C(t-s) f(s) ds = À f ( t ) .
M o n t r o n s que l'opérateur C de n o y a u C ( t - s ) est b o r n é .
r
oo (C*f)(t) J(t) dtX
+ o o C ( t - s ) f(s) ds . Les transformées de F o u r i e r de C, f et g é t a n t 211s , <¿> et \f/ le théorème de P l a n c h e r e l donne :(Cf|g) = / s(w)
<¿>( oú )
i//(œ) du .d
_ o os (oj) étant b o r n é il v i e n t :
r
+œ(Cf |g) < kj
J
^(o)) JM do)et d'après l'inégalité de C a u c h y - S c h a w a r z :
( C f | I ) < k J | * | | ||*|| .
Comme || <¿>|| = /211 || f || on a :
(Cf|g) < C II f II . Il g II donc C est b o r n é .
Cependant le n o y a u C ( t - s ) ne d é f i n i t pas une fonction de carré i n t e g r a - b l e sur (R x (R et par c o n s é q u e n t C n'est pas de H i l b e r t - S c h m i d t .
On p o u r r a i t u t i l i s e r l'analyse spectrale des opérateurs n o r m a u x bornés des espaces de H u b e r t , c e p e n d a n t il est plus utile d'employer l'analyse spec- trale de G e l f a n d - V i l e n k i n [30] p o u r les opérateurs n o n b o r n é s (mais v a l a b l e aussi pour les b o r n é s ) car on a b e s o i n de considérer des fonctions propres
comme e ^ * " qui n ' a p p a r t i e n n e n t pas à L^(|R) .
O n a en effet la
P r o p o s i t i o n 1-6
Les fonctions exponentielles imaginaire e1 U ) t sont fonctions propres généralisées de C associées aux v a l e u r s propres À =211 s (o)) .
0)
En effet on v é r i f i e que :
/ nf. s 1U)S ,
f
n,
v 103 (t-x)/ C(t-s) e ds = / C(x) e dx
= e / C ( x ) e dx = e 211 s
(co) .
U — 00
L a transformée de F o u r i e r inverse de la densité spectrale exprime donc la covariance à l'aide de la densité spectrale :
/
+ 00
s(o)) e do)
et on v é r i f i e de m ê m e que la d é c o m p o s i t i o n de K a r h u n e n - L o è v e , désormais sous forme i n t é g r a l e , s'identifie à la r e p r é s e n t a t i o n de C r a m e r .
Les problèmes de convergence des analyses sur u n intervalle [-T/2,T/2]
lorsque T tend vers l'infini ont été résolus p a r GRENANDER et SZEGO [29] qui ont m o n t r é la c o n v e r g e n c e des solutions de l'équation :
A T / 2
/ C ( t - s ) f(s) ds = A f ( t )
vers les fonctions trigonométriques el a ) t .
Ils ont aussi donné les résultats suivants concernant la r é p a r t i t i o n des v a l e u r s propres de l'équation p r é c é d e n t e .
Cette d e r n i è r e admet une infinité dénombrable de v a l e u r s propres car C est compact et il n'existe q u ' u n n o m b r e fini de v a l e u r s propres X telles que a < X < b où [a,b] e s t u n i n t e r v a l l e n e contenant pas l'origine. L o r s q u e T "
tend vers l'infini ce n o m b r e tend lui-même v e r s l'infini cependant le rapport
n o m b r e de À G [ a,b ] . , i • • «. n - n j
- - tend v e r s u n e limite p r o p o r t i o n n e l l e a la m e s u r e de
L e b e s g u e de l'ensemble des u) tels que ^ s (to) < ] . Quant à la plus
grande v a l e u r p r o p r e , elle converge vers ^ SUP s(w) •
On peut a l o r s , théoriquement du m o i n s , définir la r é p a r t i t i o n des v a l e u r s propres qui est u n e m e s u r e absolument continue par rapport à la m e s u r e de Le- b e s g u e . Cette m e s u r e que nous noterons u(X) p e r m e t de donner u n sens à la som- m e des valeurs propres puisque l'on a :
r
+0°
/ s(io) duo = C ( 0 ) =
a
2 et que X =21\s (10)
—oo
d'où
J
daj=J
X du (A) = a2 .L a d é c o m p o s i t i o n de la v a r i a n c e a2 de selon les composantes principa- les est donc identique à la d é c o m p o s i t i o n spectrale ; on p e u t alors définir la p a r t de v a r i a n c e expliquée par un intervalle [ X ^ À ^ ] •
M a l h e u r e u s e m e n t du(X) est très difficile à obtenir e x p l i c i t e m e n t des tAue la densité s p e c t r a l e , où p l u t ô t sa r e s t r i c t i o n aux w positifs n'est pas bijec- tive car à une v a l e u r p r o p r e X c o r r e s p o n d e n t plusieurs v a l e u r s de co :
.X = 2ÏÏ s(u>)
/ i i i » \ / i
1 1 1 1 1V
y i i
- ; i :i « » I ! ! i
Les résultats p r é c é d e n t s g é n é r a l i s e n t des propriétés connues pour les séries c h r o n o l o g i q u e s . Soit en effet un processus à temps discret (X^) où t ^ 21 . La r e s t r i c t i o n à un e n s e m b l e fini de T instants de sa f o n c t i o n de c o - v a r i a n c e est r e p r é s e n t a b l e par la m a t r i c e T x T suivante :
/ C ( 0 ) C(l) ... C(T-l) \
c J C(l) C(0) • C(T~2)
\ C ( T - l ) . . . C(0) J
qui est une m a t r i c e de T o e p l i t z s y m é t r i q u e . On m o n t r e alors (voir [11] [ 2 9 ] ) que les vecteurs propres de C s o n t , si T est g r a n d , a p p r o x i m a t i v e m e n t égaux
- 2 9 -
aux sinus et cosinus discrets et les valeurs propres de C approximativement 2îTk
égales à 211 fois la v a l e u r de la d e n s i t é spectrale aux points — — • Plus p r é c i s é m e n t soient u ^ et v ^ les v e c t e u r s dont les composantes sont respecti-
, / T 2 ï ï j k . / T . 2 n j k - n i m 1 • ~ -,
v e m e n t y — cos — ^ — et y — sin — p o u r j = 0,1,...,T— 1 ; soit Q la matrice dont les v e c t e u r s colonnes sont u„ et les u, et v, pour k = 1, 2 , . . . ,m (on
t — 0 — k — k
suppose ici T = 2m+1) alors Q C Q 2IÏD où D est la m a t r i c e diagonale d:é l é ~ m 0 0
2JIk
ments d. = s ( 0 ) , d = d = s (——) où s est la densité spectrale de (X ) . k k+1
1. 3 . c) E x e m p l e _ j__le procès sus _de_Markov
- a It-s
I
Soit un processus d o n t la fonction d'autocorrélation est C(t,s) = e 1 '.
On sait qu'une telle f o n c t i o n caractérise les processus de Markov s ta- tionnaires ( [ 2 2 ] p . 2 3 4 ) . P r o l o n g é sur ] - œ5+ o o [ ce processus admet une densité spectrale égale à . Son analyse en composantes principales sur [C,T]
n ( a2+ u )2)
r e v i e n t à résoudre l'équation :
X f (t) = f e "0 1^ "5! f (s) ds .
Le traitement est c l a s s i q u e [ 5 3 ] et se ramène après deux dérivations à 1 é q u a - tion d i f f é r e n t i e l l e :
f"(t) = [ a2 - ] f (t)
et en p o s a n t a2 - = _ùj2 (o n m o n t r e que cette quantité est toujours négati^
2a
v e ) soit X = , on trouve que les seules valeurs possibles pour w sont a2
+ ùo
2les racines positives co. , œ0, ... de l'équation tg œ T = ^a a )
i l
2 2Les fonctions propres n o r m a l i s é e s sont alors :
f
k
( t ) =V ï ^ s i n ( .
k( t - f )) .
C e p e n d a n t ici les X^_ sont des valeurs propres s i m p l e s .
Examinons r a p i d e m e n t les résultats n u m é r i q u e s obtenus dans des cas s i m p l e s . p i e s .
Tout d'abord prenons T = II et a = 1 . Les racines oj sont les abscisses 2x
positives des points d'intersection de y = tg II x avec y = — • = — x - 1
1 ! H i
\ \ \ J | / w! = 0 - 6 3 8 3 X = 1 . 4 2 45%
/ ' ' / ' ^2 = K 3 95 8 X
2
= 0 , 6 7 8 22%/ 1 j l\\ " > 4 ^ _ / u = 2 . 2 6 4 7 X3 = 0 . 3 2 6 10%
/ L} y j |q)2 / \ J& ^ y f o ) ^ o>4 = 3 . 1 9 3 2 X4 = 0 . 1 7 9 6%
\ j ; /'i 1 | / 2 j / 3 * u>5 = 4 . 1 5 0 5 X5 = 0 . 1 10 3 , 5 %
Les p o u r c e n t a g e s de v a r i a n c e expliquée sont faibles car a est relative- m e n t grand et les variables et -Xg sont rapidement n o n corrélées dès que
|t-s| est grand.
A v e c un coefficient a plus faible correspondant à une plus forte dépen- dance on trouve b i e n sûr des composantes de plus grande v a r i a n c e .
A u s s i avec a = 0.1 on trouve :
a>1 = 0 . 2 4 5 9 A = 2 . 8 4 90%
cû2 = 1 . 0 5 9 9 X2 = C , 18 6%
w3 = 2 . 0 3 1 3 X3 = 0 . 0 5 2%
a), = 3 . 0 2 1 1 A, = 0 . 0 2 1% . 4 4
L o r s q u e T augmente les U K se r e s s e r r e n t et d e v i e n n e n t de plus en plus denses ce qui traduit i n t u i t i v e m e n t les résultats énoncés au p a r a g r a p h e p r é - d é d e n t ,
P o u r T = 0 0 on trouve alors que les solutions de l'équation ;
f e- a | t - s | f(g) dg = x f(t) J
0
- 3 1 -
sont f(t) = o) eos o) t + a sin 03 t , soit À u n facteur près :
et +
f ( t ) = cos(ü)t-<¿?) avec tg <¿> = — p o u r tout UJ £ ÍR . Les "valeurs propres1*
0 )
2a
associées sont À = et sont toutes s i m p l e s .
U) 2 • 2
az+ o jz
C'est s e u l e m e n t si l'on fait l'analyse factorielle sur ]--oo^+oo [ que l'on retrouve e x a c t e m e n t la d é c o m p o s i t i o n spectrale : les v a l e u r s propres sont alors doubles car elles correspondent aux deux v a l e u r s opposées + w et sont alors associées aux e o s w t et s i n w t »
2
L'ensemble des valeurs propres est alors compris entre 0 et —
1.4 Cas d'une p o p u l a t i o n finie
1.4.a) Généralités
Si Q est un ensemble à n éléments muni de la mesure de probabilité u n i f o r - m e , on est dans le cas statistique u s u e l où on a observé n t r a j e c t o i r e s . On supposera la m o y e n n e d'ensemble n u l l e :
i
nm ( t ) = -
L
x. (t) = 0 V t .n i-1 1
La fonction de covariance C ( t , s ) est alors :
1 n
C(t,s) = - I x.(t) x.(s) . n . . 1 1
1 = 1
Le n o y a u de C étant une somme de produits de fonctions de t et de s est. d é g é n é - ré et C est de rang fini ce qui entraîne l'existence de l'analyse en composantes principales de (X^) sans h y p o t h è s e s de régularité sur le p r o c e s s u s .
L'opérateur d'Escoufier W est alors r e p r é s e n t a b l e par une m a t r i c e carrée n x n , p u i s q u e (Q) est isomorphe à [Rn , de terme général :
T
0
On p e u t alors obtenir d i r e c t e m e n t les composantes principales qui sont des vecteurs ^ à n composantes comme vecteurs propres de W et retrouver e n s u i t e , du
m o i n s en t h é o r i e , les facteurs p r i n c i p a u x comme combinaisons linéaires des t r a j e c t o i r e s . En effet l'équation :
f C ( t , s ) f(s) ds = X f(t)
s'écrit :
X f(t) = / - E x. (t) x. (s) f(s) ds = - E x. (t) f x. (s) f(s) ds
Jo
n i=i 1 n i=i 1JQ
1soi t
1 n
X f (t) = — E x. (t) c. , n . . 1 1
1 = 1
Les coefficients c. s'obtiennent en r é s o l v a n t le système de Cramer obtenu i
en m u l t i p l i a n t par xj (t) ^es deux membres de la relation p r é c é d e n t e et en inté- grant sur t :
f
X x.(t) f(t) dt =C -
E x. (t) x.(t) c. dtJ
0 J "J
Q n .=1 1 J 1r
1 isoit A(.Ç). = E ( / - x . (t) x.(t) dt) c. = (Wc) .
- J i=1
J
0 n i j i - jd'où C = £ r é s u l t a t classique en analyse des d o n n é e s .
La m é t h o d e p r é c é d e n t e n'est autre en fait que la traduction en termes statistiques de la m é t h o d e classique de r é s o l u t i o n des équations de E r e d h o l m à n o y a u x dégénérés ([35] p . 5 4 ) .
Bien s û r , si n est très g r a n d , cette m é t h o d e est impraticable m ê m e en sup- p o s a n t effectuée l'évaluation n u m é r i q u e des intégrales p e r m e t t a n t le calcul de
. On cherchera p l u t ô t à discrétiser le temps afin d'approximer l'opérateur C par une m a t r i c e de taille p faible (voir p a r a g r a p h e I I I ) .
1.4.b) Analyse_de_pÍ!£sieurs_courbes_ :_dualite_et_centrage
Si on dispose d'un ensemble de n courbes x^(t) avec i = l,2,...,n et t £ [0,T] d o n n a n t par e x e m p l e l'évolution des températures dans n stations ou celle des p r i x de n produits deux conceptions sont possibles pour effectuer une a n a l y s e factorielle : soit chaque courbe est u n e trajectoire d'un p r o c e s - sus et on se trouve dans le cadre de l'analyse en composantes p r i n c i p a l e s d:u n
processus echanti11oné ; soit on considère qu'on a une observation de n v a r i a - bles au cours du temps c'est-à-dire une série chronologique m u l t i p l e . Ce p o i n t de v u e est justifié si les courbes r e p r é s e n t e n t des évolutions de caractères d i f f é r e n t s . On est alors conduit à une A . C . P . sur n v a r i a b l e s , la p o p u l a t i o n étant l'ensemble des i n s t a n t s .
Ces deux types d'analyse ne sont pas conceptuellement identiques : la p r e m i è r e cherche des facteurs de d i f f é r e n c i a t i o n entre courbes en fonction de
l'évolution qu'elles traduisent c'est donc une analyse des distances entre c o u r b e s , tandis que la deuxième A . C . P . repose p l u t ô t sur les corrélations et
2 est donc une étude des angles entre fonctions x^(t) de L ( T ) .
Il y a évidemment ^ d u a l i t é " entre les deux types d'analyse qui sont d'ail- leurs identiques si on ne centre pas les données et si on u t i l i s e la m é t r i q u e I dans les deux cas ainsi que le m o n t r e le tableau s u i v a n t .
Courbes " i n d i v i d u s " Courbes ''variables'*
^ ^ ^ ^ ^ analyse " h a r m o n i q u e " A . C . P . C opérateur intégral de V m a t r i c e n x n de terme
F o n c t i o n de n o y a u général covariance
i
ni r
1C(t,s) = - E x . ( t ) x . ( s ) v . . = - / x.(t)x.(t)dt
ni = l 1 1 J T
J
0 1 JU m a t r i c e n x n de terme W opérateur intégral de général* n o y a u Opérateur ^>T i n
d'Escoufier - / x.(t)x.(t)dt - £ x. (t)x. (s)
N J
0
1 J i=l 1 1• U = - V W = ^ C
n 1
Aux coefficients T et n près l'opérateur d'Escoufier d'une analyse est 1;o p é - rateur de covariance de l'autre et les facteurs p r i n c i p a u x d'une analyse sont les composantes principales de l'autre.
Bien entendu dès qu'on centre les données (et a fortiori avec des m é t r i - ques différentes de I) il n'y a plus i d e n t i t é .
a) Centrage " h a r m o n i q u e "
A tout instant t les n observations d o i v e n t être de m o y e n n e n u l l e ce qui signifie qu'on étudie en réalité les n courbes :
1 n
x.(t) 1 x.(t) = x.(t) - m ( t ) ce qui revient d'une certaine façon à
i ni=1 j i
éliminer la tendance.
L'opérateur de covariance centré a alors pour n o y a u :
1 n
C(t,s) = - l (x.(t) - m ( t ) ) ( x . ( s ) - m ( s ) ) n . , i i
1 = 1
et l'opérateur d'Escoufier est la m a t r i c e W de terme g é n é r a l :
w. . = - f (x. (t) - m ( t ) ) ( x . ( t ) - m ( t ) ) dt .
i j
n J0i
jb) C e n t r a g e A . C . P .
Les courbes étant considérées comme des variables on retire à chacune sa
i r
Tvaleur m o y e n n e sur la période c'est-à-dire m. = — / x.(t) dt .
1 JO 1
La m a t r i c e de covariance V a alors pour terme général :
v. . = / (x. (t) - m. ) (x . (t) - m . ) dt .
Il est clair que cette opération n'élimine pas en général la tendance et que dans b i e n des cas on trouvera un premier facteur trivial lié à la c h r o n o - logie si les courbes v a r i e n t de m a n i è r e s e m b l a b l e .
Les deux types de centrage n e seront équivalents que si les m o y e n n e s tem- p o r e l l e s sont égales aux m o y e n n e s d'ensemble ce qui est le cas si on a observé n trajectoires d'un p r o c e s s u s stationnaire et e r g o d i q u e .