• Aucun résultat trouvé

Méthodes exploratoires d'analyse de données temporelles

N/A
N/A
Protected

Academic year: 2022

Partager "Méthodes exploratoires d'analyse de données temporelles"

Copied!
189
0
0

Texte intégral

(1)

C AHIERS DU B URO

G ILBERT S APORTA

Méthodes exploratoires d’analyse de données temporelles

Cahiers du Bureau universitaire de recherche opérationnelle.

Série Recherche, tome 37-38 (1981), p. 7-194

< http://www.numdam.org/item?id=BURO_1981__37-38__7_0 >

© Institut Henri Poincaré — Institut de statistique de l’université de Paris, 1981, tous droits réservés.

L’accès aux archives de la revue « Cahiers du Bureau universitaire de re- cherche opérationnelle. Série Recherche » implique l’accord avec les condi- tions générales d’utilisation ( http://www.numdam.org/conditions ). Toute utili- sation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

INTRODUCTION

L'étude statistique de données évoluant dans le temps repose classiquement sur 1 a p p l i c a t i o n de la théorie des processus stochastiques et suppose pour cela que les phénomènes étudiés v é r i f i e n t des hypothèses assez c o n t r a i g n a n t e s , telles la stationnarité ou 1 a p p a r t e n a n c e à une classe générale de processus (Markov ou A r i m a par e x e m p l e ) . Les problèmes p r i n c i p a u x sont alors essentiellement des problèmes d'estimation q uTi l sTa g i s s e des paramètres du m o d è l e ou de la d i s t r i - bution s p e c t r a l e .

S1i l est p a r f a i t e m e n t légitime dans une large gamme d'applications (en sciences physiques n o t a m m e n t ) , il faut reconnaître que dans bien d'autres situ- a t i o n s , le recours à des m o d è l e s n'est que la contrepartie n é c e s s a i r e du m a n q u e de données : ainsi les chroniques économiques sont pour la p l u p a r t des r é a l i s a - tions uniques par n a t u r e , de processus n o n r é p é t a b l e s . Si on v e u t estimer par exemple leur fonction d ' a u t o c o r r é l a t i o n , force est bien de les supposer s t a t i o n - naires et mêmes e r g o d i q u e s , fût-ce au prix de transformation des données de d é - p a r t . De p l u s , de nombreuses techniques ont été conçues e s s e n t i e l l e m e n t pour des séries c h r o n o l o g i q u e s , c'est-à-dire pour des observations effectuées sur un ensemble dénombrable d'instants é q u i d i s t a n t s .

O r , depuis quelques a n n é e s , on commence à disposer de m a n i è r e e x p l o i t a b l e , grâce au d é v e l o p p e m e n t des capacités de stockage i n f o r m a t i q u e , de données d'un type n o u v e a u : des séries individuelles t e m p o r e l l e s , c'est-à-dire des " t a b l e a u x "

à trois indices contenant les valeurs x^(ca) de p variables (j = l,2, . . . ,p) aux temps t (t v a r i a n t de 0 à T) pour n individus = l , 2 , , . , n ) .

D i s p o s a n t d'un grand n o m b r e d'individus il devient alors p o s s i b l e d'effec- tuer de v é r i t a b l e s analyses statistiques sans être obligé de recourir à des modèles préétablis : on reconnaît ici la démarche exploratoire (au sens de J.W.

TUKEY [ 6 4 ] ) de l'analyse des données ; cependant il convient d'adapter les m é - thodes existantes et de développer de nouveaux outils pour tenir compte du c a - ractère évolutif des tableaux é t u d i é s . En o u t r e , il d e v i e n t fréquent que les v a r i a b l e s soient repérées en continu et n o n plus à certaines dates f i x e s , que ce soit en raison du caractère p o n c t u e l du processus (naissance, changement

(3)

dfé t a t m a t r i m o n i a l par exemple) ou de la m é t h o d e de m e s u r e (courbes de t e m p é - rature, en m é t é o r o l o g i e ) , Il faut donc pouvoir traiter une infinité n o n dénom- b r a b l e de v a r i a b l e s ce qui implique dfu t i l i s e r les résultats de l'analyse f o n c -

tionnelle et de la théorie des p r o c e s s u s .

Si la d é c o m p o s i t i o n de K A R H U N E N - L O E V E , base de l'analyse factorielle des processus date des années 1945-1947 [42] [ 4 3 ] , l'étude par l'analyse des don- nées ou des techniques p r o c h e s , de l'évolution de données individuelles est

cependant a s s e z récente et encore p e u r é p a n d u e .

En F r a n c e , les premiers travaux d a t e n t , nous s e m b l e - t - i l , de 1970 avec la thèse d'Y. E S C O U F I E R [23] qui abordait le p r o b l è m e de façon originale au m o y e n d'opérateurs associés à u n processus ; leur lien avec l'analyse des données fut effectué plus tard par J.M. BRAUN [10] et J.P. PAGES [51] . C'est l'article de J.C. D E V I L L E [17] en 1974 qui m a r q u e à n o t r e avis le d é b u t v é r i t a b l e de

l'application, dans une optique d'analyse de d o n n é e s , de la d é c o m p o s i t i o n de K A R H U N E N - L O E V E d'un p r o c e s s u s , Sous le nom d'analyse h a r m o n i q u e qualitative cette m é t h o d e fut étendue par J,C, D E V I L L E et nous-même [20] aux p r o c e s s u s qualitatifs en 1979. E n t r e temps M. M A S S O N [43] puis J. D A U X O I S et A. POUSSE [16] d é v e l o p p a i e n t la théorie abstraite de l'analyse factorielle des fonctions aléatoires en dépassant le cadre linéaire des m é t h o d e s u s u e l l e s . Ces travaux furent suivis sur le plan théorique par ceux de BESSE [7] , R O M A I N [56] , BOUMAZA [8] , et dans le domaine appliqué par M A Z E R O L L E [46] et OBLED [50] .

C o n c e r n a n t les séries chronologiques m u l t i p l e s , il faut citer les travaux de M , TENENHAUS [62] et J.M. BOUROCHE [9] ainsi que ceux de T. F O U C A R T [27] et E . STEMMELEN [61] sur les évolutions de tableaux de contingence (mais il s'a- git là de données agrégées et n o n i n d i v i d u e l l e s ) ,

Il est n o t o i r e que l'orientation des diverses écoles anglo-saxonnes est fort d i f f é r e n t e . Bien que les relations entre l'analyse spectrale et la d i a g o - n a l i s a t i o n de l'opérateur d'autocorrélation soient bien connues dans le cas discret et f i g u r e n t dans les m a n u e l s consacrés aux séries c h r o n o l o g i q u e s , tel celui de F U L L E R [ 2 8 ] , la d é c o m p o s i t i o n de K A R H U N E N - L O E V E apparaît plus comme une p r o p r i é t é m a t h é m a t i q u e que comme base d'une m é t h o d e s t a t i s t i q u e , m ê m e pour les s p é c i a l i s t e s de la théorie du signal comme PAPOULIS [53] . Il faut attendre

(4)

1979 pour en v o i r p u b l i é e une application dans une revue anglo-saxonne (te sta- tistique [3] , encore est-ce dans le cas d'une réalisation unique d'un p r o c e s - sus stationnaire et dans le b u t de proposer aux p r a t i c i e n s une m é t h o d e plus rapide à comprendre que l'analyse s p e c t r a l e . . .

L'utilisation des techniques m u l t i d i m e n s i o n n e l l e s a cependant été d é v e - loppée dans les remarquables travaux de BRILLINGER [11] (régression, analyse en composantes p r i n c i p a l e s , analyse canonique) m a i s transposée dans le d o m a i - ne spectral pour l'étude de filtres invariants pour des processus stationnaires

Les rares travaux concernant des trajectoires individuelles sont p l u t ô t le fait des économètres et relèvent d'une approche m o d é l i s a n t e , on en trouve une bonne synthèse dans le colloque organisé par l'INSEE en 1977 [69] .

Notre travail répond à un double b u t : dresser une synthèse des apports de l'analyse des données dans le domaine des données individuelles temporelles étudiées sur un intervalle de temps fini [0,T] ; proposer et étudier des m é t h o - des nouvelles pour des problèmes n o n encore résolus comme l^étude de processus q u a l i t a t i f s .

Nous espérons ainsi m o n t r e r en particulier la fécondité des m é t h o d e s d'ana lyse factorielle dans le domaine t e m p o r e l , en n e p r é t e n d a n t n u l l e m e n t établir cependant une quelconque supériorité sur les m é t h o d e s classiques pour les r a i - sons s u i v a n t e s . D'abord les données que n o u s voulons traiter ne sont pas les m ê m e s , elles sont à certains égards plus riches p u i s q u ' o n dispose de n trajec-

toires au lieu dTu n e ; en contrepartie elles sont évidemment plus difficiles à o b t e n i r . Et surtout les objectifs n e sont pas les mêmes du moins en ce qui concerne les analyses d e s c r i p t i v e s . En schématisant très f o r t e m e n t , on peut dire en effet qu'à l'inverse des m é t h o d e s de la statistique i n f é r e n t i e l l e , où

l'on s'intéresse p l u t ô t aux v a r i a b l e s et à leurs interrelations (les individus forment alors u n corpus h o m o g è n e d'objets anonymes et interchangeables puisqu'- issus d'un é c h a n t i l l o n n a g e a l é a t o i r e ) , l'analyse des données est orientée prin- cipalement vers les individus et la m i s e en évidence de facteurs d ' h é t é r o g é n é i - té d'une p o p u l a t i o n . Nous traduisons cela en d i s a n t b r i è v e m e n t que l'analyse des données est souvent e s s e n t i e l l e m e n t typologique.

(5)

Ainsi le p r o b l è m e ne sera pas tant de découvrir des p é r i o d i c i t é s comme le fait l'analyse s p e c t r a l e , que de trouver les traits dominants de d i f f é - r e n c i a t i o n des évolutions des i n d i v i d u s . Les m é t h o d e s factorielles f o u r n i s - sent a l o r s , selon des variables indépendantes du t e m p s , des p o s i t i o n n e m e n t s m u l t i d i m e r s i o n n e l s des i n d i v i d u s , représentables par des cartes où lfo n v i s u a -

lisera les proximités ou les oppositions entre individus selon qu'ils ont eu des évolutions similaires ou d i v e r g e n t e s . C e p e n d a n t lorsque le p r o c e s s u s é t u - dié p e u t être considéré comme stationnaire les résultats de l'analyse facto- rielle seront équivalents à ceux de l'analyse s p e c t r a l e .

L'étude des liaisons entre v a r i a b l e s fait certes p a r t i e des objectifs de l'analyse des d o n n é e s , avec des m é t h o d e s telles que l'analyse canonique ou l'analyse factorielle des corrélations p a r t i e l l e s , et r e j o i n t en cela les objectifs des techniques classiques d'analyse de p r o c e s s u s , mais il est clair qu'une étude p r é a l a b l e des h é t é r o g é n é i t é s éventuelles est indispensable pour p o u v o i r interpréter les liaisons t r o u v é e s , surtout si on u t i l i s e des m é t h o d e s

linéaires : on connaît la sensibilité des indicateurs de corrélation l i n é a i - res à la n o n - h o m o g é n é i t é des d o n n é e s .

E n f i n lorsqu'on v e u t prévoir le c o m p o r t e m e n t futur d'un p h é n o m è n e , les m o d è l e s p r o b a b i l i s t e s nous semblent indispensables et les techniques d'analy- se de liaison et d'ajustements linéaires déduites de l'analyse des données sont alors insuffisantes bien q u ' i n d i s p e n s a b l e s en première a p p r o c h e .

Bien que les m é t h o d e s de classification constituent une part importante des m é t h o d e s exploratoires d'analyse des d o n n é e s , nous ne les abordons pas dans n o t r e t r a v a i l , nous limitant aux m é t h o d e s factorielles et l i n é a i r e s . La raison en est que la d i m e n s i o n temporelle des p h é n o m è n e s ne nous a pas paru susceptible d'apporter des éléments n o u v e a u x : classer des trajectoires ne sou- lève pas de p r o b l è m e p a r t i c u l i e r dès lors qu'on u t i l i s e une m é t r i q u e adaptée et renvoie à 1'utilisation des mêmes algorithmes que dans le cas n o n - t e m p o r e l .

Vonmatl&mz adopte.

S'agissant dru n travail d'analyse des d o n n é e s , le lecteur p o u r r a être sur- p r i s de n o u s voir u t i l i s e r le v o c a b u l a i r e du calcul des p r o b a b i l i t é s et des p r o -

cessus stochastiques et de n e trouver que des exemples d'école et n o n des dorir nées r é e l l e s . Il convient donc de nous en expliquer : si nous avons choisi de

(6)

parler de " p r o c e s s u s1 1 et de " p r o b a b i l i t é s " là où certains n e pourraient v o i r que " c o u r b e s " et ''fréquences", c'est que ce langage nous a semblé le plus sim- ple à u t i l i s e r et le m i e u x adapté au cas d'une infinité n o n dénombrable de v a - r i a b l e s . Il reste cependant que n o u s avons toujours eu à l'esprit le fait que 0, r e p r é s e n t e une p o p u l a t i o n d'individus et u n processus un ensemble de t r a j e c - toires i n d i v i d u e l l e s .

Q u a n t aux exemples t h é o r i q u e s , leur traitement nous a semblé intéressant tout d'abord pour les d é v e l o p p e m e n t s m a t h é m a t i q u e s auxquels il conduisent et p a r c e qu'ils m o n t r e n t que l'on peut résoudre jusqu'au b o u t les équations obte- n u e s . Mais surtout leur p r i n c i p a l intérêt est à notre sens le suivant : on ne p e u t bien comprendre une m é t h o d e d'analyse des données et l'appliquer v a l a b l e - m e n t que si l'on a établi des règles d'interprétation des résultats sur des données p a r f a i t e m e n t connues : les processus s t a n d a r d s , comme le processus de P o i s s o n par e x e m p l e , c o n s t i t u e n t alors d'excellents jeux d ' e s s a i .

Notre travail est donc théorique m a i s nous n e l'avons pas v o u l u abstrait : c'est ainsi que n o u s n'avons pas recherché s y s t é m a t i q u e m e n t les énoncés les plus généraux p o s s i b l e s ni les h y p o t h è s e s m a t h é m a t i q u e s m i n i m a l e s . Non seule- m e n t cela correspond à n o t r e conception p e r s o n n e l l e de la recherche en s t a t i s -

tique qui doit fournir des m é t h o d e s orientées vers les a p p l i c a t i o n s , m a i s e n c o - re à la réalité des phénomènes abordés : ainsi traiter d'abord des processus scalaires puis des processus v e c t o r i e l s p e u t paraître r e d o n d a n t puisque les premiers sont des cas p a r t i c u l i e r s des seconds ; en fait il n'en est rien car en changeant de d i m e n s i o n l e phénomène change de nature et les techniques sont d i f f é r e n t e s . D e m ê m e , il a u r a i t été p o s s i b l e d'étudier des fonctions aléatoires g é n é r a l e s , l'indice t a p p a r t e n a n t alors à un ensemble n o n ordonné q u e l c o n q u e : on y aurait gagné en extensions et p e u t - ê t r e en applications m a i s le support concret fourni par le temps a u r a i t été p e r d u . Nous nous sommes également a t t a - ché à donner p a r t o u t ou cela é t a i t p o s s i b l e des formules explicites pour les calculs ce qui p e r m e t de faire le lien avec les notations usuelles de l'analyse des d o n n é e s .

D'un p o i n t de v u e terminologique nous u t i l i s e r o n s ici le v o c a b l e '^d'analyse f a c t o r i e l l e " sous le sens large qui p r é v a u t actuellement en F r a n c e , et qui r e - couvre diverses m é t h o d e s linéaires comme l'analyse en composantes p r i n c i p a l e s , l'analyse des c o r r e s p o n d a n c e s , e t c . , et n o n dans l'acception limitée du m o d è l e des facteurs communs et s p é c i f i q u e s . Il s'agit certes d'un abus de langage :

(7)

l'analyse factorielle au sens strict étant conceptuellement d i f f é r e n t e de l'analyse en composantes p r i n c i p a l e s .

De m ê m e le nom d'"analyse h a r m o n i q u e " introduit par J.C. D E V I L L E pour désigner des analyses en composantes p r i n c i p a l e s de processus p e u t prêter à confusion avec la théorie m a t h é m a t i q u e du m ê m e nom (à laquelle elle se rat- tache il est v r a i ) : c e p e n d a n t l'usage en étant m a i n t e n a n t b i e n établi en a n a - lyse des données c h r o n o l o g i q u e s , nous n o u s y conformons é g a l e m e n t .

Rétamé du tAavall

Les trois p r e m i e r s chapitres sont consacrés à des g é n é r a l i s a t i o n s de l'a- n a l y s e factorielle à trois types de p r o c e s s u s .

Le chapitre I traite des processus s c a l a i r e s , c'est-à-dire du cas où on observe sur une population l'évolution d'une v a r i a b l e aléatoire réelle au cours du temps. Il s'agit essentiellement d'un chapitre de s y n t h è s e . Après des r a p - pels c o n c e r n a n t la d é c o m p o s i t i o n de K A R H U N E N - L O E V E d'un processus ( Xt) observé sur un intervalle de temps fini [0,T] on examine les rapports de cette dernière avec l'analyse spectrale des processus s t a t i o n n a i r e s . On m o n t r e que les deux analyses sont identiques p o u r des processus spécifiques étudiés sur un i n t e r v a l - le de temps fini et q u?e l l e s c o ï n c i d e n t , m o y e n n a n t une g é n é r a l i s a t i o n de l'ana- lyse en composantes p r i n c i p a l e s , lorsque la période d'étude est étendue à IR tout e n t i e r . L'intérêt de considérer des processus stationnaires en analyse des données n o u s p a r a î t lié au p r o b l è m e suivant souvent posé par des praticiens : ayant effectué l'analyse factorielle d'un processus jusqu'à une date T peut-on extrapoler jusqu'à T+h et que se p a s s e - t - i l si h tend vers l'infini ? Ce pro- b l è m e n'a de sens à n o t r e avis que si le comportement du processus n'est pas susceptible de v a r i e r f o n d a m e n t a l e m e n t après T , sinon il est évident que les facteurs de l'analyse v o n t c h a n g e r . Il doit donc exister une certaine permanen- ce de la structure de d é p e n d a n c e entre les ce qui conduit assez n a t u r e l l e m e n t à des h y p o t h è s e s de s t a t i o n n a r i t é .

L e cas où fi est fini est l:o c c a s i o n de préciser les notions de dualité entre l'A.C.P. du p r o c e s s u s (X ) dont on connaît n réalisations et celle de la chronique n - d i m e n s i o n n e l i e constituée des n trajectoires.

Un des concepts f o n d a m e n t a u x en analyse des données est celui de m é t r i q u e

(8)

associée à un ensemble de v a r i a b l e s , qui p e r m e t de définir une distance entre i n d i v i d u s . L e s contributions originales dans ce chapitre concernent principa- lement lTe x t e n s i o n de la n o t i o n de m é t r i q u e à des processus afin de comparer des t r a j e c t o i r e s . Nous proposons une formulation générale permettant de trai- ter les divers cas de m é t r i q u e s applicables à des processus (dont les m é t r i - ques de Sobolev en p a r t i c u l i e r ) ; le fait de s'écarter du cas élémentaire d'une m é t r i q u e d é f i n i e par un homéomorphisme de LZ( T ) (traité par J. DAUXOIS et A. POUSSE [ 1 6 ] ) introduit des problèmes spécifiques de l'analyse fonction- nelle car les opérateurs associés ne sont pas forcément b o r n é s . On étudie ensuite plus s p é c i a l e m e n t la m é t r i q u e D j/a2 , conduisant à un processus ré- d u i t , en m o n t r a n t sur un exemple son intérêt pour des processus à variance croissante : cette m é t r i q u e permet d'éliminer dans une certaine m e s u r e la p r e - m i è r e composante triviale liée à la c h r o n o l o g i e . Le traitement m a t h é m a t i q u e des p r o c e s s u s à accroissements indépendants fait alors intervenir certaines propriétés des fonctions de B e s s e l .

Le chapitre s'achève par une partie consacrée à la m i s e en oeuvre de la m é t h o d e sur des données concrètes et étudie p a r t i c u l i è r e m e n t les problèmes posés par 1:a p p r o x i m a t i o n et l'interpolation. On y reprend certains travaux récents effectués par P. BESSE [7] .

Les processus v e c t o r i e l s sont étudiés au chapitre I I . La donnée d'un processus m - d i m e n s i o n n e l № ^ ) étant la g é n é r a l i s a t i o n du cas de l'analyse s i m u l - tanée de plusieurs tableaux de d o n n é e s , nous rappelons b r i è v e m e n t les résultats que nous avions établis a n t é r i e u r e m e n t concernant l'analyse canonique g é n é r a l i - sée. L ' e x t e n s i o n , n o u v e l l e , au cas d'une infinité n o n dénombrable de vecteurs aléatoires est effectuée sous le nom d'analyse ''harmonique'' v e c t o r i e l l e pour reprendre un terme introduit par J.C. D E V I L L E bien que n o t r e m é t h o d e en diffè- re par l'introduction d'une m é t r i q u e "glissante' d é c o r r é l a n t à tout instant les composantes de .

L'introduction de cette m é t r i q u e est indispensable pour assurer la c o h é - rence de l'analyse , :harmonique': v e c t o r i e l l e avec l'analyse canonique g é n é r a l i - sée et l'analyse des processus qualitatifs conçue comme analyse des indica- trices des é t a t s .

Cette m é t r i q u e de plus rend l'analyse invariante par changement de b a s e , pour des processus à valeurs dans un espace vectoriel V . Contrairement à

(9)

1'analyse d'un processus s c a l a i r e , on n e trouve pas de liens directs avec l'analyse spectrale des processus s t a t i o n n a i r e s , le type de d é c o m p o s i t i o n en v a r i a b l e s scalaires (coordonnées d'individus) et facteurs v e c t o r i e l s de n o t r e analyse étant d i f f é r e n t de celui de la représentation de Cramer des processus v e c t o r i e l s . Bien que l'analyse " h a r m o n i q u e " v e c t o r i e l l e soit la m é t h o d e , à notre a v i s , la plus intéressante pour l'étude des trajectoires individuelles il existe cinq autres p o s s i b i l i t é s d'analyse factorielle de tableaux à 3 indices que nous étudions s y s t é m a t i q u e m e n t et dont une p r é s e n t e un intérêt indéniable pour l'étude des v a r i a t i o n s des dépendances entre composantes de (X^_) : il s'agit d'une extension d'une m é t h o d e proposée par M . T E N E N H A U S [6]

pour les chroniques m u l t i d i m e n s i o n n e l l e s .

Chaque m é t h o d e est alors caractérisée par des propriétés d'optimalité : que ce soit celles d e v e c t e u r s aléatoires obtenus par combinaisons dans le

temps du type Y = / X f(t) dt ou de processus scalaires obtenus par combinaison linéaire des composantes de (X ) du type £ = < X ; f(t) > ou

. t

5t = < Xt ; a > .

Enfin on p r o p o s e deux m é t h o d e s , . p l u s g l o b a l e s , fondées sur l'utilisation des opérateurs introduits par Y . E S C O U F I E R , l'une p e r m e t t a n t de comparer les m processus scalaires associés aux m composantes de (X ) , l'autre étudiant la chronologie d u processus en associant à chaque instant u n opérateur ce qui revient à étudier un processus à valeurs o p é r a t e u r s .

Le chapitre III développe et complète sur de n o m b r e u x points la m é t h o - de d'analyse des processus qualitatifs que nous avions p r o p o s é avec J.C.

D E V I L L E [20] sous le nom d'analyse h a r m o n i q u e q u a l i t a t i v e . Cette m é t h o d e b a s é e sur l'introduction d'un opérateur caractéristique d*un p r o c e s s u s qualitatif analogue à un opérateur de c o v a r i a n c e , mais en plus c o m p l e x e , a p p a r a î t comme une extension de l'analyse des correspondances m u l t i p l e s à un continuum de v a r i a b l e s qualitatives et comme une a p p l i c a t i o n de l'analyse h a r m o n i q u e v e c t o - rielle au processus des indicatrices des é t a t s . On m o n t r e comment on p a s s e de l'obtention de processus scalaires propres transformant p a r codage le processus qualitatif (X^) en un processus n u m é r i q u e (X^) optimal en u n certain s e n s , à celle des " g é n é r a t r i c e s " ou composantes p r i n c i p a l e s p e r m e t t a n t le p o s i t i o n n e - m e n t des individus dans les plans f a c t o r i e l s , puis à celle des codages propres ou f a c t e u r s . Nous donnons ensuite des p r o p r i é t é s spécifiques des p r o c e s s u s à deux états en t r a i t a n t , à titre d ' e x e m p l e , un processus simple avec changement

(10)

d'état irréversible u n i f o r m é m e n t réparti dans le temps. Le traitement n u m é r i - que est e n s u i t e abordé avec n o t a m m e n t une n o u v e l l e d é m o n s t r a t i o n de la m é t h o d e d'approximation p r o p o s é e en [20] .

Un p r o c e s s u s qualitatif étant un cas p a r t i c u l i e r d'un processus v e c t o - riel nous reprenons les cinq autres analyses p o s s i b l e s des tableaux cubiques pour aboutir à une conclusion opposée à celle dû cas v e c t o r i e l : ici seule une a n a l y s e m a r g i n a l e , celle des temps passés dans chaque état entre [ 0 et T] pré- sente un intérêt certain alors qu'elle en était dénuée pour les processus v e c t o - riels tandis que celle retenue pour les processus vectoriels aboutit à des r é - sultats triviaux. Ces diverses analyses sont illustrées par l'exemple du pro- cessus à deux états déjà utilisé .

Ici une seule analyse g l o b a l e , par o p é r a t e u r s , à un sens : c'est celle du o

processus dont les éléments E sont les opérateurs d'espérance conditionnelle

à x

t

.

E n f i n on p r o p o s e et on justifie des m é t h o d e s pour le p r o b l è m e , n o n encore t r a i t é , des p r o c e s s u s qualitatifs m u l t i p l e s où l'on observe p variables q u a l i - tatives au cours du t e m p s . Une de ces m é t h o d e s est l'extension de l'analyse har- m o n i q u e q u a l i t a t i v e et revient à une double analyse canonique généralisée : une à chaque instant sur les variables ( X * , X ^ , . . . , X ^ ) , l'autre sur le processus v e c - toriel des composantes issues de la p r e m i è r e .

Les trois types d'analyse " h a r m o n i q u e " étudiés dans ces trois chapitres forment un ensemble dont la cohérence a p p a r a î t , en p a r t i c u l i e r , dans le tableau suivant donnant les critères d'optimalité des composantes principales associées à chaque type de p r o c e s s u s , où r, R, r\ d é s i g n e n t r e s p e c t i v e m e n t le coefficient de corrélation s i m p l e , le c o e f f i c i e n t de corrélation m u l t i p l e , et le r a p p o r t de c o r r é l a t i o n .

A n a l y s e " H a r m o n i q u e " A n a l y s e " H a r m o n i q u e " A n a l y s e " H a r m o n i q u e1 1

scalaire r é d u i t e v e c t o r i e l l e qualitative

(x

t

> ex

t

) ( y

m a x / r (z;X ) dt m a x / R (z;X ) dt m a x / T? (z;X ) dt

z ^ 0 z

"0

z

JQ

(11)

Notre travail n'aurait pas été complet sans une étude des liaisons p o u v a n t exister entre un processus et diverses variables ou entre deux p r o c e s s u s . Il s'agit donc au sens large de ce qu'on p e u t appeler des p r o b l è m e s de régression où un p r o c e s s u s p e u t être soit prédicteur soit p r é d i c t a n d . Le chapitre IV concerne donc des généralisations de la régression m u l t i p l e , de l'analyse c a n o - n i q u e , de l'A.C.P. sur covariances p a r t i e l l e s , e t c .

Le p a s s a g e à la d i m e n s i o n infinie pose alors des problèmes d'une n a t u r e d i f f é r e n t e de ceux rencontrés jusqu'alors en analyse f a c t o r i e l l e . En e f f e t , si

2 les facteurs de l'A.C.P. d'un processus (X ) étaient des fonctions f(t) de L (T)

t

r

T

et les composantes principales des v a r i a b l e s de la forme / X f(t) dt il n'en est pas de m ê m e pour les coefficients de régression et la p r o j e c t i o n Y d'une v a r i a b l e Y sur un processus (X ) : ce n'est q u ' e x c e p t i o n n e l l e m e n t que Y

pT 0 t

se m e t sous la forme / X P (t) dt .

Le p r e m i e r p a r a g r a p h e rappelle donc ces aspects spécifiques de la r é g r e s - sion d^une v a r i a b l e sur un processus et en tire les conséquences pour les a p p l i - cations n u m é r i q u e s . On y p r o p o s e é g a l e m e n t diverses m é t h o d e s de r é g r e s s i o n n o n - linéaire conduisant à des solutions c a l c u l a b l e s . L'ensemble des techniques de r é s o l u t i o n n u m é r i q u e repose sur la d é c o m p o s i t i o n préalable de (X^) en composan- tes principales et facteurs p r i n c i p a u x .

On étudie ensuite le cas où la v a r i a b l e à expliquer est v e c t o r i e l l e . C'est l'occasion de définir la p r o c é d u r e p e r m e t t a n t de réaliser l'analyse c a n o - nique d'un processus (X^) et d'un vecteur aléatoire à m dimensions Y

On étend également à un processus la m é t h o d e d'A.C.P. sur v a r i a b l e s i n s - trumentales p r o p o s é e par C.R. RAO [55] ainsi que l'analyse factorielle discri- m i n a n t e .

D i v e r s e s m é t h o d e s pour analyser le p r o b l è m e i n v e r s e , celui de l'influence d'une ou plusieurs v a r i a b l e s aléatoires sur le d é r o u l e m e n t d'un p r o c e s s u s , sont d é v e l o p p é e s . E n t r e autres on insiste sur la technique d'A.C.P. d'un processus

(Xj_) c o n d i t i o n n e l l e m e n t à une v a r i a b l e en r e p r e n a n t l'exemple des processus à accroissements indépendants où on élimine ainsi l'effet dans la v a l e u r finale X^.

L'étude simultanée de d e u x processus ( Xt) et (Yf c) m a r q u e à n o t r e avis les limites de l'analyse des données car les m é t h o d e s déduites de l'analyse canoni-

(12)

q u e , outre les difficultés m a t h é m a t i q u e s inhérentes à la dimension i n f i n i e , ne p e r m e t t e n t pas une p r é v i s i o n causale au sens de la théorie du signal et ne sont v a l a b l e s q u:a p o s t e r i o r i . Le p r o b l è m e semble plus relever de techni- ques de filtrage p r o b a b i l i s t e s avec introduction de m o d è l e s .

A j o u t o n s pour terminer que de nombreuses remarques ne concernent pas s e u l e m e n t les données temporelles mais sont également valables pour l'analyse des données en g é n é r a l .

(13)

CHAPITRE I

ANALYSE FACTORIELLE D'UN PROCESSUS SCALAIRE

Ce chapitre est consacré à la g é n é r a l i s a t i o n de l'analyse en composantes principales à une famille infinie de v a r i a b l e s aléatoires réelles où t v a r i e dans u n intervalle b o r n é de IR noté [ 0,T] ou simplement T. Le b u t est de traiter des données du type suivant : évolution d'un ensemble d'individus au cours du

temps décrits par une v a r i a b l e X . Ce problème étant f o n d a m e n t a l pour la s u i t e , il n o u s a paru utile de rassembler et de p r é s e n t e r d'abord de m a n i è r e s y n t h é - tique un certain n o m b r e de résultats classiques concernant la d é c o m p o s i t i o n de K a r h u n e n - L o e v e d'un processus et ses l i e n s , moins c o n n u s , avec l'analyse spec-

trale. O u t r e quelques remarques concernant le cas d'une p o p u l a t i o n f i n i e , les développements originaux concernent p r i n c i p a l e m e n t l'usage de m é t r i q u e s q u e l - conques et sont regroupés dans le deuxième p a r a g r a p h e : on y étudie en p a r t i - culier l'influence de la réduction des données dans l'analyse de processus à accroissements i n d é p e n d a n t s . E n f i n le troisième p a r a g r a p h e où sont exposés les problèmes de m i s e en oeuvre constitue une synthèse de travaux récents c o n c e r - n a n t l'approximation et l'interpolation et renferme des c o n s i d é r a t i o n s d'ordre p r a t i q u e .

I- A N A L Y S E EN COMPOSANTES P R I N C I P A L E S D'UN PROCESSUS

1-1 Hypothèses et n o t a t i o n s

L e m o d è l e m a t h é m a t i q u e est le suivant : étant donné un espace p r o b a b i l i s é (fi,a,P) et un intervalle fini [0,T] de IR m u n i de la m e s u r e de L e b e s g u e dt , on se donne une f o n c t i o n m e s u r a b l e de T x fi dans |R n o t é e :

(t,üi) -> X(t,o)) .

2

On suppose que la classe de cette f o n c t i o n appartient à L (T x fi). Par la s u i t e , p o u r éviter des difficultés non essentielles de langage on identifiera

(14)

une telle fonction avec sa classe d ' é q u i v a l e n c e . Ceci entraîne que X(t,.}

2

noté encore (X^) d é f i n i t une application de T dans L (Q) c'est-à-dire un processus du second ordre : p o u r toutt>xt est une v a r i a b l e ayant une e s p é - rance m ( t ) et une v a r i a n c e o2( t ) f i n i e s . De m ê m e X(.,œ) définit une a p p l i c a -

2 .

tion de Q dans L (T) , ce qui v e u t dire que pour tout u) , sa trajectoire notée Xt(u)) est de carré i n t e g r a b l e . On supposera désormais le processus (X^) c e n -

tré c'est-à-dire m ( t ) = 0 p o u r tout t .

O n a alors les résultats suivants ([16] [23] par e x e m p l e ) .

Soit U le processus linéaire défini par (X ) , c'est-à-dire l'application 2 2 *"

de L (T) dans L (Q) d é f i n i e par : T

U ( f ) = Y =

f

X f (t) dt .

«^0 z

U est alors un opérateur de H i l b e r t - S c h m i d t c'est-à-dire que pour toute 2

base orthogonale (f^) de L (T) z | | U ( f ^ ) | |2 est fini et est indépendant de la

b a s e . 1

* 2 2 Il en est de m ê m e de son adjoint U opérateur de L (fi) dans L (T) défini par : U*(Y) = E ( ( Xt) Y ) = f .

2

L'opérateur de covariance du processus est l'opérateur de L (T) dans lui- m ê m e défini par :

(f | C g ) - E[ (f |(xt)(g|(»t))] = E [ U ( f ) U ( g ) ] v f ,geL 2( T )

où (| ) désigne le produit scalaire de L ^ ( T ) .

C'est l'opérateur inégral de n o y a u C ( t , s ) = E ( X X ) c'est-à-dire que T

f Cf = g • g ( t ) =

f

E ( X X ) f (s) ds .

J 0

O n m o n t r e alors que C = U* o U ce qui p r o u v e que C qui est positif et autoadjoint est é g a l e m e n t n u c l é a i r e comme p r o d u i t d'opérateurs de H i l b e r t - S c h m i d t .

2

P o u r toute base orthogonale (f^) de L (T) on a donc :

I (f. |C f.) = Trace C = f C ( t , t ) dt < « .

i 1 1 ^ 0

L'opérateur W = U 0 U* de L^(fi) dans lui-même obtenu en composant ü et

(15)

U dans 1 autre sens est é g a l e m e n t n u c l é a i r e et on trouve sans d i f f i c u l t é que

W ( Y ) = y Xt E ( Xt Y) dt . 0

C e t opérateur a été introduit par Y . E S C O U F I E R .

En identifiant les espaces à leurs d u a u x , c'est-à-dire en u t i l i s a n t les 2 2

produits scalaires usuels de L (T) et L (Q) on a le schéma de dualité suivant :

*

2 U 2

LZ( T ) < l/(fi)

i u

c w

u

i

L2( T ) > L2(fi) U

R e m a r q u e : R i e n n e change si on remplace l'intervalle [ 0,T] m u n i de la m e s u r e dt par u n espace m e s u r a b l e q u e l c o n q u e T m u n i d'une m e s u r e p o s i t i v e f i n i e . Le cas où T est un ensemble fini correspond à la situation de l'analyse des don- nées u s u e l l e s . En p a r t i c u l i e r p o u r une p o p u l a t i o n finie de n individus l'opé- rateur U se confond avec le tableau de données individus - caractères considé- ré comme une m a t r i c e à n lignes et U* avec la transposée de cette m a t r i c e .

I.2 D é c o m p o s i t i o n orthogonale d'un processus

Cherchons une r e p r é s e n t a t i o n du processus (X ) sous forme d'une somme de

00

processus q u a s i - d é t e r m i n i s t e s du type X = L £ f (t) où les sont des

t k=, k k k

variables aléatoires indépendantes du temps et les f, des fonctions certaines 2

du t e m p s . Si on impose aux f^ de former une b a s e orthonormale de L (T) on obtient a i s é m e n t les £ en m u l t i p l i a n t la formule précédente par f^(t) et en intégrant sur t :

T T

X

x

t

f

k

( t ) d t

- X i

h f

*

(t) f k ( t ) d t =

i

h & k s i = 5k = u(fk)

et on m o n t r e alors la convergence en m o y e n n e quadratique de I £^ ^ ^ ^t) vers X^_ pour p r e s q u e tout t .

(16)

- 2 1 -

Les v a r i a b l e s aléatoires £ ^ n'ont aucune raison d'être orthogonales c'est-à-dire n o n corrélées ce qui semble une p r o p r i é t é souhaitable s t a t i s t i - q u e m e n t , pour un choix arbitraire des f ; en p a r t i c u l i e r le développement

* - A -o - ç / J _ \ • 2 k ï ï t _ 2 k ï ï t en serie de F o u r i e r obtenu en p r e n a n t pour f^(t) sin — - — et cos — - — ne

donne des £ ^non

córreles

que dans certains cas p a r t i c u l i e r s . Le r é s u l t a t fondamental est alors le suivant :

P r o p o s i t i o n 1.1 (Décomposition de K a r h u n e n - L o è v e )

00

Pour que Xt = E m , cl# ou ^es ^ f °rment un système k=l

orthonormal de L (T) et les un système orthogonal de L 2 2 .. (Q) , il faut que les f^ soient les fonctions propres de l'opérateur de c o v a -

riance C du p r o c e s s u s et les || les valeurs propres c o r r e s p o n - dantes .

En effet on a E(X Ç ) - Z E ( Çk C¿) f ^ t ) = f (t) || Ç ^ 2

k

T T et E ( Xt C¿) =E ( X t y Xs f£(s) ds) =

f

E

<

Xt Xs} f

£

(s) ds

'

L'opérateur C é t a n t a u t o a d j o i n t positif et n u c l é a i r e , donc c o m p a c t , son analyse spectrale est p o s s i b l e sans recourir à l'intégrale hilbertienne et il existe bien un système o r t h o n o r m a l dénombrable de fonctions propres f^ associées à des v a l e u r s propres ^ p o s i t i v e s . Si toutes les valeurs p r o - pres sont simples il n'existe donc qu'un seul système orthonormé de fonctions f (définies au signe près) et de v a r i a b l e s aléatoires non corrélées tel

k. K

oo

que X = I £ » est c^a^T clu e siune valeur propre est m u l t i - t k=] k k

pie on p e u t p r e n d r e n'importe quelle base orthonormée du sous-espace propre e n g e n d r é ) .

Les f^ sont les facteurs p r i n c i p a u x de (X^) (appelés harmoniques par J.C. D E V I L L E ) et les ^-e s composantes p r i n c i p a l e s . On a également le :

Théorème de M e r c e r

Si X^_ est continu en m o y e n n e q u a d r a t i q u e

(17)

£ ^ k ^ ^ ^ k ^S^ converge u n i f o r m é m e n t v e r s C(t,s) . k

et on sait que [23] :

P r o p o s i t i o n 1.2

Les sont fonctions propres de 1 o p é r a t e u r W de v a l e u r propre Ak .

Si on n u m é r o t e les et ^es ^ décroissants on sait é g a l e m e n t que :

P r o p o s i t i o n 1.3 l

Le p r o c e s s u s £ £> ^ ( O est ^a m e i l l e u r e a p p r o x i m a t i o n en k=l k

m o y e n n e quadratique de (X^) par une somme de £ p r o c e s s u s quasi-déter- ministes .

P r o p o s i t i o n 1.4 X Les extrema de E ( £2) pour £ de la forme / X f(t) dt , avec f

2 ^ t

a p p a r t e n a n t à la b o u l e unité de L (T) , v a l e n t et sont réalisés pour les composantes principales •

O n retrouve ici la d é f i n i t i o n dTH O T T E L I N G des composantes p r i n c i p a l e s en tant que combinaisons linéaires des X ^ de v a r i a n c e m a x i m a l e .

Comme la covariance entre £ et X v a u t E(Ç X ) = A f, (t) on en déduit de m ê m e que les r é a l i s e n t les extrema de / (cov(^;X ) )2 dt ,

K J O T

L e coefficient de corrélation linéaire entre X et E. v a u t t

fk(t)

r ( £ , ; X ) = ce qui p e r m e t 1 i n t e r p r é t a t i o n des composantes princi-

k t a(t)

pales «

1.3 Rapports avec l'analyse spectrale des p r o c e s s u s stationnaires

Considérons un p r o c e s s u s stationnaire au sens large c'est-à-dire que : m ( t ) = m et C(t;s) = < p ( | t - s | ) d'où a2( t ) = a2 ,

(18)

Four simplifier nous supposerons m = 0 . Notre propos est de m o n t r e r que dans ce cas lra n a l y s e factorielle fournit une d é c o m p o s i t i o n équivalente à celle de 1Ja n a l y s e s p e c t r a l e . A v a n t d'aborder le cas le plus important sur le plan t h é o r i q u e , c'est-à-dire celui d'un processus défini sur la droite r é e l l e , nous examinerons au p r é a l a b l e le cas où le processus n'a été obser- vé q u e sur un intervalle f i n i . Enfin nous rappellerons les r a p p o r t s , dans le cas où T e s t un ensemble d i s c r e t , entre l'analyse en composantes principales usuelle et lra n a l y s e s p e c t r a l e .

1 . 3 «a) P r o c e s s u s observé sur [ 0,T]

Notons tout d'abord q u e si (X^) n'a été observé que sur un intervalle b o r n é on n e p e u t définir stricto sensu l'analyse spectrale de (X^) car celle- ci suppose que t p a r c o u r t ¡R e n t i e r . Pour l'analyse en composantes p r i n c i p a l e s , le problème est en q u e l q u e sorte inverse : celle-ci n e présente pas de diffi- culté sur [0,T] tandis que sa g é n é r a l i s a t i o n à la droite réelle soulève des problèmes t h é o r i q u e s .

On dira que (X^) est p s e u d o - s t a t i o n n a i r e si sa fonction de covariance C(t;s) est égale à <¿>(t-s) où \p est u n e fonction paire définie sur [-T,T] .

On p e u t toujours décomposer (X^) en une somme de processus harmoniques élémentaires du type : A ^ eos t + sin aj^ t , les forment alors u n ensemble d é n o m b r a b l e .

Notons ici une ambiguïté qui semble p e u explicitée dans la littérature : il existe en fait deux adaptations possibles de l'analyse spectrale selon que l'on u t i l i s e la d é c o m p o s i t i o n de Fourier de ( Xt) ou celle de sa fonction de c o v a r i a n c e . O n a en effet d'une part la d é c o m p o s i t i o n en série de Fourier de

(X^) sur [0,T] sous la forme :

°° / A 2knt „ . 2kïït .

Xt " , \ ( \ C0S T + kSin T k=0

où les v a r i a b l e s A, et B, n e forment pas en général u n système orthogonal de 2 k k

L (fi) : elles sont c o r r é l é e s .

Par contre on obtient des v a r i a b l e s n o n corrélées en utilisant la dé- composition de F o u r i e r de la f o n c t i o n de covariance sur [-T,T] : comme celle-

(19)

ci est p a i r e on n ' u t i l i s e que les cosinus et l'intervalle étant de largeur 2T on trouve

n/.- \ v 2 , k l l( t - s ) v C ( t ; s ) = I c£ cos( )= -)

k R 1

T T avec °t = \ J COS dx et Q0 = ï «/ C ^ dX

0 ' 0 , v v 00 /r k n t . kïït

d'où X = £ (£, cos + nv sin - — )

t k= Q k 1 k 1

et les £ ^et les ^ sont des v a r i a b l e s aléatoires n o n corrélées de v a r i a n c e a£ (cf. [65] p . 4 1 2 ) .

n A i k n t _ . kïït . , i C e p e n d a n t les cos et sin n e f o r m e n t pas un s y s t è m e o r t h o g o n a l

2 2

de L (T) m a i s de L ( 2 T ). Il n e p e u t y avoir identité entre ces deux d é c o m p o - sitions que dans le cas d'un p r o c e s s u s de p é r i o d e T en m o y e n n e q u a d r a t i q u e c'est-à-dire tel que C ( t ; s + T ) = C ( t ; s ) car dans la p r e m i è r e d é c o m p o s i t i o n tous les termes impairs d o i v e n t être n u l s .

L'ambiguïté est alors levée : le processus étant défini sur le tore l'ensemble des t a une s t r u c t u r e de groupe abelien localement c o m p a c t ce qui est la condition d'existence de l'analyse s p e c t r a l e .

Dans ces conditions pour u n p r o c e s s u s de p é r i o d e T on a :

~ p 2 k n t ^ . 2 k n t ,

Xt = J ^ k C° S+ \ S i n } *

L e s fonctions du temps et les v a r i a b l e s aléatoires f o r m e n t alors deux s y s t è - 2 2

mes o r t h o g o n a u x de L (T) et L (fi) r e s p e c t i v e m e n t et sont donc les facteurs p r i n c i p a u x et les composantes p r i n c i p a l e s de (X^) .

O n en déduit la

P r o p o s i t i o n 1.5

Il n'y a identité entre la d é c o m p o s i t i o n de F o u r i e r de (X^) et la d é c o m p o s i t i o n de K a r h u n e n - L o è v e que si et s e u l e m e n t si ( Xt) est p é r i o - dique de p é r i o d e T en m o y e n n e q u a d r a t i q u e .

f(t) = 1 est alors fonction p r o p r e de C associé à la v a l e u r p r o p r e . Xn = / C ( x ) dx . Les fonctions trigonométriques cos et

L J 0 T

(20)

siñ pour k=l,2,...,°° sont é g a l e m e n t fonctions propres associées aux v a l e u r s doubles X. = / T C ( x ) cos dx .

k x

La d é m o n s t r a t i o n élémentaire de la deuxième partie de cette proposition figure p a r exemple dans [35] P. 73 .

Notons que dans la p r o p o s i t i o n p r é c é d e n t e les X sont numérotées non pas par importance d é c r o i s s a n t e m a i s selon les fréquences croissantes des fon- tions t r i g o n o m é t r i q u e s .

Pour un processus stationnaire n o n p é r i o d i q u e l'A.C.P. f o u r n i r a d e s " r é - sultats différents des d e u x analyses "spectrales'1. Quels en sont les avantages respectifs ? Les analyses " s p e c t r a l e s " f o u r n i s s e n t des décompositions simples à calculer selon des fonctions trigonométriques mais laquelle choisir ? Tar ailleurs le choix des sinus et cosinus est aussi arbitraire que celui d'une autre famille de fonctions si le p r o c e s s u s n'est pas p é r i o d i q u e . De son côté l'analyse f a c t o r i e l l e n é c e s s i t e la r é d u c t i o n de l'opérateur de c o v a r i a n c e , ce qui n'est pas toujours a i s é , m a i s f o u r n i t rappelons-le encore l'unique décompo- sition en fonctions orthogonales du temps et v a r i a b l e s n o n corrélées ce qui nous semble une p r o p r i é t é a g r é a b l e .

1.3.b) E x t e n s i o n _ à _ l a _ d r o i t e _ r e e l l e

Nous allons v o i r que si on étend à R l'intervalle d'étude du p r o c e s s u s , l'analyse en composantes principales de (X ) , m o y e n n a n t u n e g é n é r a l i s a t i o n , se confond avec l'analyse spectrale de (X^) . Nous supposerons pour simplifier que est continu en m o y e n n e q u a d r a t i q u e et que sa fonction de covariance C(t-s) est a b s o l u m e n t s o m m a b l e . O n sait qu'il existe alors une densité s p e c t r a - le s(œ) qui est une fonction b o r n é e et continue définie par la relation :

8(u) =

~èr J

c ( x ) e l u x dx

et que le p r o c e s s u s (X ) a d m e t la r e p r é s e n t a t i o n de Cramer :

Xt = f+" ei ( J J t dZ(to) U — OO

où Z(o)) e s t un processus complexe à accroissements orthogonaux (processus s p e c t r a l ) .

(21)

(Note : nous u t i l i s o n s , pour simplifier les é c r i t u r e s , la n o t a t i o n complexe m a i s (X^) é t a n t r é e l , il est b i e n e n t e n d u que la d é c o m p o s i t i o n de Cramer en sinus et cosinus est r é e l l e ) .

L'analyse en composantes principales c o n s i s t e r a i t , en g é n é r a l i s a n t les résultats des paragraphes p r é c é d e n t s , à rechercher les solutions de l'équa- tion :

J C(t-s) f(s) ds = À f ( t ) .

M o n t r o n s que l'opérateur C de n o y a u C ( t - s ) est b o r n é .

r

oo (C*f)(t) J(t) dt

X

+ o o C ( t - s ) f(s) ds . Les transformées de F o u r i e r de C, f et g é t a n t 211s , <¿> et \f/ le théorème de P l a n c h e r e l donne :

(Cf|g) = / s(w)

<¿>( oú )

i//(œ) du .

d

_ o o

s (oj) étant b o r n é il v i e n t :

r

(Cf |g) < kj

J

^(o)) JM do)

et d'après l'inégalité de C a u c h y - S c h a w a r z :

( C f | I ) < k J | * | | ||*|| .

Comme || <¿>|| = /211 || f || on a :

(Cf|g) < C II f II . Il g II donc C est b o r n é .

Cependant le n o y a u C ( t - s ) ne d é f i n i t pas une fonction de carré i n t e g r a - b l e sur (R x (R et par c o n s é q u e n t C n'est pas de H i l b e r t - S c h m i d t .

On p o u r r a i t u t i l i s e r l'analyse spectrale des opérateurs n o r m a u x bornés des espaces de H u b e r t , c e p e n d a n t il est plus utile d'employer l'analyse spec- trale de G e l f a n d - V i l e n k i n [30] p o u r les opérateurs n o n b o r n é s (mais v a l a b l e aussi pour les b o r n é s ) car on a b e s o i n de considérer des fonctions propres

(22)

comme e ^ * " qui n ' a p p a r t i e n n e n t pas à L^(|R) .

O n a en effet la

P r o p o s i t i o n 1-6

Les fonctions exponentielles imaginaire e1 U ) t sont fonctions propres généralisées de C associées aux v a l e u r s propres À =211 s (o)) .

0)

En effet on v é r i f i e que :

/ nf. s 1U)S ,

f

n

,

v 103 (t-x)

/ C(t-s) e ds = / C(x) e dx

= e / C ( x ) e dx = e 211 s

(co) .

U — 00

L a transformée de F o u r i e r inverse de la densité spectrale exprime donc la covariance à l'aide de la densité spectrale :

/

+ 00

s(o)) e do)

et on v é r i f i e de m ê m e que la d é c o m p o s i t i o n de K a r h u n e n - L o è v e , désormais sous forme i n t é g r a l e , s'identifie à la r e p r é s e n t a t i o n de C r a m e r .

Les problèmes de convergence des analyses sur u n intervalle [-T/2,T/2]

lorsque T tend vers l'infini ont été résolus p a r GRENANDER et SZEGO [29] qui ont m o n t r é la c o n v e r g e n c e des solutions de l'équation :

A T / 2

/ C ( t - s ) f(s) ds = A f ( t )

vers les fonctions trigonométriques el a ) t .

Ils ont aussi donné les résultats suivants concernant la r é p a r t i t i o n des v a l e u r s propres de l'équation p r é c é d e n t e .

Cette d e r n i è r e admet une infinité dénombrable de v a l e u r s propres car C est compact et il n'existe q u ' u n n o m b r e fini de v a l e u r s propres X telles que a < X < b où [a,b] e s t u n i n t e r v a l l e n e contenant pas l'origine. L o r s q u e T "

tend vers l'infini ce n o m b r e tend lui-même v e r s l'infini cependant le rapport

n o m b r e de À G [ a,b ] . , i • • «. n - n j

- - tend v e r s u n e limite p r o p o r t i o n n e l l e a la m e s u r e de

(23)

L e b e s g u e de l'ensemble des u) tels que ^ s (to) < ] . Quant à la plus

grande v a l e u r p r o p r e , elle converge vers ^ SUP s(w) •

On peut a l o r s , théoriquement du m o i n s , définir la r é p a r t i t i o n des v a l e u r s propres qui est u n e m e s u r e absolument continue par rapport à la m e s u r e de Le- b e s g u e . Cette m e s u r e que nous noterons u(X) p e r m e t de donner u n sens à la som- m e des valeurs propres puisque l'on a :

r

+0

°

/ s(io) duo = C ( 0 ) =

a

2 et que X =

21\s (10)

—oo

d'où

J

daj

=J

X du (A) = a2 .

L a d é c o m p o s i t i o n de la v a r i a n c e a2 de selon les composantes principa- les est donc identique à la d é c o m p o s i t i o n spectrale ; on p e u t alors définir la p a r t de v a r i a n c e expliquée par un intervalle [ X ^ À ^ ] •

M a l h e u r e u s e m e n t du(X) est très difficile à obtenir e x p l i c i t e m e n t des tAue la densité s p e c t r a l e , où p l u t ô t sa r e s t r i c t i o n aux w positifs n'est pas bijec- tive car à une v a l e u r p r o p r e X c o r r e s p o n d e n t plusieurs v a l e u r s de co :

.X = 2ÏÏ s(u>)

/ i i i » \ / i

1 1 1 1 1

V

y i i

- ; i :

i « » I ! ! i

Les résultats p r é c é d e n t s g é n é r a l i s e n t des propriétés connues pour les séries c h r o n o l o g i q u e s . Soit en effet un processus à temps discret (X^) où t ^ 21 . La r e s t r i c t i o n à un e n s e m b l e fini de T instants de sa f o n c t i o n de c o - v a r i a n c e est r e p r é s e n t a b l e par la m a t r i c e T x T suivante :

/ C ( 0 ) C(l) ... C(T-l) \

c J C(l) C(0) • C(T~2)

\ C ( T - l ) . . . C(0) J

qui est une m a t r i c e de T o e p l i t z s y m é t r i q u e . On m o n t r e alors (voir [11] [ 2 9 ] ) que les vecteurs propres de C s o n t , si T est g r a n d , a p p r o x i m a t i v e m e n t égaux

(24)

- 2 9 -

aux sinus et cosinus discrets et les valeurs propres de C approximativement 2îTk

égales à 211 fois la v a l e u r de la d e n s i t é spectrale aux points — — • Plus p r é c i s é m e n t soient u ^ et v ^ les v e c t e u r s dont les composantes sont respecti-

, / T 2 ï ï j k . / T . 2 n j k - n i m 1 • ~ -,

v e m e n t y — cos — ^ — et y — sin — p o u r j = 0,1,...,T— 1 ; soit Q la matrice dont les v e c t e u r s colonnes sont u„ et les u, et v, pour k = 1, 2 , . . . ,m (on

t — 0 — k — k

suppose ici T = 2m+1) alors Q C Q 2IÏD où D est la m a t r i c e diagonale d:é l é ~ m 0 0

2JIk

ments d. = s ( 0 ) , d = d = s (——) où s est la densité spectrale de (X ) . k k+1

1. 3 . c) E x e m p l e _ j__le procès sus _de_Markov

- a It-s

I

Soit un processus d o n t la fonction d'autocorrélation est C(t,s) = e 1 '.

On sait qu'une telle f o n c t i o n caractérise les processus de Markov s ta- tionnaires ( [ 2 2 ] p . 2 3 4 ) . P r o l o n g é sur ] - œ5+ o o [ ce processus admet une densité spectrale égale à . Son analyse en composantes principales sur [C,T]

n ( a2+ u )2)

r e v i e n t à résoudre l'équation :

X f (t) = f e "0 1^ "5! f (s) ds .

Le traitement est c l a s s i q u e [ 5 3 ] et se ramène après deux dérivations à 1 é q u a - tion d i f f é r e n t i e l l e :

f"(t) = [ a2 - ] f (t)

et en p o s a n t a2 - = _ùj2 (o n m o n t r e que cette quantité est toujours négati^

2a

v e ) soit X = , on trouve que les seules valeurs possibles pour w sont a2

+ ùo

2

les racines positives co. , œ0, ... de l'équation tg œ T = ^a a )

i l

2 2

Les fonctions propres n o r m a l i s é e s sont alors :

f

k

( t ) =

V ï ^ s i n ( .

k

( t - f )) .

C e p e n d a n t ici les X^_ sont des valeurs propres s i m p l e s .

(25)

Examinons r a p i d e m e n t les résultats n u m é r i q u e s obtenus dans des cas s i m p l e s . p i e s .

Tout d'abord prenons T = II et a = 1 . Les racines oj sont les abscisses 2x

positives des points d'intersection de y = tg II x avec y = — • = — x - 1

1 ! H i

\ \ \ J | / w! = 0 - 6 3 8 3 X = 1 . 4 2 45%

/ ' ' / ' ^2 = K 3 95 8 X

2

= 0 , 6 7 8 22%

/ 1 j l\\ " > 4 ^ _ / u = 2 . 2 6 4 7 X3 = 0 . 3 2 6 10%

/ L} y j |q)2 / \ J& ^ y f o ) ^ o>4 = 3 . 1 9 3 2 X4 = 0 . 1 7 9 6%

\ j ; /'i 1 | / 2 j / 3 * u>5 = 4 . 1 5 0 5 X5 = 0 . 1 10 3 , 5 %

Les p o u r c e n t a g e s de v a r i a n c e expliquée sont faibles car a est relative- m e n t grand et les variables et -Xg sont rapidement n o n corrélées dès que

|t-s| est grand.

A v e c un coefficient a plus faible correspondant à une plus forte dépen- dance on trouve b i e n sûr des composantes de plus grande v a r i a n c e .

A u s s i avec a = 0.1 on trouve :

a>1 = 0 . 2 4 5 9 A = 2 . 8 4 90%

2 = 1 . 0 5 9 9 X2 = C , 18 6%

w3 = 2 . 0 3 1 3 X3 = 0 . 0 5 2%

a), = 3 . 0 2 1 1 A, = 0 . 0 2 1% . 4 4

L o r s q u e T augmente les U K se r e s s e r r e n t et d e v i e n n e n t de plus en plus denses ce qui traduit i n t u i t i v e m e n t les résultats énoncés au p a r a g r a p h e p r é - d é d e n t ,

P o u r T = 0 0 on trouve alors que les solutions de l'équation ;

f e- a | t - s | f(g) dg = x f(t) J

0

(26)

- 3 1 -

sont f(t) = o) eos o) t + a sin 03 t , soit À u n facteur près :

et +

f ( t ) = cos(ü)t-<¿?) avec tg <¿> = — p o u r tout UJ £ ÍR . Les "valeurs propres1*

0 )

2a

associées sont À = et sont toutes s i m p l e s .

U) 2 • 2

az+ o jz

C'est s e u l e m e n t si l'on fait l'analyse factorielle sur ]--oo^+oo [ que l'on retrouve e x a c t e m e n t la d é c o m p o s i t i o n spectrale : les v a l e u r s propres sont alors doubles car elles correspondent aux deux v a l e u r s opposées + w et sont alors associées aux e o s w t et s i n w t »

2

L'ensemble des valeurs propres est alors compris entre 0 et —

1.4 Cas d'une p o p u l a t i o n finie

1.4.a) Généralités

Si Q est un ensemble à n éléments muni de la mesure de probabilité u n i f o r - m e , on est dans le cas statistique u s u e l où on a observé n t r a j e c t o i r e s . On supposera la m o y e n n e d'ensemble n u l l e :

i

n

m ( t ) = -

L

x. (t) = 0 V t .

n i-1 1

La fonction de covariance C ( t , s ) est alors :

1 n

C(t,s) = - I x.(t) x.(s) . n . . 1 1

1 = 1

Le n o y a u de C étant une somme de produits de fonctions de t et de s est. d é g é n é - ré et C est de rang fini ce qui entraîne l'existence de l'analyse en composantes principales de (X^) sans h y p o t h è s e s de régularité sur le p r o c e s s u s .

L'opérateur d'Escoufier W est alors r e p r é s e n t a b l e par une m a t r i c e carrée n x n , p u i s q u e (Q) est isomorphe à [Rn , de terme général :

T

0

On p e u t alors obtenir d i r e c t e m e n t les composantes principales qui sont des vecteurs ^ à n composantes comme vecteurs propres de W et retrouver e n s u i t e , du

(27)

m o i n s en t h é o r i e , les facteurs p r i n c i p a u x comme combinaisons linéaires des t r a j e c t o i r e s . En effet l'équation :

f C ( t , s ) f(s) ds = X f(t)

s'écrit :

X f(t) = / - E x. (t) x. (s) f(s) ds = - E x. (t) f x. (s) f(s) ds

Jo

n i=i 1 n i=i 1

JQ

1

soi t

1 n

X f (t) = — E x. (t) c. , n . . 1 1

1 = 1

Les coefficients c. s'obtiennent en r é s o l v a n t le système de Cramer obtenu i

en m u l t i p l i a n t par xj (t) ^es deux membres de la relation p r é c é d e n t e et en inté- grant sur t :

f

X x.(t) f(t) dt =

C -

E x. (t) x.(t) c. dt

J

0 J "

J

Q n .=1 1 J 1

r

1 i

soit A(.Ç). = E ( / - x . (t) x.(t) dt) c. = (Wc) .

- J i=1

J

0 n i j i - j

d'où C = £ r é s u l t a t classique en analyse des d o n n é e s .

La m é t h o d e p r é c é d e n t e n'est autre en fait que la traduction en termes statistiques de la m é t h o d e classique de r é s o l u t i o n des équations de E r e d h o l m à n o y a u x dégénérés ([35] p . 5 4 ) .

Bien s û r , si n est très g r a n d , cette m é t h o d e est impraticable m ê m e en sup- p o s a n t effectuée l'évaluation n u m é r i q u e des intégrales p e r m e t t a n t le calcul de

. On cherchera p l u t ô t à discrétiser le temps afin d'approximer l'opérateur C par une m a t r i c e de taille p faible (voir p a r a g r a p h e I I I ) .

1.4.b) Analyse_de_pÍ!£sieurs_courbes_ :_dualite_et_centrage

Si on dispose d'un ensemble de n courbes x^(t) avec i = l,2,...,n et t £ [0,T] d o n n a n t par e x e m p l e l'évolution des températures dans n stations ou celle des p r i x de n produits deux conceptions sont possibles pour effectuer une a n a l y s e factorielle : soit chaque courbe est u n e trajectoire d'un p r o c e s - sus et on se trouve dans le cadre de l'analyse en composantes p r i n c i p a l e s d:u n

(28)

processus echanti11oné ; soit on considère qu'on a une observation de n v a r i a - bles au cours du temps c'est-à-dire une série chronologique m u l t i p l e . Ce p o i n t de v u e est justifié si les courbes r e p r é s e n t e n t des évolutions de caractères d i f f é r e n t s . On est alors conduit à une A . C . P . sur n v a r i a b l e s , la p o p u l a t i o n étant l'ensemble des i n s t a n t s .

Ces deux types d'analyse ne sont pas conceptuellement identiques : la p r e m i è r e cherche des facteurs de d i f f é r e n c i a t i o n entre courbes en fonction de

l'évolution qu'elles traduisent c'est donc une analyse des distances entre c o u r b e s , tandis que la deuxième A . C . P . repose p l u t ô t sur les corrélations et

2 est donc une étude des angles entre fonctions x^(t) de L ( T ) .

Il y a évidemment ^ d u a l i t é " entre les deux types d'analyse qui sont d'ail- leurs identiques si on ne centre pas les données et si on u t i l i s e la m é t r i q u e I dans les deux cas ainsi que le m o n t r e le tableau s u i v a n t .

Courbes " i n d i v i d u s " Courbes ''variables'*

^ ^ ^ ^ ^ analyse " h a r m o n i q u e " A . C . P . C opérateur intégral de V m a t r i c e n x n de terme

F o n c t i o n de n o y a u général covariance

i

n

i r

1

C(t,s) = - E x . ( t ) x . ( s ) v . . = - / x.(t)x.(t)dt

ni = l 1 1 J T

J

0 1 J

U m a t r i c e n x n de terme W opérateur intégral de général* n o y a u Opérateur ^>T i n

d'Escoufier - / x.(t)x.(t)dt - £ x. (t)x. (s)

N J

0

1 J i=l 1 1

• U = - V W = ^ C

n 1

Aux coefficients T et n près l'opérateur d'Escoufier d'une analyse est 1;o p é - rateur de covariance de l'autre et les facteurs p r i n c i p a u x d'une analyse sont les composantes principales de l'autre.

Bien entendu dès qu'on centre les données (et a fortiori avec des m é t r i - ques différentes de I) il n'y a plus i d e n t i t é .

(29)

a) Centrage " h a r m o n i q u e "

A tout instant t les n observations d o i v e n t être de m o y e n n e n u l l e ce qui signifie qu'on étudie en réalité les n courbes :

1 n

x.(t) 1 x.(t) = x.(t) - m ( t ) ce qui revient d'une certaine façon à

i ni=1 j i

éliminer la tendance.

L'opérateur de covariance centré a alors pour n o y a u :

1 n

C(t,s) = - l (x.(t) - m ( t ) ) ( x . ( s ) - m ( s ) ) n . , i i

1 = 1

et l'opérateur d'Escoufier est la m a t r i c e W de terme g é n é r a l :

w. . = - f (x. (t) - m ( t ) ) ( x . ( t ) - m ( t ) ) dt .

i j

n J0

i

j

b) C e n t r a g e A . C . P .

Les courbes étant considérées comme des variables on retire à chacune sa

i r

T

valeur m o y e n n e sur la période c'est-à-dire m. = — / x.(t) dt .

1 JO 1

La m a t r i c e de covariance V a alors pour terme général :

v. . = / (x. (t) - m. ) (x . (t) - m . ) dt .

Il est clair que cette opération n'élimine pas en général la tendance et que dans b i e n des cas on trouvera un premier facteur trivial lié à la c h r o n o - logie si les courbes v a r i e n t de m a n i è r e s e m b l a b l e .

Les deux types de centrage n e seront équivalents que si les m o y e n n e s tem- p o r e l l e s sont égales aux m o y e n n e s d'ensemble ce qui est le cas si on a observé n trajectoires d'un p r o c e s s u s stationnaire et e r g o d i q u e .

Références

Documents relatifs

 Si les parties entières et les chiffres des dixièmes sont égaux, le plus grand nombre est celui qui a le plus grand chiffre

Lever la main pour demander la parole.. Être calme et

Mitkov (Eds), Anaphora processing: 1 Linguistics, Cognitives and Computational Modelling, 283-300, 2005,. which should be used for any reference to

On désigne par x le salaire d'un employé en décembre 1998 et par y son salaire en janvier 1999. la figure 2 image du triangle 1 par la symétrie de centre O,. la figure 3 image

le maximum de la valeur absolue de la dérivée p-ième de f sur l’intervalle

Enfin dans la troisième partie nous signalons quelques conséquences de ce résultat en précisant le module de continuité de U(e) lorsque le module de continuité de

En effet, le point A se situant dans le phare, soit à une hauteur plus élevée, possède un champ de vision plus étendu, comparé au point B, qui, depuis un endroit plus bas, en

Donner la liste des personnes « chef de projet » dont le salaire annuel est supérieur à 40000 euros ou dont le salaire annuel avec la prime annuelle est supérieur à 40000 euros