• Aucun résultat trouvé

LA PREVISION ET L’ANALYSE HARMONIQUE

Dans le document en fr (Page 51-55)

IV-1) ADAPTATION DE L’ANALYSE HARMONIQUE AUX PROBLÈMES DE LA PRÉVISION D’UN PROCESSUS:

Nous avons vu que l’analyse harmonique permet de décrire un ensemble de trajectoires interprétées comme la réalisation d’un processus. Le processus est estimé par la matrices des données { X(,t) } ou  parcourt l’ensemble des individus et t l’ensemble des instants observés. Les fonctions propres et les valeurs de l’opérateur de covariance sont les éléments principaux de cette analyse. Les valeurs propres indiquent le « poids » du vecteur propre correspondant dans l’analyse. La variation des vecteurs propres (croissance, périodicité, ....), apportent l’information sur l’évolution du processus en fonction du temps. Les coefficients de projection de chaque trajectoire du processus marquent l’influence de chaque composante temporelle sur la réalisation étudiée. Dans la mesure où on travaille sur des processus centrés il ne faut pas oublier l’information apportée par la fonction moyenne.

Précisons le vocabulaire de l’analyse harmonique en fonction des remarques ci- dessus et de l’analogie avec l’Analyse en Composantes Principales. Par définition, le couple ( fonction propre / valeur propre) s’appellera composante temporelle du processus . Nous parlerons de la composante temporelle de rang 1 (respectivement de rang 2,3,4,...,p) pour désigner une des deux fonctions propres normées associées à la première valeur propre (respectivement 2,3,4,...,p valeur propre).

Pour que la description du processus, proposé par l’analyse harmonique soit meilleure que l’observation directe des trajectoires, il faut que le nombre de composantes temporelles soit nettement moins important que le nombre total de trajectoires Remarquons en premier que l’analyse harmonique est liée à la diagonalisation de la matrice de covariance qui dépend, dans sa dimension, du nombre d’instants p pris en compte et non du nombre n des individus (nombre de trajectoires).

Malgré cette observation, si la prise en compte de l’ensemble des composantes temporelles étaient obligatoires, l’analyse harmonique perdrait de son intérêt !!!

Au paragraphe II_2_c) nous avons rappelé qu’il est possible de remplacer le processus X par la somme Y des p processus élémentaires de telle façon que le résidu Z , différence entre X et Y, soit uniformément négligeable. Cette nouvelle observation permet de réduire ainsi le nombre de composantes temporaires à observer. Dans les exemples concrets ce nombre se réduit à 4 à 7 suivant les cas. Il ne faut pas oublier que ce dernier résultat est une conséquence du théorème de Mercer et suppose la continuité du noyau de covariance. Nous reviendrons plus en détail sur cette observation en montrant dans le cas de l’analyse harmonique, que les résultats sur l’approximation uniforme du processus restent valable sans hypothèse de continuité.

En conclusion :

Le traitement d’un processus par l’analyse harmonique simplifie notoirement le nombre d’informations à analyser au regard du nombre de données brutes; pour nous en persuader il suffit de compter sur un exemple:

Si les données d’un processus comportent 30 périodes d’enregistrement et 100 réalisations; le nombre de données est de 30x100 = 3 000 ( dans l’étude de J.C. Deville un échantillon de 98 795 femmes avait été traité sur une période de 20 ans). Si l’information principale peut être décrite par 7 fonctions propres et la projection de chaque réalisation sur ces vecteurs propres, le nombre de données est alors de 7x100 = 700. Un gain important dans la simplification de l’étude.

Le passage de la description à la prévision d’un processus à l’aide de l’analyse harmonique se fait apparemment d’une façon naturelle en prolongeant les composantes temporelles (c’est à dire dans notre exemple 7 composantes temporelles ) puis en reconstituant chaque trajectoire. L’apparente simplicité de la méthode cache une difficulté théorique importantes. Pour que la technique de prolongement proposée ait un sens il faudrait que les composantes temporelles calculées sur l’intervalle [a,b+h] aient leurs restrictions sur l’intervalle [a,b] identiques aux composantes temporelles calculées sur ce dernier intervalle. Cela est malheureusement connu comme faux car les noyaux de covariance calculés sur les intervalles [a,b] [a,b+h] n’ont pas de relations simples. On pourrait imaginer que les composantes temporelles calculées sur les intervalles [a,b] et [a,b+h] n’aient aucun lien entre elles. Nous allons montrer que si cette situation peut se produire théoriquement, dans la pratique, on peut affirmer que les premières composantes temporelles ont la « même forme ». Cette situation favorable se produira si les valeurs propres sont « bien séparées » entre elles.

En résumé l’analyse harmonique permet de faire la prévision d’un processus en prolongeant un nombre réduit de ses composantes temporelles

Nous allons préciser et démontrer les affirmations ci-dessus dans les paragraphes suivants.

IV-1-a) Notations

Soient a < b <c trois réels on note T=[a,c] , T~=[a,b] , T_=[b,c].

Si f est une fonction définie sur T on note f (respectivement ~ f ) la fonction égale à f sur T~ (respectivement

T

_) et nulle ailleurs.

On remarque alors que f = ~f +f .

Soit X un processus aléatoire défini sur  x T , N(t,t’) son noyau de covariance et U l’opérateur de covariance associé .

On définit X~(respectivement X ) sur T par

X~   ,t

X

,t

( respectivement X 

,t

 X

,t

) pour tout t 

T~

(respectivement t T_ ) et zéro ailleurs.

On définit alors comme d’habitude : N t t~ , ,

 

N t t, 

, ~,U U, les noyaux de covariance et les opérateurs associés à X~et à X .

Le premier théorème que nous allons démontrer indique que la restriction de toute fonction nulle sur l’intervalle T_ a la même image par l’opérateur U ou par l’opérateur U~

. IV-1-b) Théorème n°1 Pour tout g  L²(T) on a :

t t,

T U g t

 ~

 

U g t~ ~  

Démonstration : En effet,

  

 

 

U g t~



T

N t t g t dt, ~

  

 

 

 

 

N t t g t dt

N t t g t dt

T

, ~

T

, ~

~

  

  

 

  

~ , ~

~ ~

N t t g t dt

U g t

T

  

car ~g t

 

est nulle sur

T

_

et, N t t

 

,  N t t~

 

,  sur T T~ ~x ; ce qui termine la démonstration. Le théorème n° 2 évalue l’écart entre l’image d’une fonction par U et l’image de sa restriction par l’opérateur U ; ~

IV-1-c) Théorème n°2

Pour tout g  L ²(T) et pour tout t  ~ T on a :

U(g)(t) = U(g)(t) + v(t) ~ ~

v(t) = N(t, t’) g(t’) dt’ T

Démonstration : Calculons :

U(g)(t) = N(t,t’) g(t’) dt’ = N(t,t’) g(t’) dt’

T T

~

~

N(t,t’) g(t’) dt’ = U(g)(t) + v(t)

T

~ ~

ce qui termine la démonstration

Les résultats du théorème suivant étant acquis nous serons en mesure de démontrer le théorème de Principal

IV-1-d) Théorème n°3

Si f est un vecteur propre de U, presque pour tout t  ~T on a :

U(f)(t) = < f,gi i i N

 ~  ( )

 g t

g

i est une base de vecteurs propres de L ²(T)~

Démonstration:

Si f est un élément de L²(T) et si t  ~ alors T ~f est un élément de L ²(T)~ et f(t) = f(t)~ ; de ce fait : f(t) = f(t) = < f,gi i i N i N < f,gi i ~ ~ ( ) ( )   g t   g t car < f,g~ i  = < f,gi  donc : U(f)(t) = f(t) = f(t) = < f,gi i i N  ~  ~  ( )  g t

Le théorème principal qui suit donne une idée du comportement des vecteurs propres de l’opérateur U en fonction des vecteurs propres de l’opérateur U~; dit autrement, ce théorème situe les vecteurs propres du futur en fonction de ceux du passé. Si f est un vecteur propre de U et  la valeur propre associée à f, plus  sera éloignée d’une valeur propre  ide U associé à g~ i plus

les fonctions propres f et gi seront dans des espaces orthogonaux.

Nous verrons dans les théorèmes suivants que cette situation est plus fréquente que cela ne pourrait paraître surtout sur les premiers vecteurs propres de U.

IV-1-e) Théorème principal :

Soit f un vecteur propre de U et

 gi

une base de vecteurs propres de U ; alors pour tout ~

Dans le document en fr (Page 51-55)

Documents relatifs