• Aucun résultat trouvé

Zoon - Infornât ion <

Dans le document Disponible à / Available at permalink : (Page 88-96)

La fenêtre centrale donne le nombre total de valeurs extrêmes observées au niveau 5 %, ainsi qu'un nombre minimum de valeurs extrêmes tolérables, qui représente en fait 5 % du nombre des observations. Ce dernier nombre est donné uniquement à titre indicatif et représente le nom­ bre moyen de valeurs extrêmes observées dans le cas d’un échantillon aléatoire et simple. L'autocorrélation des séries chronologiques a pour conséquence une augmentation parfois sen­ sible de ce nombre moyen. CHRONOS propose dans la fenêtre inférieure une série d'interven­ tions destinées I traiter les valeurs extrêmes les plus grandes. Le nombre des interventions proposées est fonction de deux facteurs :

- l'amplitude des valeurs : les valeurs correspondant â un niveau inférieur à 0,2 % sont systé­ matiquement traitées;

- le nombre des valeurs : CHRONOS ramène le nombre de valeurs non traitées au nombre minimum tolérable.

Ce deuxième facteur peut conduire à un nombre trop élevé d'interventions et à une surparamé- trisation du modèle. CHRONOS avertit l'utilisateur de cette éventualité. Dans tous les cas, ce dernier est libre de modifier la liste proposée.

CHRONOS sélectionne des interventions de type I ou 0 de façon à minimiser le nombre de paramètres introduits dans le modèle. Les opérations de différentiation peuvent multiplier le nombre de valeurs extrêmes (Fig. 4.17). CHRONOS détecte les liens éventuels entre les dif­ férentes valeurs extrêmes détectées. L'algorithme suivant est utilisé :

Fig. 4.17. -tant qu'il y a des valeurs à corriger :

. choisir la valeur extrême la plus significative; . ^ la série a été différenciée alors

. rechercher des liens éventuels avec d'autres valeurs extrêmes; . Si^ des liens existent alors

proposer une intervention de type I sur la plus ancienne des valeurs trouvées ;

Sinon

proposer une intervention de type 0; Sinon proposer une intervention de type D.

Dans l'exemple de la série G, CHRONOS propose une intervention de type I en t = 29. Etant donné les deux différentiations effectuées lors de l'étape précédente, les valeurs obser­ vées en t = 30 et t = 42 sont fonction de la valeur de la série brute en t = 29. En corri­ geant cette dernière valeur, on réduit également les problèmes rencontrés en t = 30 et t = 42.

3° §t§B§_3_i.SBéçifiçatign_gar_la_méthode_du_çoin :

La méthode du coin (Béguin et al, 1980) permet de déterminer les ordres p et q des parties autorégressive et moyenne-mobile d'un processus ARMA (p,q) stationnaire. CHRONOS fait appel à ANSECH pour l'application de la méthode. Les résultats sont récupérés sous la forme d'une liste de modèles possibles qui est ensuite traitée au moyen de la méthode PROMETHEE.

a. La méthode du coin

La méthode repose sur un théorème démontré par Béguin, Gouriéroux et Monfort (Béguin et al, 1980) :

Théorème : Un processus stationnaire du second ordre admet une représentation ARMA(p,q) mi­ nimale ssi

(a) A(i,j) = 0 vi > q et j > P,

(b) A(i,p) 0 vi > q. (4.6) (c) A(q,j) 0 Vj > p;

où A(i ,j) (i > 1 j > 1) est un déterminant d'ordre j, défini comme suit :

Pi Pi-i • • Pi-j+1

A(i.j) = Pi+1 Pi ‘’i-j+B ) (4.7)

Pi+j-1 Pi+j- 2 ... Pi

(P|^ est le coefficient d'autocorrélation de délai k de X^).

Les conditions (4.6) correspondent à la présence d'un coin de zéros dans le tableau formé par les A(i,j) (cf. Fig. 4.18, les x représentant des éléments non nuis); la position du coin in­ dique les ordres p et q.

En pratique, les pj^ sont estimés à partir de la série observée ; soit rj^ l'estimateur de p|^; et les A(i,j) sont estimés

Fig. 4.18.

pas aux conditions (4.6). Il faut alors étudier la distribution échantillonnée des A(i,j). Considérons le vecteur aléatoire /n(rp r2» .... r|^)' (K e 2'*'). La matrice de cova­ riance asymptotique R|^ correspondante est donnée par la formule de Bartlett (en supposant que les cumulants d'ordre quatre sont nuis) :

Rk = (r^,) (4.7a) avec : •“kt " ^i-k ^ Pt^k ■ ‘’j.Pk ^o^ ’ OU : -kX3 ^k ° ^-k = . ^ Ph'^h+kh=-oo

Cette matrice peut être estimée en remplaçant P|^ par uJ|^ ^ rj^ et par : n-k-1

(4.7b)

(4.7c)

' i=-n+l “t+k,n '’î, ""t+k’ (4.7d) où les poids u, „ = u(tb^) permettent d'obtenir une matrice = (r^J semi-définie positive

(Mélard et Roj par exemple :

“t,n “'-“n' --- --- --- ''K ■ ^'kt^

(Mélard et Roy, 1984, 1987). Les poids sont calculés au moyen d'une fonction positive üj(x).

ü(x) = max {1 - |x|, 0}, (4.7e) (fenêtre de Bartlett), ou j(x) = 1 - 6x^ + 6|x|^ 2 (1 - |x|3) \ ' Ix| < 1 1 ^ < I X

I <1 ,

1 < Ixl

(fenêtre de Parzen). La suite des nombres b^ est choisie telle que

(4.7f) lim = 0 n.*oo En pratique, on prend : 1 et lim nb^ = ». n+a> ' R/iï , R = 1 ou 3. (4.7g) (4.7h) De plus, on peut montrer que la distribution de >^(rp ..., r|^) ' est asymptotiquement normale multivariée de moyenne v^(p,, ..., p|^)' et matrice de covariance R|^.

Nous pouvons déduire de ce résultat la distribution asymptotique de tout sous-ensemble fini d'éléments â(i,j).

89.

De façon générale, la matrice de covariance asymptotique d'un vecteur mxl VrT a dont les composantes sont A(iu, j.) (h = 1,2,...,m) est de la forme AR„A', où A est une matrice mxK dont l'élément (h,k) est d|^(ij^, j^) =--- ^--- , et R|^ est la matrice de covariance

asympto-“'pk tique de i/n (r^ '.

Il est alors possible de tester la nullité des A(i^, j^) (h = 1... m) : sous cette hypothèse (A(i^, jj^)= 0 ,h = 1, ..., m), la distribution de /n  est asymptotiquement normale multivariée de moyenne nulle et de matrice de covariance ARj^A'.

Nous avons participé â des améliorations de la méthode et â son implémentation dans ANSECH (Mareschal et Mélard, 1988). L'algorithme mis au point présente les caractéristiques suivantes :

Le calcul des A(i,j) est effectué de façon très rapide, grâce â l'utilisation de la relation de récurrence suivante (Pham, 1984) :

Â(i,j) = j^Â(i,j-l)^ - A(i-1, j-1) A(i+l,j-l)j /Â(i,j-2), (4.8) i =0, 1...K-j+1; j = 2, 3...K;

oü K € 2'*’ est fixé et A(-l, j-1) = a(1, j-1). Les valeurs initiales utilisées sont les sui­ vantes :

A(i,0) =1 et Â(i,l) = r^ , i = 1, ..., K. (4.9)

2. Deux séries de tests statistiques sont effectués sur les A(i,j). Tout d'abord, des tests individuels de nullité des A(i ,j)(A(i ,j) = 0 contre A(i,j) ^ 0, pour i et j fixés) ?

partir de statistiques t(i,j) :

t(i.j) = AlLil , (4.10)

a(iJ)

a (i,j) est un estimateur de la variance asymptotique de A(i,j). t(i,j) a une distribu­ tion asymptotiquement normale sous l'hypothèse nulle. De plus, il est possible de tester si­ multanément la nullité de trois éléments A(i,j), A(i+l,j) et A(i,j+1) (en forme de coin, cf. Fig. 4.18b) â partir de la forme quadratique suivante :

x(i,j) = n f'(i,j) i:(i,j)'^ r(i,j), (4.11) où r(i,j) = (A(i,j), A(i+l,j), Â(i,j+1)' et r(i,j) est un estimateur de la matrice de covariance asymptotique de f(i,j).

2

Cette forme quadratique a une distribution X3 sous l'hypothèse nulle.

rN. j j+1

i (i.j) (i.j+1) i+1 P+i.Jl

Fig. 4.18b

-Le calcul des a(i,j) et î(i,j) fait appel aux dérivées des A(i,j) par rapport aux r|^. En dérivant la relation (4.8), nous obtenons une nouvelle relation de récurrence pour les dé­ rivées d|^(i,j) des 4(i,j) par rapport aux rj^ :

d|^(i.j) = [2 4(i,j-l) d|^(i,j-l) - A(i+l,j-l) d|^(i-l,j-l) - a(i-l,j-l) d|^(i+l,j-l) - A(i,j) d|^(i,j-2) avec comme valeurs initiales :

/A(i ,j-2). (4.12)

d|^(i,0) =0 et d|^(i,l) = 5^,^. (4.13) Nous obtenons alors l'expression suivante pour a^(i,j) :

:2/ K K . . .

c^(i,j) = I I d.(i,j) r. d (i,j), k=l t=l *■

(4.14)

La matrice 2(i,j) de (4.11) est donnée par :

E(i .j) = A R„ A', (4.15) ou A est une matrice 3xK dont les éléments de la k colonne (k = 1, .... K) sont d|^(i,j), pmp d|^(i+l.j) et d|^(i,j+l) et R|^ est une matrice KxK.

3. Les probabilités de signification des différents tests sont calculées par le pro­ gramme.

£. Des tableaux triangulaires KxK sont générés en lieu et place des tableaux rectan­ gulaires de la méthode originale. Cette disposition est rendue possible par le type de ré­ currence utilisé et permet d'identifier des modèles d'ordre plus élevé (par exemple, des mo­ dèles saisonniers). La figure 4.19 montre une sortie typique de ANSECH. Le tableau des pro­ babilités de signification associées aux t(i,j) est suivi d'une liste de modèles possibles. Ces modèles sont obtenus en considérant différents niveaux de probabilité (cf. procédure CORNER dans (Mareschal et Mélard, 1988)). Un même tableau est obtenu pour les

x(i>j)-F

ig

.

4 .1 9 .

-CORNCH neTHOD »Ca-AUTHOR; B. HARESCHAL) <:C>

OrTXONS ; rARXCN WINDOM TRUNCATBD AT 12. TOLERANCE - l. OOE-01

T-STATlSTlCa RROBASILITY Or SIONIPICANCE IN 7. ( *** - NON SIGNIFICANT AT 107.)

. P. !, O. . 1. . . 2. . . 3. . . 4. . . 3. . . 6. . . 7. . . 8. . . 7. . 10. . l 1. . 12. . 13. . 14. . 13. . 16. . 17. . IB. . lY. . 20. . 21. . 22. . 23. . 24. . 23. 1 } *•* #*• 3. 2 3. 7 *** 4. B *** . B *** *** O. O *** *** **• 3. O *** 7. 6 3. 3 6. O *** **♦ O. O

2 ! ••• ••• •«* »•* *** . O *** *** *** »** *♦* **» **♦ •** *** *** *** . 1

3 ! 3. B «*• *** *4* *♦* *** ♦** *** *♦* *** 4. 3 B *•* *** **♦ *** *** *** *** •** *** •** •** 4 ! 4. 2 ••• *** tt*» »** *** 4. B ••• ••• ••• **• ••• ••• ••• 3 ! ••• ••• ••• ••• *** •*» «•« •*« *•* ••• *** ••• ••• ••• ••• ••• ••• 6 ! 7 ! B ! 7 ! 10 ! 11 1 12 ! 13 ! 14 ! 13 ! 16 ! 17 ! 18 ! 17 ! 20 ! 21 ! 22 ! 23 ! 24 ! #«• 23 ! • •• PROBABILITY

LEVEL (7.) CANDIDATE; ARMAIP, 0) MODELS

20. 0000 1 0. 24) ( 2. 23) ( 3. 13) ( 4. 12) (12. 0) 10. 0000 ( 0. 24) ( 2. 12) ( 4. 1 ) ( 12. 0) 3. oooo ( 0. 24) ( 2. 12) ( 4. 1 ) ( 8. 0) 2. oooo < 0. 24) ( 2. 12) ( 3. O) 1. oooo ( O. 24) ( 2. 12) ( 3. 0)

,

3000 ( 0. 24 ) ( 2. 0) 2000 ( 0. 24) ( 2. O)

,

lOOO ( O. 24) ( 2. 0) OlOO ( 0. 24) ( 1. 12) ( 2. 0)

,

0010 ( 0. 24) ( 1. 0)

0001 ( 0. 24) ( 1. O)

Malgré l'efficacité de l'algorithme, le temps de calcul des x(i.j) reste élevé, parti­ culièrement sur micro-ordinateur. Pour cette raison, CHRONOS utilise uniquement les statisti­ ques de Student t(i,j). L'expérience acquise avec ANSECH a par ailleurs montré que les t(i,j) fournissent en général des résultats comparables à ceux des

B. Traitement multicritère :

CHRONOS appelle le programme ANSECH pour utiliser la méthode du coin et récupère la liste des différents modèles obtenus à partir des statistiques de Student. Ces modèles sont ensuite rangés par CHRONOS, en utilisant la méthode PROMETHEE. Cette approche générale repose sur de premiers travaux encourageants (Mareschal, 1986).

Cinq critères de sélection sont considérés. Pour chaque modèle proposé (p,q), CHRONOS calcule ;

©

©

une estimation np du nombre de paramètres autorégressifs non-nuls du modèle : Op est égal au nombre de coefficients d'autocorrélation partielle <l>|^|^(k < p) qui sortent des limites de confiance â 95

une estimation n^ du nombre de paramètres non-nuls de type moyenne mobile ; n^ est égal au nombre de coefficients d'autocorrélation r|^ (k < q) qui sortent des limites de confiance;

©

©

©

le nombre n^^ de niveaux de probabilité auxquels le modèle est proposé; le niveau de probabilité maximum auquel le modèle est proposé; le niveau de probabilité minimum auquel le modèle est proposé.

Les deux premiers critères (Op et n^) représentent le principe de parcimonie; ils sont â minimiser. Les trois autres critères permettent d'apprécier la netteté du coin dans le ta­ bleau des t(i,j) ; si le coin est bien marqué, le modèle correspondant apparaîtra à pratique­ ment tous les niveaux de probabilité; n. doit donc être maximisé, t doit également êtreX,

iTlaX

maximisé et i.mi n être minimisé.

La méthode PROMETHEE II permet de ranger les différents modèles proposés en tenant compte de ces deux aspects. Les caractéristiques-des différents critères et leurs poids peuvent être modifiés par l'expert dans le menu de configuration de CHRONOS, de façon à modi­ fier la stratégie de classement (par exemple, pour favoriser des modèles de type AR purs). Par défaut, CHRONOS assigne des poids égaux aux cinq critères, ce qui donne une légère priori­ té au deuxième groupe de critères { @ et (|) ) par rapport â la parcimonie. Ce com­ promis semble raisonnable au vu des résultats numériques obtenus.

La liste de modèles obtenueest présentée â l'utilisateur (Fig. 4.20), de même que les fonctions d'autocorrélation et d'autocorrélation partielle de la série. CHRONOS propose à ce moment de passer â l'étape suivante et d'utiliser les résultats fournis par la méthode du coin.

93.

to

Dans le document Disponible à / Available at permalink : (Page 88-96)

Documents relatifs