R EVUE DE STATISTIQUE APPLIQUÉE
D. H ERNAD
M. M OUILLARD
D. S TRAUSS -K AHN Du bon usage de R/S
Revue de statistique appliquée, tome 26, n
o4 (1978), p. 61-79
<http://www.numdam.org/item?id=RSA_1978__26_4_61_0>
© Société française de statistique, 1978, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
61
DU BON USAGE DE R/S
D.
HERNAD(*),
M.MOUILLARD(*)
et D.STRAUSS-KAHN(**)
(*) Université de Paris X - Nanterre (**) Université de Nancy Il et CREP
Il est assez
surprenant
de mettre enregard l’importante bibliographie
consacrée à
R/S
et lepetit
nombre de ses utilisationsempiriques.
SelonB. Mandelbrot
qui
aadopté, après
l’avoiraméliorée,
une méthodeprimitivement
utilisée par le
nilologue
H.E.Hurst,
ils’agit
là d’ "une inventionstatistique
et(d’)une
découverteempirique remarquable... "[18].
En effet si "... dupoint
devue de la valeur de
H,
toutes les fonctions aléatoiresindépendantes
sont indis-tinguables
etéquivalentes, R/S
a lacapacité
extraordinaire deséparer
lespropriétés
de
dépendance
àlong
terme de X despropriétés
de sa distributionmarginale" [16].
Cependant, malgré
lapuissance
de cet instrumentd’analyse
des séries chrono-logiques
il reste peuutilisé,
enparticulier
en France(exception
faite des travauxde D.
Zajdenweber [28])
et ce endépit
de sasimplicité d’emploi qui
découle deson caractère non
paramétrique.
Peut-être le manque d’intérêtempirique
suscitépar
R/S provient-il
d’unapprofondLssement
nécessaire des conditions d’utilisation de cette méthode. Cet article a pourobjet
d’étudierquelques aspects
de la méthodequi
n’ont été que rarement abordés(voire jamais).
Nous chercheronsainsi,
en cequi
concerne la
technique proprement dite, quel
rôlejoue
le nombre de courbes utilisées ? Comment se servir dudécalage
initial ? Comment obtenir trèssimplement,
parsimulation,
des valeurs de H0,5.
1. RAPPELS SUR LA METHODE
La méthode
R/S permet
de mesurer l’intensité de ladépendance qui peut
exister dans la structure d’une série. Elle repose sur la
propriété
suivante : ladépendance
se traduit par descycles apériodiques
deplus
ou moinslongue durée,
ou(ce qui
revient aumême)
par une corrélation entre la moyenne de lachronique passée
et la moyenne de lachronique
futurequelle
que soit lalongueur
de la série
(1).
1.1. Notions de
dépendance
Mandelbrot
distingue
essentiellement deux notions dedépendance qui,
une fois leursrapports étudiés,
luipermettront
de définir la méthodeR/S (2).
(1) Cette
équivalence
n’est rigoureusement admissible qu’enprésence
dephénomènes
dont les lois marginales sont gaussiennes.
(2) Nous ferons abstraction du concept de R -
dépendance.
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
~2,
1.1.1. La
C-dépendance
Le
concept
deC -dépendance
repose sur la définition d’unequantité, S’(o),
qui
n’est autre que l’estimation de lapuissance spectrale
à lafréquence
zéro(3) :
où
C(k) représente
l’autocovariance de retard k.Mandelbrot(4)
effectue alors une classification des séries enquatre catégories,
selon la valeur
S’(o) :
a)
0S’(o)
~: il y auraC -dépendance
à court terme, ou encoreC-dépen-
dance
finie,
ou encore mémoire courte ;b) S’(o) = ~:
c’est le cas d’uneC-dépendance positive
delong
terme, ouencore d’une
C -dépendance
infiniepositive ;
c) S’(o)
= 0 : onparlera
alors d’uneC -dépendance négative
delong
terme,ou encore d’une
C-dépendance
infinienégative ;
d) S’(o)
n’existe pas : c’est le cas d’une fonctionpériodique.
t
Soient maintenant
x(t)
la série étudiée(5)
etx*(t) = 03A3 x(S),
la nouvelles=i
série obtenue par sommations successives de
x(t).
Soit
V(d)
la variance de la somme de d valeurs successives dex(t).
Elles’exprime
de la manière suivante :Il montre alors que chacune de ces trois
premières catégories
dedépendance
est associée à un
comportement spécifique
deV(d)
en fonction de d :a) V(d)
seraasymptotiquement proportionnelle
à d dans le cas d’une mé- moire courte ;b) V(d)
croîtraplus rapidement
qued,
en cas dedépendance
infiniepositive ; c) V(d)
croîtra moinsrapidement
qued,
en cas dedépendance
infinienégative.
(3) En effet, la puissance spectrale non lissée s’exprime par :
S’(f) Z
03A3
C(k)
e-203C0ifk,
pour toutefréquence
f.Ce qui permet de remarquer qu’il existe un rapport entre la notion de
dépendance
et la formedu spectre considéré ([16], pp. 267-268).
(4) [16], pp. 265-267.
(5) Nous supposerons toujours, dans ce qui suit, que la série x(t) a été
préalablement
centrée [16], p. 268.
1.1.2. La
0393-dépendance
Mandelbrot(6)
montre ensuite que la corrélation entre la moyenne de lachronique passée, X*(- d’) et celle de la chronique future, X*(d)
, sera :
Comme dans le cas de la
C -dépendance,
ilpeut
établirquatre catégories
deséries :
a)
lim r(dh, d)
= 0 pour h > 0 : cas d’une0393-dépendance
finie ou encored~~
courte :
b)
limr (dh, d)
> 0 :-dépendance
infiniepositive ;
d-+oo
c)
limr (dh, d)
0 :-dépendance
infinienégative ;
d-+oo
d)
la limite n’existe pas.1.1.3. Relations entre Cet
0393-dépendances
Mandelbrot propose une classification
unique qui distingue (7) :
a)
la(r
ouC) dépendance
finie ou de courtepériode
ou encore mémoirecourte, c’est le cas d’une série
générée
par un processus de moyenne mo-bile de
longueur finie ;
b)
ladépendance
infmiepositive ; c’est
le cas d’un bruit fractionnairegaussien;
c)
ladépendance
infinienégative.
Bien que cette classification
unique permette théoriquement d’apporter
deséléments de
réponses
à l’étude desdépendances
internes des sérieschronologiques,
un certain nombre de faiblesses semblent
cependant hypothéquer
les conclusionsprécédentes.
En ce
qui
concerne laC -dépendance,
certainesconfigurations particulières
de la fonction d’autocovariance de la série étudiée
peuvent
entrainer une confusionquant
à la véritabledépendance
de la série. Parexemple, lorsque
l’autocovariance deretard j
est de la forme :ou
la
C-dépendance
laisseraprésumer
l’existence d’unedépendance
infiniepuisque
S’Co) = 00
alorsqu’en fait,
il nes’agit
ici que d’unedépendance
de court terme.Par ailleurs les notions de
C -dépendance
et der-dépendance
nes’appliquent qu’au
cas des séries stationnaires au second ordre.Ainsi,
parexemple,
si l’on s’inté-(6) [16], pp. 270-272.
(7) [16] p. 272.
resse aux lois stables au sens de Paul
Lévy,
on mesure immédiatement l’étendue d’une telle restrictionpuisqu’alors,
seul le cas a = 2 est concerné.Pour sa
part,
la méthodeR/S permet
de définir une mesure de ladépendance
utilisable pour presque toutes les lois
(pourvu
quel’hypothèse
destationnarité(g)
soit
vérifiée),
mettant en évidence une absence de mémoire aussi bien pour une série constituée d’aléas deCauchy
que d’aléasgaussiens.
1.2.
Principe
de la méthodeR/S
Le
principe
d’estimation duparamètre
dedépendance
Hqui
caractérise laméthode,
a été mis aupoint
parMandelbrot(9)
et il repose sur le calcul durapport :
sur une fraction de la série
étudiée,
fractioncommençant
en t et delongueur
d(d
sera aussiappelée "décalage").
A
partir
dugraphique proposé
par Mandelbrot dans[16]
etqui
estreproduit ci-dessous,
les définitions de R et S sont les suivantes :GRAPHIQUE 1
t
Si
x(t)
est la sérieétudiée,
on formex*(t) = 03A3 x(s) (10). 0394(u)
est alorsl’écart à
l’interpolation
linéaire de x* entre t et t + d.(8) La stationnarité est ici définie au sens large et concerne les
probabilités
de transition:pour tout t > s, x(t) - x(s) est
indépendant
de s et sa variance nedépend
que de t - s.
(9) cf [15], [17] et [18].
(10) Les
propriétés mathématiques
de x*(t) fondant la méthode sontexposées
dans [6], [24], [25] et [27].On pose :
et
L’apport
de Mandelbrot a consisté àprendre
encompte
une version améliorée de lanotion
d’étendue(relation (2))
au lieu de la définitionclassique employée
parHurst( ) qui
est àl’origine
de la méthode.Le
point
central de ce calcul est que R -qui
est défini sur la variable cumulée x* - combine lespropriétés
àlong,
et court termes de lasérie,
alors queS2, qui
estla variance de la variable x, n’inclut que les
propriétés
de court terme. Sous certaineshypothèses,
lerapport R/S
en contientplus
que lespropriétés
delong terme(12).
En
effet, l’"analyse R/S"
est obtenue àpartir
despropriétés
d’une fonction aléatoire stationnaire définie en transformantx(t)
par la fonctionR(t, d)/S(t, d)(13).
C’est le
comportement
de cettefonction, R/S, lorsque
d ~ 00,qui permet
alors de définir leconcept
deR/S - dépendance qui
est une forme dedépendance
statis-tique cyclique apériodique.
Définition :
Un processus aléatoire satisfaira la loi R ~ c den
moyenne,S
si lim
d-H
E[R(t, d)/S(t, d)]
est définie strictementpositive ([23],
p.982).
d-+oo
Ainsi, asymptotiquement log
E[R/S] s’exprimera,
en fonction delog d,
parune droite de
pente 0,5
dans le cas d’une mémoire courte ; par une droite depente
Hcomprise
entre 0.5 et 1 en cas dedépendance
infmiepositive
et par unepente
inférieure à0,5
en cas dedépendance
infinienégative(14).
Il nous est alors
possible
de proposer unalgorithme
de calcul deH,
en accordavec les
développements qui précèdent.
1.3.
Algorithme
de calcul de HLa série
peut-être découpée
en un certain nombre detronçons
successifs(de longueur d)
conduisant chacun à une valeur durapport R(t, d)/S(t, d).
La valeur(11) Cf "Le Nil", Payot Editeur, Mandelbrot ([16], pp. 280-283) a en effet montré que la notion classique d’étendue ne pouvait être utilisée que dans le cas particulier d’une série x(t) stationnaire en moyenne.
(12) Un exemple trivial pour lequel cette division par S s’avère superflue est celui d’une série constituée d’aléas gaussiens.
(13) Mandelbrot traite, de façon
précise,
de processus stationnaires au second ordrepuisque R(t, d)/S(t, d) ne
dépend
pas de t, cependant il effectue lagénéralisation
de l’emploide la méthode R/S :
- à l’étude de lois stables au sens de
Lévy
[12] dont le coefficientcaractéristique
a estinférieur ou
égal
à 2 : par exemple dans le cas d’une loi de Cauchy, il vérifie bien que H = 0.5 {(18], p. 358).- à l’étude de promenade aléatoire pour laquelle H = 1. De façon
générale,
il noteque R/S s’applique aussi bien à une série pour laquelle
[E(x)]2 = ~ qu’à
une série stationnaire([16], p. 267).
(14) Mandelbrot et Wallis ont en effet montré ([2l], [22] et [23]), que l’intensité de la
dépendance
à long terme qui est donnée par le coefficient H, prend des valeurs comprises dansl’intervalle [0,1].
moyenne de ces
rapports
sera associée audécalage
d(15).
Ainsi parexemple
avecun
décalage égal
à10, l’analyse
étant effectuée sur une série de 1 500points,
on calculera lerapport R(t, 10)/S(t, 10)
de 1 à10,
de 11 à20,
de 21 à30,...,
de1 491 à 1 500. La valeur retenue sera une moyenne
arithmétique
de tous les résul-tats
précédents.
Enrecommençant
le calcul pour différentes valeurs ded,
on obtient une série decouples (R/S, d).
Mandelbrot et Wallisayant
montré que l’intensité de ladépendance
àlong
terme est donnée par le coefficient Hcompris
entre 0 et
1,
et défini par :où C est une constante
positive,
on doit donc s’attendre à une liaison linéaire entrelog R/S
etlog
d. Pour obtenir unerépartition
uniforme de d sur une échelleloga- rithmique,
ses valeurs seront données par :où B est un
paramètre
de transformationlogarithmique(16),
n lepremier décalage utilisé,
et T + 1 le nombre detronçons
retenu pour l’estimation.Pour obtenir une meilleure estimation de
H,
il serait souhaitable derecommencer son calcul
plusieurs
fois àpartir
d’échantillons différents. Dans lapratique
ceci estgénéralement impossible lorsque
l’on travaille sur une série chrono-logique
réelle. Aussi va-t-on constituer un nombre M d’échantillons fictifs enprenant
Mpoints
dedépart
arbitraire de la série. Les "échantillons" ainsi constituéssont donc de
longueur
différente et ne sont pasindépendants.
En
effet,
lajième
courbe a pourlongueur :
et comme
point
dedépart :
Ainsi par
exemple
avec 1.500points (N)
et dix courbes(M),
lespoints
dedépart
de ces dernières s’échelonneront comme suit :1, 151, 301, 451, 601, 751, 901, 1051, 1201,
1351. Deplus,
ensupposant
undécalage
initialégal
à10,
les différentes valeurs deR/S
seraient calculées pour, parexemple,
Iltronçons
delongueur 10, 16, 27, 44, 74, 122, 202, 333,550,
908 et 1500.Et,
de cefait,
ladixième courbe ne fournira que 6 estimations alors que la
première permettait
d’en obtenir 11.
Si pour chacun des M
échantillons,
on met en relation les valeurs desloga-
rithmes de
R/S
avec leslogarithmes
des valeurs de dcorrespondantes
on aboutitau
graphique
2.(15) Cette
procédure
a pour but d’éliminer toute structure déterministe dans la série.Ainsi, si par exemple, la série
présente
une tendance, elle sera estimée pour chaque sous- échantillon étudié etincorporée
dans le calcul de R.(16) B =
log n
1 /T, avec N = nombre de points de la sérieanalysée,
ce qui nousassure que n d(i) N, V i E [0, T].
C’est la
pente
du faisceau des M courbesqui
fournira l’estimation de H.Cette estimation sera d’autant meilleure que ce faisceau se
rapprochera
d’unedroite
unique.
Aussi, afin de rechercher cette droite
unique,
choisissons-nous d’effectuerun
ajustement
linéaire sur l’ensemble descouples (log R/S, log d).
Laqualité
del’ajustement
retenu(c’est-à-dire
.laplus
ou moinsgrande dispersion
du faisceau des M courbesestimées)
sera "mesurée" par l’intermédiaire du coefficient de déterminationr2 (carré
du coefficient decorrélation).
1.4.
L’interprétation
des résultatsConformément aux
analyses précédentes,
la méthodeR/S appliquée
à toutesérie
stationnaire,
doit fournir une estimation de Hproche
de0.5, lorsque
d ~ oo.Or,
enpratique -
et surtout dans le domaine des sérieséconomiques
-. on nedispose
que de séries relativement courtes(moins
de 300points).
Il est doncimpossible
d’étudier la convergenceasymptotique
de H vers 0.5. Par contre, etcomme le fait remarquer Mandelbrot
([13]
à[24]) lorsqu’on applique R/S
avecun nombre de
décalages
fini(par exemple
30décalages
sur une série de 400points
pour
laquelle
sont estimées 10 courbes - cf.annexe)
lareprésentation
despoints
moyens
log R/S,
en fonction delog
d sera telle que :- tout
d’abord, (c’est-à-dire
sur lespremiers points),
il serapossible
d’estimerune droite de
pente
Hcomprise
entre 0.5 et 1 selon lalongueur
de lamémoire
qui
caractérise le processus aléatoire étudié : c’est ce que Mandelbrotappelle
laphase transitoire ;
-
puis, lorsque
ledécalage
sera suffisammentgrand,
une nouvelle droiteapparaîtra
nettement, dont lapente
seraproche
de 0.5(cf. graphique 3).
GRAPHIQUE 2
Plus la mémoire sera
longue,
c’est-à-direplus
la corrélation sera élevée entre x*(-d’)
et x*(d),
moins cette convergence serarapide
etplus
laphase
transitoiresera
longue.
Ainsi Mandelbrot(17)
note-t-il que dans le cas de variables aléatoiresindépendantes (lois
deGauss,
deCauchy
ou loilog-normale),
la convergence est trèsrapide.
Par contre,lorsque
les valeurs de la sériex(t)
sontstatistiquement dépendantes (cas
d’unedépendance
de courtepériode de type
moyennemobile),
la
phase
transitoire estplus longue,
mais la loicd H
tienttoujours asympto- tiquement.
L’analyse R/S peut
donc êtreemployée
pour mesurer lalongueur
de lamémoire,
et pour associer àchaque
série la valeur de Hqui
luicorrespond.
Pour cefaire,
nous proposons debalayer l’espace
desdécalages,
c’est-à-dire d’effectuerplusieurs analyses R/S
d’une même série pour différentes valeurs dudécalage
initial
employé.
L’indicateur dequalité
del’ajustement, r2, permettra
de déceler defaçon approximative
lalongueur
de la mémoire recherchée : il devrait être maximum dès que ledécalage
initial utiliséégale
lalongueur
de lamémoire, pusqu’alors
laphase
transitoiren’apparait
pas sur ungraphique représentant
lescouples (log R/S, log d),
éliminant ainsi laprésence de. la rupture
depente
notéeprécédemment.
GRAPHIQUE 3
Lorsque
ledécalage
initial retenudépassera
cette valeuroptimale,
la valeurde H tendra
progressivement
vers 0.5(18).
C’est d’ailleurs une
procédure analogue
que Mandelbrot propose pour rechercher lalongueur
de la mémoire et estimer par là-même l’intensité de ladépendance
H([23],
p.974).
Il effectuel’analyse R/S
pour undécalage
initial le(17) [23], p. 971-72
(18) Sauf bien évidemment dans le cas d’une promenade aléatoire : dans ce cas H tend
vers 1.
plus important possible.
Ilreprésente
alorsgraphiquement
lescouples (log R/S, log d).
Si unerupture
depente apparait
sur legraphique,
il conclut alors :- que la
longueur
de la mémoire est inférieure audécalage utilisé ;
- que sa valeur
égale
ledécalage
pourlequel
cetterupture
àlieu ;
il estime alors H sur letronçon correspondant
à laphase
transitoire.Si aucune
rupture
depente n’apparaît,
il doit alors recommencer sonanalyse
avec un
décalage
initialsupérieur (si
cela estpossible,
en vertu des conditionsrappelées
enannexe).
Cette
procédure
estcependant
bien lourde vis-à-vis de celle que nous proposonspuisqu’elle
repose sur uneanalyse graphique
des résultats. Et à cetitre,
elleapparait
nettement moinsprécise
etrisque
de conduire à unemultiplication
desexpériences
si larupture
depente
n’est pas directement perçue oulorsque
H estproche
de 1.Quelle
que soit laprocédure
d’estimationutilisée,
les résultats obtenuss’interpréteront
commesuit, compte
tenu de la valeur de H retenue :a) lorsque
la sérieanalysée
estpurement
aléatoire la valeur de H est de 0.5quel
que soit le processusgénérateur.
Cequi
traduit une absence dedépendance
dans la série. La valeur deH,
dans le cas d’une moyennemobile,
avoisine aussi 0.5 une fois laphase
transitoiredépassée ;
b)
à mesure que ladépendance augmente,
c’est-à-dire à mesure que descycles
delong
termeapériodiques apparaissent,
la valeur de H serapproche
de celle d’une
trajectoire
delongue période
et lespectre
de la série mettra en évidence une très fortepuissance
à lafréquence
zéro(cf. [14], [15], [8]
et[11]). La puissance
serainfinie ;
c’est le cas, bien entendutrivial,
de lapromenade
aléatoirequi
est non stationnaire(mémoire infinie),
mais aussi des bruits fractionnaires. En cequi
concerne unemoyenne mobile
simple,
lapente
H ne serasupérieure
à 0.5 que durant laphase
transitoire ;c) lorsqu’en
revanche0 H 0.5, il y a
unedépendance négative
dans lasérie.
L’interprétation
en estplus
délicate. Il semble que celacorresponde
à un processus tel
qu’à
unegrande
fluctuation dans un sens succède unegrande
fluctuation dans l’autre.2. ETUDE DE DIFFERENTS PROCESSUS SIMULES
(H 0.5)
Afin d’étudier les
propriétés
del’algorithme
et de laprocédure
d’estimationproposés,
nous allonsappliquer
la méthodeR/S
à un certain nombre de séries simulées. Nous commencerons par l’étude du cas trivial et non stationnaire d’unepromenade
aléatoire. Nousappliquerons
ensuite la méthode à l’étude de processus stationnaires detype
moyenne mobile et nous verrons ainsi comment ellenous
permet
d’identifier chacun de ces processus.2.1. Simulation d’une
promenate
aléatoireOn a
déjà indiqué
quelorsque
ladépendance
est infmiepositive
le coefficient H vaut 1. Ce casqui
est d’uneinterprétation
aiséepuisqu’il correspond
au processusdes
promenades
aléatoires va nouspermettre
d’étudier certainespropriétés
deR/S.
Nous allons donc
envisager
le processus suivant :soit
Avec un
décalage
initial n = 10(cf.
tableauAl)
la valeur de H esttrop
faible : 0.64. Ceci vient de ce que lespremières
valeurs deR/S,
calculées sur destronçons
relativement courts(10 points,
16points,
27points...)
sont biaisées. Lapente
entre les
points
moyens successifs croit avant de sestabiliser,
aussi ler2
ne vaut-il que0,85.
Lespremières
estimations effectuées sur lestronçons trop petits
nepermettent
pas de saisir correctement l’effet de mémoirepurement
cumulatif.En
portant
ledécalage
initial à30,
on constate une nette améliorationpuisque
H vaut0,88
etr2
=0,98.
Avec undécalage
initialsupérieur
à 100 lapente
vaut 1 : une mémoire au moins
égale,
voiresupérieure
à lalongueur
de la série est mise en évidence.Les résultats obtenus ne sont que très faiblement modifiés
lorsque
l’onconstitue 20 "échantillons"
(M
=20)
àpartir
de la série initiale. Il en est de même si l’onporte
lalongueur
de la série à 4.000points (Tableau A2).
Cet
exemple
montre l’extrêmeimportance
dudécalage
initial utilisé. En selimitant à un
décalage
de10,
on est tenté de conclure à une mémoire relativement faible.TABLEAU A Promenade aléatoire
2.2. Simulation d’une moyenne mobile Le processus
générateur
est de la forme :Les simulations ont été effectuées sur des séries de 1.500
points.
2.2.1. Un
exemple
de mémoirelongue
mais noninfinie :
h = 150.Ici encore, pour mettre la mémoire en
évidence,
il faut que ledécalage
initialne soit pas
trop
faible. On constate en effet(tableau BI)
quelorsque
cedécalage
vaut
10,
la valeur de H n’est que de0,87 (19).
Mais le nombre de
couples (R/S, d)
pourlesquels
ledécalage
est insuffisant pourappréhender
correctement la mémoire est moinsimportant
que dans le cas de lapromenade aléatoire,
aussi la valeur der2
est-elle dès le début assez élevée :0,98.
A partir
d’undécalage
initialsupérieur
ouégal
à70,
la valeur de H et celle der2
se stabilisent : une mémoirelongue
mais non infinieapparait. Aussi,
afin dedistinguer
entre une promenage aléatoire et une moyenne mobilelongue,
il s’avèrenécessaire de faire varier le
décalage
initial.TABLEAU BI
Moyenne
mobile : H = 150N = 1.500
points
2.2.2. Le cas d’une mémoire courte: h = 20
Dans le cas d’une mémoire courte, un
problème symétrique
duprécédent
se faitjour.
L’utilisation d’undécalage
initialtrop important
masque enpartie
lalongueur
de la mémoire. Ainsi on constate sur le tableau B 2 que les valeurs de H et
r2
décroissent sensiblement dès que le
décalage
initialdépasse
lalongueur
de lamémoire. L’existence d’une mémoire courte semble donc très nettement mise en
évidence.
TABLEAU B2
Moyenne
mobile : h = 20 N = 1.500points
(19) Ce résultat est obtenu pour un nombre de courbes (M) égal à 10 ; si on porte M à 20 il vient H = 0,865.
2.2.3. Une simulation intermédiaire : h = 50
Pour les valeurs du
décalage
initialsupérieures
à 50 la situation est la mêmeque dans le cas
précédent,
les valeurs de H décroissent sensiblement.TABLEAU B3
Moyenne mobde:
h = SON = 1.500
points
On
pourrait
s’attendre à ce que pour undécalage
initial inférieur à50,
les valeurs de H soit sous-estimées. Au§
2.2.1. encomparant
les résultats obtenus surune
promenade
aléatoire et sur une moyenne mobile delongueur
150 on asouligné
que, dans ce dernier cas, le nombre de
couples (R/S, d)
nepermettant
pasd’appré-
hender la mémoire à cause d’un
décalage
initialtrop
faible était peuimportant,
cequi expliquait
une erreur moindre que pour lapromenade
aléatoire. Ici cephéno-
mène est encore
plus sensible,
et même avec undécalage
initial de 10 l’effet de mémoirepeut
être correctement mesuré.Ces
quelques
simulations - et un assezgrand
nombre d’autresqui
n’ont pas étéprésentées
ici - donnent à penser que lalongueur
de la mémoire d’une série nepeut
être correctement estimée à l’aide de la méthodeR/S qu’en
faisantsystémati- quement
varier ledécalage
initial. Se contenter d’undécalage
initial faible(de
l’ordre de
10) peut
masquer l’existence d’une mémoirelongue
voire infinie(cf le
cas de la
promenade
aléatoire§
2.1. et de la moyenne mobile delongueur
150§ 2.2.1.).
Demême,
undécalage
initialtrop important
nepermet
pas de saisir unemémoire courte
(cf moyenne
mobile delongueur 20 § 2.2.2.).
Unbalayage s’impose donc ;
lalongueur
de la mémoire semblecorrespondre
audécalage
pourlequel
lavaleur du
r2
est maximum.2.3. L’identification des processus : le rôle de H.
Les simulations que nous avons
précédemment présentées
se caractérisaient parl’égalité
stricte de T et n.Comme nous avons
essayé
de le montrer, une telle démarchepermet
d’estimer lalongueur
de la mémoire du processusanalysé.
Enrevanche,
nous avons pu remar- querqu’il
semblait difficile de caractériserprécisément
ce processus au seul vu de la valeur de H.En
fait,
les divers processusanalysés
seront identifiés par l’intermédiaire des valeurs de Hpour lesquels
les coefficientsr2
sont maximaux.Ainsi,
enreprenant
les simulations
précédentes,
pouvons-nous dresser le tableau suivant :TABLEAU CI
Afin de rendre l’utilisation de la
technique R/S plus aisée,
nous proposonsune référence
empirique
pour différents processus(tableau C2).
Celle-ci a été éta-blie en maintenant constante la valeur du
paramètre
T.Trois remarques
s’imposent :
1)
Les valeurs de H que l’onpeut
retenir en considérant la colonne n =10, correspondent
à cellesauxquelles
conduitl’analyse théorique
de la méthode(§ 1.4.).
2)
Le fait de maintenir la valeur de T constantequelque
soit ledécalage initial
utilisé
(n)
rendcaduque
toute considération relative au rôle du coefficientr2
pour"mesurer" la
longueur
de la mémoire. Eneffet,
l’existence d’unephase
transitoirene se trouve
plus pris
encompte lorsque
ledécalage
initial augmente(§ 1.4).
3) Enfin,
la convergence de H vers 0.5 se trouve illustréequelque
soit le pro-cessus étudié
lorsque
n ~ ~ ; on constatecependant
que la vitesse de convergence diminue avecl’importance
de la mémoire.3. UTILISATION DE
R/S
SUR SERIES COURTESLes
quelques exemples d’application
de cette méthodepubliés
tant en Francequ’aux
U.S.A. concernenttoujours
deschroniques (observées
ousimulées)
dont lalongueur dépasse
le millier d’observations. Ainsi B.MANDELBROT, lorsqu’il
effec-tue des simulations se
plait-il
engénéral
à n’étudier que des séries d’au moins 30 000points. Or,
laplupart
dutemps,
l’économiste n’a à sadisposition
que des séries courtes;hormis
les cours destitres, leur
taille n’excède que rarementquelques
centaines de
points.
Il semble doncparticulièrement
intéressant de tester les pro-priétés
deR/S
sur des séries de 150points
environ(douze
ans en données men-suelles).
Les résultats
qui
suivent ont été obtenus sur les 150premiers points
des sériesqui
ont été utiliséesau §
2.2.1. et 2.2.2. Notons tout d’abordqu’il
n’est paspossible
d’utiliser de
grandes
valeurs dudécalage
initial(n) puisque
la contrainte suivante doit êtrerespectée (cf annexe) :
TABLEAU C2
Référence empirique
pourdifférents
processusDans le cas d’une moyenne mobile à mémoire
longue (h = 150)
les résultats du tableau Dl montrent que lapersistance
àlong
terme semble fortement sousestimée pour les valeurs
possibles
dudécalage
initial.TABLEAU Dl
Moyenne
mobile : h = 150N = 150
points
(1)
non calculableEn diminuant le nombre de courbes
utilisées,
l’existence d’une mémoire ongue mais non infinieapparait
avec force.TABLEAU D2
Moyenne
mobile : h = 150 N = 150points
(1) non
calculable.Les tableaux suivants montrent que
l’analyse peut
aussi être menée dans lecas d’une mémoire courte.
TABLEAU D3
Moyenne
mobile : h = 20N = 150
points
(1) non
calculableN = 150
points
La
proximité
des résultats obtenus ici avec ceux de la section 2.2. sembleindiquer
que l’utilisation deR/S
sur séries courtes n’est pas àrejeter
apriori.
4. CONCLUSION
Dans cet article nous avons tenté
d’apporter
des éléments deréponse
à troisproblèmes
soulevés par l’utilisation deR/S.
a)
Lepoint
leplus important
concerne sans doute la nécessité de faire varier ledécalage
initial afin d’obtenir des estimations de H non biaisées. Au demeurant la variation de la valeurr2
semblepouvoir
fournir une indication intéressante sur lalongueur
de la mémoire du processussous-jacent.
b)
La littérature est assez discrète surl’interprétation
à donner aux valeursde H inférieures à
0,5 (cf [13] à [23]). Toutefois,
le cas H = 0 est presque trivial si on veut bienanalyser l’algorithme
de calcul(§ 1.2.).
Pour que H # 0 il faut et il suffit que la série cumuléex*(t)
soit presque constante ou presque linéaire en t.Ce cas
correspond,
parexemple,
à une série de la forme :soit
ce
qui
donne avec Xt -N -1,
les résultats attendus :TABLEAU D4
N = 1 500
points
L’interprétation
selonlaquelle
ces valeurs de H sont le reflet d’une intensiténégative
semble doncpouvoir
être retenue. Eneffet,
si une valeur de H >0,5 correspond
à unspectre "typique" (cf [1 ], [7]
et[9])
et si une valeurégale
à0,5
conduit à unspectre plat,
on montre facilement(cf [9 ], [10]
et[11])
que H0,5
s’associe à unspectre
inversé dutype
duspectre Q)
dugraphique
4(20).
(20) Une analyse des rapports entre R/S et l’analyse spectrale sera
développée
dans un prochain article.GRAPHIQUE
4Spectres
de trois processus conduisant à des valeursdifférentes
de Hc)
L’utilisation deR/S
semblepouvoir
êtreenvisagée
sur des sériesbeaucoup plus
courtes que celles que l’on utilisegénéralement
pour les simulations(plusieurs
milliers de
points)
et donc unemploi
sur des sérieséconomiques (quelques
centainesde
points)
n’est pas à exclure.ANNEXE
L’estimation de H se fonde sur celle des coefficients
R/S
pour différents déca-lages
et courbes utilisés.La dernière courbe sur
laquelle
s’effectue une estimation deR/S,
necomprend
N
plus
que-points.
Afinqu’il
soitpossible
d’effectuer cette estimation il est alors nécessaire que la condition suivante soit vérifiée :où n
représente
lepremier décalage
choisi.Cependant,
d’une manièregénérale,
il sembleplus justifié
de s’assurer aumoins j
estimations deR/S
pour la dernière courbe. Et ce, afin d’obtenir la meil- leureprécision
lors del’ajustement
du faisceau de courbes. Dans cesconditions,
nous obtenons :
BIBLIOGRAPHIE
[ 1] ADELMAN
I. -"Long cycles :
facts or artefacts ?". AERLV, juin 1965, pp. 444-463.
[ 2]
FAMA E.F. - "Mandelbrot and the stableparetien hypothesis".
Journalof Business, XXXVI,
octobre1963,
pp. 430-429.[ 3]
FAMA E.F. et ROLL R. - "Someproperties
ofsymetric
stableparetien
distribution". Journalof
the American StatisticalAssociation, LXIII, 1968, pp. 817-836.
[ 4]
FAMA E.F. et ROLL R. - "Paremeter ofSymetric
Stable Distribution".Journal
of
the American StatisticalAssociation, LXVI, 1971,
pp. 331-338.[ 5]
FIELITZ B.D. et SMITH E.W. -"Asymetric
Stable Distribution of Stock PriceChanges".
Journalof
the American StatisticalAssociation, LXVII,
pp. 813-814.[ 6]
GNEDENKO B.V. et KOLMOGOROFF A.N. - "Limit Distributions for Sums ofIndependent
RandomVariables", 1964, (traduit
enanglais
par K.L.CHUNG).
[ 7]
GRANGER C.W. - "Thetypical spectral shape
of an economic variable".Econometrica,
XXXIV(janvier 1966),
pp. 150-161.[ 8]
GRANGER C.W. et ORR D. - "Infinite variance and researchstrategy
intime series
analysis". Journal of
the American StatisticAssociation, LXVII, juin 1972,
pp. 275-285.[ 9]
GRANGER C.W. - "New technics foranalysing
economic time series and theirplaces
in econometrics" inEssays
in honor of O. MORGENSTERN Princ. Univ.Press,
1967.[10]
GRANGER C.W. et MORGENSTERN O. -"Predictability
of stock marketprices".
Heath -Lexington Books,
1970.[11] HERNAD
D. et MOUILLART M. -"Analyse spectrale
deschroniques
boursières : la théorie des
promenades
aléatoires". Mémoire deDES,
novembre1975,
Univ. de Parix X Nanterre.[12]
LEVY P. 2014 "Processusstochastiques
et mouvements browniens". Gauthier-Villars, Paris,
1965.[13] MANDELBROT
B. - "New Methods in Statistical Economics". Journalof
Political
Economy,
LXXI(octobre 1963),
pp. 421-440Reproduit
dansBulletin de l’institut International de
Statistique,
sessiond’Ottawa,
XL.[14]
MANDELBROT B. -"Long
runlinearity, locally gaussian
process,H-Spectra
and finite variance". International Economic
Review, X,
février1969, pp. 82-111.
[15] MANDELBROT
B . - "A Fast Fractional Gaussian NoiseGenerator",
WaterResources
Research,
VII(juin 1971),
pp. 543-553.[16]
MANDELBROT B. - "StatisticalMethodology
for Non-PeriodicCycles :
from the covariance to
R/S Analysis".
Annalsof
Economic and SocialMeasurement,
I(juillet 1972),
pp. 259-290.[17]
MANDELBROT B. - "Lesyndrome
de la variance infinie et sesrapports
avec la discontinuité des
prix". E.A.,
XXVI(1973),
pp. 3 21-348.[18]
MANDELBROT B. - "Le Problème de la Réalité desCycles
lents et leSyndrome
deJoseph",
EconomieAppliquée,
XXVI(1973),
pp. 349-365.[19]
MANDELBROT B. et VAN NESS J.W. - "Fractional Brownianmotions,
fractional noises andapplications".
SIAMReview,
X octobre1968,
pp. 422-437.
[20]
MANDELBROT B et WALLIS J.R. -"Noah, Joseph
andoperational hydo- logy",
Water ResourcesResearch,
IV(octobre 1968),
pp. 909-918.[21 ] MANDELBROT
B. et WALLIS J.R. -"Computer experiments
with fractionalgaussian
noises". Water ResourcesResearch ,
V(février 1969),
pp. 228-267.[22]
MANDELBROT B. WALLIS J.R. - "Somelong
runproperties
ofgeophisical records",
Water ResourcesResearch,
V(avril 1969),
pp. 321-340.[23]
MANDELBROT B. et WALLIS J.R. - "Robustness of the RescaledRange
andthe Measurement of
Long-Run
StatisticalDependence",
Water ResourcesResearch,
V(octobre 1969),
pp. 967-988.[24]
MANDELBROT B. et WALLIS J.R. -"Operational Hydrology Using
SelfSimilar
Processes",
in JohnLAWRENCE, ed., Proceedings
of the Fifth International Conference onOperations
Research(Venise, 1969), (London :
Tavistock
Press).
[25]
MORAN P.A.P.(1964). -
"On the range of cumulative sums". Annalsof
theInstitute