R EVUE DE STATISTIQUE APPLIQUÉE
U LF G RENANDER
Tendances modernes dans l’analyse des séries chronologiques
Revue de statistique appliquée, tome 10, n
o2 (1962), p. 75-84
<
http://www.numdam.org/item?id=RSA_1962__10_2_75_0>
© Société française de statistique, 1962, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
75
TENDANCES MODERNES
DANS L’ANALYSE DES SÉRIES CHRONO LOGIQUES
Ulf GRENANDER
Universitéde Stockholm (1)
Pendant
longtemps,
on n’a pas été content du tout des méthodes servant àanalyser
les sériestemporelles,
méthodesinadaptées
à laplupart
dessituations
pratiques.
Les démonstrationsmathématiques sous-jacentes
sontincomplètes
ou incorrectes. Le travailnumérique
esttrop
mal commode etl’efficacité
trop maigre.
Au cours des dernières
décades, l’analyse
des sérieschronologiques
s’est
développée rapidement. L’aspect général
en achangé
radicalement : elle concerne deschamps
variés etemploie
des théoriesprobabilistes
modernes.Je me concentrerai sur les idées
principales
et essaierai d’éviter d’entrer dans les détailstechniques.
1 - MODELES PROBABILISTES -
On observe une
quantité
xqui
varie avec letemps.
Oubien,
on mesurex continuellement pour toutes valeurs de t dans
quelque intervalle,
ou bienon ne le mesure
qu’en
certainspoints
discrets(disons
le 1erjour
dumois) .
Les suites
(séries)
de valeurs obtenues seront notéesx(t).
L’ensemble des
points
dutemps
surlesquels
sont faites les mesures seradésigné
par T. On dit quex(t)
est une sérietemporelle
ou chronolo-gique
mesurée sur T.En
statistique,
ons’occupe
de mesurer des variablesstochastiques
eton désire
employer
ces mesures ou échantillons pour en tirer des conclusionssur les distributions de
probabilité sous-jacentes.
Dans le cas
présent,
nous considérons donc lesx(t)
comme obtenus àpartir
d’une collection de variablesstochastiques X(t)
où tparcourt
T. Pourchaque
tfixé,
nous avons une variablestochastique X(t) qu’on peut
décrirepar sa fonction de distribution. Pour caractériser la collection
complète
desvariables
stochastiques,
on doit considérer les distributions simultanées.Nous devons décrire ces distributions de
probabilité
deX(t).
Ce pro- blème relève de la théorie des processusstochastiques.
Si T est un inter-(1) Traduction de P. Thionet, maître de conférences à la Faculté des Sciences de Poitiers .
Revue de Statistique Appliquée. 1962 - Vol. X - N’ 2
76
valle
complet,
on a affaire à un processus d’unparamètre continu,
si T estun ensemble
fini,
ou dénombrable de valeurs : on considère des processus deparamètre
t discret.Pour aller
plus loin,
nous seronsguidés
par les besoins desapplica-
tions de la théorie.
Dans un cas
précis,
ilpeut
se faire que nous connaissions assez le mécanisme aléatoirequi engendre X(t)
pour décrire le processusstochastique plus
ou moinscomplètement.
Parfois nous pouvons admettre que la vraie distribution deprobabilité appartient
à une classe très réduite delois,
où elle est caractérisée parquelques paramètres.
Mais souvent, la classe de loisqu’il
est natureld’envisager
est trèslarge
et introduit un nombreélevé,
voire infini de
paramètres
inconnus. D’un certainpoint
de vue, c’est même là leproblème type quotidien
des sérieschronologiques.
Terminologie - Désignons
parEX(t) = m(t) l’espérance mathématique
de lavariable X et posons :
On verra que les modèles
probabilistes qui
serontproposés
entrentdans 3
catégories qui, (en gros) correspondent
aux troisétapes
dudévelop- pement historique
del’analyse
des sérieschronologiques.
J’admets que cesétapes
sont mal définies et sechevauchent,
à la fois dans letemps
et dupoint
de vue de lalogique.
2 - COMPOSANTES ALEATOIRES INDEPENDANTES -
La lère
façon d’attaquer
cesproblèmes reposait
habituellement surl’hypothèse (pas toujours explicite)
que lescomposantes
aléatoiresy(t)
sontdes variables aléatoires
indépendantes
etayant
même distribution.La
composante systématique m(t)
étant souvent donnée comme uneexpression
linéaire de fonctions connue, àl’exception
dequelques paramètres .
Un
exemple typique
et, en mêmetemps,
l’un desplus importants
est donnépar :
où les
amplitudes A’II’
lesfréquences fy
et lesphases
~2 sont des nombres fixes dontquelques-uns
sont inconnus et les autres donnés apriori.
Si lescomposantes y(t)
sontsupposées indépendantes
et distribuéesnormalement,
(moyenne
0 et variance commune03C32),
on a mis aupoint
des méthodes pour estimer lesparamètres
et tester diverseshypothèses. L’expression
statis-tique
souvent utilisée à cet effet se nommepériodogramme :
Le test du
périodogramme
de Fisher(1929)
est celle de ces méthodesdont on a usé le
plus largement.
Engénéral,
cestechniques
visent à détec-ter et vérifier les vraies
périodes 1/f03BD ; parfois
on désire deplus
estimerRevue de Statistique Appliquée. 1962 - Vol. X - N’ 2
77
les
amplitudes
associéesAv.
Lespremiers
chercheurs ont usé dupériodo-
gramme sans
esprit critique
et à tout bout dechamp
dans leurs recherches enthousiastes depériodicités. Lorsqu’on dispose
du test de Fisher et des outilsmathématiques
yrelatifs,
onpeut
faire de cettefaçon
uneanalyse plus
sérieuse de ces données.On a
imaginé
bien d’autres méthodes raffinant etgénéralisant quelque
peu les estimations et les tests du
périodogramme
et aussi traitant un peu d’autrestypes
decomposantes systématiques.
Je citerai seulement celles fondées surl’hypothèse
quem(t)
est unpolynôme
de coefficients inconnus , voire dedegré
inconnu.Il est évident que les
problèmes esquissés
iciappartiennent
à la théoriedes
hypothèses
linéairescomprenant l’analyse
desvariances, l’analyse
desregressions,
etc. ;Les modèles à
composantes indépendantes
aléatoires ont été utilisées dans bien des domaines et avec des succès divers. On a reconnudepuis long- temps
quel’hypothèse
de base del’indépendance
s’effondraitlorsque
l’inter-valle entre mesures successives est
petit
parrapport
à l’échelle destemps
du mécanisme aléatoire. Si ladépendance
n’est pasnégligeable,
ilpeut
êtredangereux
et tout-à-fait erroné d’user de méthodes valables seulement pour des modèlesprésupposant l’indépendance.
Ilpeut
être instructif de considérerl’exemple suivant,
presque trivial :y(t) =
variablenormale ;
moyenne0 ;
variancecommune (j 2 m(t) =
constante inconnue mEstimer m sur l’échantillon
x1 --- xn.
L’estimateur usuelx = 1 n x(t),
toujours
sans biais. Si les ’yindépendants,
x a pourécart-type 03C3/n
et l’inter-valle de confiance est de l’ordre de
03C3/n.
Au contraire, s’il y a
dépendance,
ce n’estplus
vrai. Cas extrêmey(1) = y(2) = ... = y(n). L’écart-type
de x est o. Parconséquent,
on a tirédes données des conclusions
qu’on
n’avait pas le droit d’entirer ;
l’inter-valle de confiance
qu’on
avait admis esttrop petit.
En
pratique,
les choses ne sont pas siexcessives ;
maisenfin,
il fautregarder
les choses en face.3 - SCHEMAS
PARAMETRIQUES
FINIS -Pour surmonter ces
difficultés,
on aimaginé
d’autres modèlesprobabi-
listes conduisant à des méthodes
d’analyse reposant
sur deshypothèses plus
réalistes. Le travail de
pionnier
dans cettequestion
est celui deUdny
Yule(1927)
et Hermann Wold(1938).
Ces auteurs ontenvisagé
des modèles où lacomposante
aléatoirey(t)
estappelée
schémaparamétrique
fini. Il nous suf-fira d’en mentionner un : le processus auto
régressif. y(t)
est un tel pro-cessus s’il satisfait à une
équation
linéaire aux différences à coefficients constantsoù k est
appelé
l’ordre du processus. Les variablesstochastiques 03BE(t)
sontindépendantes
et distribuées suivant la même loi et d’habitude norméesRevue de Statistique Appliquée. 1962 - Vol. X - N’ 2
78
(moyenne 0).
On vérifie facilement que les y ne sontplus indépendants :
introduisons la fonction de
covariance 03BE[03B3(s)
y(t)] J
=r(s, t) qu’on peut
cal- culer sansdifficulté ;
on constate quer(s, t)
ne s’évanouit pas engénéral
pour
s f
t comme ce serait le cas avec des variablesindépendantes.
En
pratique
on choisit k = 1 ou 2.Dans certaines
applications,
on est naturellement conduit à des pro-cessus
stochastiques
satisfaisant à deséquations
aux différences de cetype .
Ceci est
quelque
peuanalogue
auxproblèmes
traditionnels dephysique qui
sont souvent réduits aux
équations
différentielles du 2° ordre.Bien sur, il doit être très
important
de savoirdistinguer empiriquement
les processus
qui
ont descomposantes
aléatoiresindépendantes
de ceux dutype
ci-dessus visé. Dans cebut,
une série de méthodes a étéimaginée
auxU.S.A. durant les années
1940-49,
avec d’abord lespapiers
de T.Koopman (1942)
et R.L. Anderson(1942).
Des méthodes d’une nature assez différente ont étédéveloppés
parQuenouille
et H. Wold(1949)
pour tester si une sériechronologique
donnéeappartient
à l’un des schémasparamétriques
finis. Oncontinue à faire
beaucoup
de travail dans cettedirection,
et on a effectuéces dernières années
d’importantes
recherches sur ces schémas.Malgré
ces réalisations, cette méthode a encouruquelques
blâmes. On fait observerqu’il
n’est pas évident que les schémasparamétriques
finisconstituent la
catégorie
naturelle et correcte de processus pour lesapplica-
tions
auxquelles
on s’intéresse. Bien que, dans un certain sens, il soit exactqu’une catégorie
trèslarge
etimportante
de processuspuisse
êtreapprochée
d’aussi
près qu’on
le veut par un tel schéma d’ordre suffisammentélevé,
on a rarement des raisons
quelconques
de croirequ’un
schéma d’ordre 1 ou2
suffise à procurer uneapproximation raisonnagle. Pourquoi
ne pas sortir de cettecatégorie ?
Les défenseurs de cette idée notent
qu’en
serestreignant
apriori
àces schémas d’ordre peu
élevé,
le statisticien seplace
lui-même dans unesituation
déjà équivoque :
il tire de ses données des résultatsplus précis qu’il
n’est habilité à le faire. En d’autres termes, ilacquiert
un sentimentde sécurité illusoire tiré de ses conclusions
statistiques.
4 - MODELES PLUS GENERAUX -
Dans la dernière
décennie,
on abeaucoup
travaillé à inventer des mé- thodes deportée plus grande.
Jeparlerai
seulement d’uneapproche :
lesprocessus
stochastiques
stationnaires à 1 voie car le cas stationnaire a été celuiqu’on
a leplus
étudié.En gros, un processus est dit stationnaire si sa distribution de
proba-
bilité ne
change
pas avec letemps,
de sorte que ses distributions deproba-
bilité ne
dépendent
pas dutemps
absolu mais des différencesde temps.
Ainsiy(t)
est une variablestochastique
avec fonction de distributionindépendante
de t. La fonction de distribution simultanée de 2 variables
y(s)
ety(t) dépend
seulement de
(t - s)
et ainsi de suite.On
peut espérer
trouver un modèle stationnairequand
on sait que le mécanisme aléatoire secomporte
d’unefaçon
invariante dans une certainemesure
(c’est
à voir danschaque cas).
Il est clair que même un mécanisme aléatoire stable
peut engendrer
un processus non stationnaire
("transient")
bien que, dans bien des cas, unéquilibre probabiliste
soit atteint au bout d’untemps
assezlong.
Revue de Statistique Appliquée. 1962 - Vol. X - N’ 2
79
Bien que
l’hypothèse
de stationnarité réduise dans unelarge
mesure lespossibilités d’application
dumodèle,
lacatégorie
des distributions deproba-
bilité
possibles
est encore très vaste -trop
vaste - pour bien des usages . On a étudié diversessous-catégories ;
et pourplus
de commoditéj’étu-
dierai seulement les processus stationnaires
qui
sont distribués normalement ,encore que bien des choses que
je
vais dires’appliquent
à des casbeaucoup plus généraux.
Il est bien connu
qu’une
distribution normale estcomplètement
définiepar ses 2
premiers
moments.03B3(t) a
une valeur moyennenulle ;
la fonctionde covariance
peut
s’écrire :En d’autres termes, si nous connaissons
R(t)
pour toutes les valeurs de t, nous connaissons la distribution deprobabilité complète.
Apartir
d’unéchantillon,
onpeut
estimerR(t)
et construire desrégions
de confiance - du moins si l’échantillon estgrand.
Alors que la
façon d’attaquer
leproblème
duparagraphe
3 avait été influencée surtout(mais
pasexclusivement)
par lesapplications
d’ordre éco-nomique
etsocial,
les méthodesévoquées
ici ont été surtoutdéveloppées
pour résoudre les
problèmes statistiques
des sciencesphysiques.
Dans leurcontexte le
plus fréquent,
ilapparaît
que laquantité
àlaquelle
on s’intéresse d’emblée n’est pasR(t)
mais uneexpression qui
lui estapparentée,
la fonc-tion F de distribution
spectrale. D’après
un théorème fameux de Wiener- Khintchine(voir
Doob,1953),
il existe une fonctionF(B) ayant
toutes lespropriétés
d’une fonction de distribution sauf queF(~)
n’est paségal
à 1mais à
R(O) = E Y2(t)
et telle queR(t) = 0 cos
t 03BBdF(03BB).
0
Nous
parlons
ici du cas d’unparamètre
t continuprenant
toutes lesvaleurs
réelles ;
mais dans le cas discret on a(d’après
H.Wold, 1938)
Donc si la fonction
F(03BB)
est connue onpeut
calculerR(t),
et l’inverseest
également possible grâce
à une formuled’inversion.
Le rôle de la fonction de distribution
spectrale
a été renduplus
clairpar un théorème
important
de Cramer(1942) qui
dit quen’importe quel
pro-cessus stationnaire
y(t) peut
êtrereprésenté
par uneexpression
où
Z1
etZ2
sont des processusstochastiques ayant
lespropriétés
suivantes :si les intervalles
(/B1’ 03BB2)
et(03BB3, 03BB4)
sontdisjoints,
avec uneéquation
ana-logue
3 bis pourZ2
Revue de Statistique Appliquée, 1962 - Vol. X - N 2
80 pour tout
couple
de valeurs telles queCette
représentation rappelle
à la fois lesintégrales
de Fourier et lesexpressions trigonométriques
duparagraphe
2. Mais il y a une différenceessentielle ;
pour éviter d’êtretrop techniques,
nous n’entrerons pas dansune discussion détaillée de
l’interprétation
de cesintégrales.
Nous remarquerons seulement que
(heuristiquement parlant)
le processus estdécomposé
en 2 termesharmoniques :
sin t À et cos t À avec desampli-
tudes
stochastiques 0394Z1(03BB)
et0394Z2(03BB).
L’ordre de
grandeur
de cesamplitudes
est donné par la varianceDans maints contextes, une variance
peut
êtreinterprétée
comme unepuissance
moyenne, unequantité ayant
unesignification physique
immédiateet
pouvant
être mesurée directement.Il est alors naturel
d’essayer
d’estimerF(03BB)
directement - etpeut-être
aussi
d d03BBF(03BB) = f(
Diverses méthodes ont été
suggérées
par J.W.Tukey,
M. S. Bartlett(1950-55),
Grenander(1951)
et on abeaucoup
travaillé dans cette direction.Il est intéressant de noter que
plusieurs
des résultatsimportants
decette branche de la
statistique théorique
sont dus à desphysiciens.
Ceci ainfluencé le
développement
de cette théorie et accru l’utilitépratique
desméthodes
suggérées.
Il vaut lapeine
de mentionner que lepériodogramme réapparaît (sous
unaspect modifié)
dans un tel contexte.En liaison avec l’estimation d’une fonction inconnue telle
F(À),
on sedemande naturellement s’il est
possible
de construire desrégions
de confiance dutype F1(À) F(A) F2(03BB) quel
que soit B.Ceci
(et
lesproblèmes s’y rapportant)
a été traité par Grenander et Rosenblatt(1953), qui
ont obtenu des résultats concernant lesgrands
échan- tillons.Un groupe de
problèmes
d’untype quelque
peu différent se posequand
on désire estimer des
quantités
inconnues déterminant lacomposante systé- matique m(t)
siy(t)
est un processus stationnaire. Les résultatsclassiques
de
l’analyse
desrégressions
s’effondrent mais onpeut
obtenir des résultats très nets(voir
Grenander1954). Cependant
ceux-ci sontégalement
relatifsà un
grand échantillon,
etjusqu’ici
on n’a pas étudié à fondquel degré d’approximation procurent
lespetits
échantillons.Parmi les domaines où on a
appliqué
les méthodesprécédentes,
men-tionnons la théorie du bruit de fond et celle de la turbulence.
Parfois,
etspécialement quand
on use de méthodesanalogues,
il est commoded’employer
un
temps
continu. On se heurte alors à certainesdifficultés,
mais Grenander(1950)
a montréqu’on peut
les surmonter avec la théorie moderne des pro-cessus
stochastiques
de Doob. Des travaux dans ce sens ont été faits par II.B. Mann(1953)
et d’autres.Revue de Statistique Apphquee. 1962 - Vol. X - N’ 2
81
Il est
impossible
de discuter(voire
dementionner)
toutes les contri- butions.Beaucoup
sontpubliées
dans desjournaux
nonstatistiques
et ne sontpas faciles à localiser. Une
monographie
Rosenblatt-Grenander est en coursde
préparation
sur lesujet.
5 - LA SITUATION PRESENTE -
Le 1 er groupe de modèles a été sévèrement
critiqué : critique dirigée
^ontre certaines
applications
abusives et non contre la méthode elle-même .c en est de même pour le 2e groupe. Sa validité n’est
acquise
que dans certains domaines seulement : avons-nous assez d’informations pourpouvoir
établir que la structure des
probabilités
est bien de cetype ?
Le 3e groupe donne lieu à des méthodes très
largement applicables ;
néanmoins il ne faut pas oublier
qu’il s’agit
d’une classe limitée de pro-cessus.
Par
exemple :
on suppose souvent la stationnarité(la
tentation est fortepour le
théoricien).
Granander pensequ’en
économie, les processus sont rarementstationnaires,
au moins sur unelongue période.
La normalité aussi est admise un peu vite : vérifier
empiriquement
unetelle
hypothèse
pose unproblème théorique compliqué
etqui
demanderait des observations très nombreuses.Un
aspect déplaisant
de laplupart
desdéveloppements
récents estqu’ils exigent beaucoup
de calculsnumériques
pour calculer lesstatistiques. Quand
on fait des
investigations
degrande
envergure ou de routine ce n’est pas trèsgênant (calculateurs électroniques
et cartesperforées),
mais ce n’estplus
vrai du tout pour
analyser
une seule ouquelques
sérieschronologiques (car
il est
impossible
alors de consacrer assez detemps
à laprogrammation) .
On aurait besoin de
quelques
méthodesabrégées rapides.
Les travaux récents sont surtout destinés à fournir des instruments
assez
généraux
dontl’emploi
ne demande que deshypothèses
réalistes. Les conditions de validité sont doncélargies
mais l’efficacité des méthodes est diminuée parrapport
aux anciennes méthodes. Donc des sériesplus longues
sont nécessaires
(ou
unplus grand
nombre de sériescourtes)
pour obtenir des résultats.En outre, la
plus grande partie
des travaux récents nes’applique qu’aux grands
échantillons.Ainsi,
les trois groupes de modèles secomplètent,
maisil reste
beaucoup
à faire avantqu’on puisse
dire que la théorie a unaspect
satisfaisant.On manque de familles
adéquates
de processusstochastiques
définispour
s’adapter
auxbesoins
de la rechercheappliquée.
Le besoin leplus important
estpeut
être celui de modèlesprobabilistes plus
réalistes et flexibles. Pour cela il faut voir lesapplications,
avoir des contacts étroitsavec les sciences utilisatrices. Le succès des nouvelles
techniques
du para-graphe
4 tientjustement
à cela. Lacatégorie
de structures deprobabilité
devrait
correspondre
à la connaissance que nous avonsdéjà
duphénomène
étudié. Cesconcepts
de causalitépeuvent
être alors utiles. Une discussion lumineuse à cesujet peut
être trouvée dans H. Wold(1952).
Il
paraît
vraisemblable que, dans les travaux futurs sur les sérieschronologiques,
nous aurons à nous contenter encore de méthodesapprochées .
Je serais
surpris
s’il se révélaitpossible
d’obtenir des méthodes d’inférenceRevue de Statistique Appliquée. 1962 - Vol. X - N 2
82
valables exactement pour des
petits
échantillons sous des conditions assezgénérales
pour nous convenir. Cela ne devraitchagriner
que lespuristes , puisque (comme
on l’adéjà dit)
nous aurons besoin de toutefaçon
d’échan-tillons assez
grands
pourpouvoir
aboutir à des conclusions. La tendance moderneparmi
les statisticiens théoriciens va vers les méthodesabstraites ,
et c’est le cas en
particulier
pourl’analyse
des sérieschronologiques ;
desorte que les
problèmes
dontl’aspect
estplus pratique
sont asseznégligés .
Les
manipulations
formellestrop
abondantespeuvent choquer
le sens esthé-tique
duthéoricien,
mais il y a de très nombreusesquestions
intéressantes difficiles etattrayantes, ayant
engénéral
un caractèreanalytique,
et d’autresconcernant les méthodes
d’approximation
à mettre surpied.
C’est le cas dumoins si l’on a l’ambition d’obtenir des résultats
logiquement
corrects et solidement établis.Ceci m’amène à un autre
point
queje
tiens pourimportant.
On a ditque, comme la
statistique
n’estqu’une
scienceappliquée,
il n’était pas néces- saire d’avoir des démonstrations totalementrigoureuses.
Aprésent
le statis- ticienadopte
commepoint
de vue que l’une de ses tâches(et peut
être laseule)
serait depromouvoir l’emploi
detechnique
correctes dans lesrecherches où la
statistique
estemployée pratiquement.
Nous savons tous comme il est facile de commettre une erreur dans la
planification
etl’analyse
des recherchesstatistiques.
Le statisticien devrait veiller à ce que cela n’arrive pas ; et il est alorsguidé
par sonexpérience
et par la théorie
statistique.
Si l’on veut que cela soit, il faut que la théorie soit correcte.Maintenant,
dans bien des branches de lastatistique,
les diffi-cultés
mathématiques
sontnégligeables
à côté desproblèmes d’application
etd’interprétation
de la méthode. Sil’algèbre
etl’analyse
ne sont pasemployées
de
façon convenable,
iln’y
aura pas dedanger
trèsgrand
de commettre unegrave erreur si la méthode repose sur un
argument
intuitif correct.Cependant, quand
lacomplexité mathématique augmente (comme
celaarrive pour
l’analyse
des sérieschronologiques,
et il est vraisemblable quece n’est pas
fini)
on doit alors fairedavantage
attention auxmathématiques .
Dans
l’analyse
des sérieschronologiques,
il y a desexemples
de cas où deserreurs de cette
espèce
ont conduit à des résultats aberrants ou erronés . Je ne veux pas sous-estimer le rôle de l’intuition dans le travailscientifique,
mais nous devrions faire
attention,
avant de proposer unetechnique
statis-tique nouvelle,
de bien savoir si et où elles’applique.
C’est seulement unsimple
acte d’honnêteté intellectuelled’appliquer
les mêmes normes pourjuger
du fondementlogique
d’un travailthéorique
que pourcritiquer
le cher-cheur non statisticien
qui
commet des erreurs destatistique
dans ses rai-sonnements. Nous avons tous connu cette attitude de
pharisien
dequelques
statisticiens vis-à-vis de leurs
collègues
des sciencesappliquées.
De
plus,
une démonstrationmathématique
correcte, bieninterprétée,
nous
apprend beaucoup
sur la validité réelle des méthodes : les démonstra- tions ne sont pas un luxe maispeuvent
et devraient servir à nousapprendre
des choses
pratiques. Remarquons
aussi que le"statisticien appliqué"
n’apas les mêmes
possibilités
de vérifier ou contre prouverempiriquement
lavalidité de ces méthodes que, par
exemple,
lephysicien.
La seule
façon
de faire cela pour unstatisticien,
c’est de faire desexpériences
artificielles desondage.
Ceci est très coûteux et mal commodeen matière de séries
chronologiques,
telle est du moins ma propreexpé-
rience.
Revue de Statistique Appliquée. 1962 - Vol. X - N° 2
83
Je voudrais discuter
rapidement
un autresujet qui
a unegrande impor-
tance : comment utiliser les séries
chronologiques
en vue dela. prévision ?
La théorie de la
prévision
de WienerKolmogoroff (cf. Wiener, 1949)
estbien connue. Elle est conçue pour le cas où on a observé une série station- naire
(qu’on
noteray(t) jusqu’à
la date t. On désireprédire
la valeur duprocessus dans l’avenir
y(t
+h).
Cette belle théorie a des
applications
nombreuses etimportantes ;
maisdans bien des
problèmes pratiques,
on nepeut l’utiliser ;
car ou bieny(t)
n’est pas
stationnaire,
ou bien il y a unecomposante systématique m(t) qui
se superpose aux observations. Si nous n’avons pas une idée correcte du mécanisme
sous-jacent,
nous ne pouvons décrirem(t)
avec assez depréci-
sion. C’est là certainement un cas où un
emploi
partrop
enthousiaste des instruments existants pourl’analyse
des sérieschronologiques pourrait
conduire à des résultats désastreux.
Pareilles situations existent dans les
projections
àlong
terme, en éco-nomie, démographie
et autres. Il est clair que la solution ne réside pas seu-lement dans un traitement
statistique raffiné,
mais quedavantage
d’informa-tions sur le fonctionnement du mécanisme
générateur
doivent être recueillies defaçon
que la structure dem(t)
ety(t) puisse
être décrite en termesplus précis.
Lastatistique
ne fait pas de miracles parcequ’on
a en elle une foisuperstitieuse.
REFERENCES
ANDERSON R.L.
(1942) -
Distribution of the serial correlation coefficient.Annals of Math. Stat.
13,
1-13.BARTLETT M.S.
(1946) -
On the theoreticalspecification
andsampling
pro-perties
of auto-correlated time series. J.R.S.S.8,
27-41.BARTLETT M.S.
(1950) - Periodogram analysis
and continuousspectra -
Biometrica37,
1-16.BARTLETT M. S.
(1955) -
An introduction to stochasticprocesses - Cambridge University Press,
London.CRAMER
(1942) -
On harmonieanalysis
in certain functional spaces. Arkiv.Mat. Astr.
Fys. 28, B, 7
DOOB
(1953) -
Stochastic processes - JohnWiley
and sons, New-York.FISHER
(1929) -
Test ofsignificance
in harmonieanalysis - Proce. Roy.
Soc. A
125,
54-59.GRENANDER
(1950) -
Stochastic processes and statistical inference - Arkiv.Mat. 1, 195-277.
GRENANDER
(1951) -
Onempirical spectral analysis
of stochastic processes.Arkiv. Mat.
1,
503-531.GRENANDER
(1954) -
On the estimation ofregression
coefficients in the case of an auto-correlated disturbance - A.M.S.25,
252-272.Revue de Statistique Appliquée. 1962 - Vol. X - N’ 2
84
GRENANDER et ROSENBLATT
(1953) -
Statisticalspectral analysis
of timeseries
arising
fromstationary
stochastic processes - A.M.S.24,
537-558.KOOPMANS T.
(1942) -
Serial correlation andquadratic
forms in normalvariables. Ann. Math. Stat.
13,
14-33.MANN H.B.
(1953) -
Introduction in thetheory
of stochastic processesdepen- ding
on a continuousparameter -
National Bureau ofStandards,
U. S. A . TUKEY J.W. -Measuring
noise color(unpublished).
WIENER N.
(1949) -
Theextrapolation interpolation
andsmoothing
of statio- nary time series. JohnWiley
and sons.WOLD H.
(1938) -
Astudy
in theanalysis
ofstationary
time series. Alm-quistand
Wikselk. Stockholm.WOLD H.
(1949) -
Alarge sample
test formoving
averages - J.Roy.
Stat.Soc. B,
11,
297-305.WOLD H.
(1952) -
Demandanalysis.
Astudy
in econometrics - JohnWiley
and sons.
YULE U.
(1927) -
On a method ofinvestigating periodicities
in disturbed series, withspecial
reference to Wolfer’ssunspot
numbers. Trans.Roy.
Soc. A226,
267-298.Autres références
communiquées
par le traducteurHANNAN E.J.
(1960) -
Time seriesanalysis.
MethuenMonographs.
MALINVAUD E.
(1960-61) -
Cours de l’Ecole Nationale de laStatistique
etde l’Administration
Economique.
QUENOUILLE
M.H.(1957) -
Theanalysis
ofmultiple
time series. Griffin’sStatistical
monographs.
Revue de Statistique Appliuée, 1962 - Vol X - N 2