R EVUE DE STATISTIQUE APPLIQUÉE
J. L ARRIEU
Méthodes d’analyse de la structure fine des débits
Revue de statistique appliquée, tome 4, n
o2 (1956), p. 39-62
<http://www.numdam.org/item?id=RSA_1956__4_2_39_0>
© Société française de statistique, 1956, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
MÉTHODES D’ANALYSE DE LA STRUCTURE
FINE DES DÉBITS
par
J. LARRIEU Electricité
de FranceService des
Études
et RecherchesHydrauliques
Quand Etienne HALPHEN
entreprit
en 1942, l’étudesystématique
des gran- deurshydrologiques,
il fixaimplicitement
deux stades à ce travail.On étudierait tout d’abord les
grandes
structures del’hydrologie,
débits an-nuels,
mensuels, corrélation entre ensemblesgéographiques
voisins. Cette pre-mière
étape permettrait
d’unepart
de se faire une idée nette duphénomène global
et d’autre
part
d’utiliser les méthodesstatistiques classiques.
HALPHEN avait bien vu en effet que
l’étape
suivante, celle de l’étude de la structure fineexigerait
des outilsstatistiques
nouveaux,adaptés
à la nature trèscomplexe
desphénomènes.
En
fait,
lapremière partie
du travail s’avéraplus
difficilequ’il
ne semblaita
priori,
et elle duraplus
de huit ans. Huit années d’ailleurs très fructueusespuisqu’elles permirent
la mise aupoint
d’ungrand
nombre detechniques particu- lières,
et la connaissance de faitsjusque
là inconnus. C’est dans cettepériode
que
naquirent
la loiharmonique puis
les lois A et B.En 1953, HALPHEN aborda le second
point
de son programme, l’étude de la structure fine des débits. Ilreprit
à cet effet destechniques
utilisées auparavant, mais sadisparition prématurée
en 1954,l’empêcha
d’en tirer tous les résultatsqu’il pouvait légitimement
en attendre.Dans cette communication, nous voudrions
rappeler
le s méthode sclassiques qui permirent
l’étude des structuresgrossières
et montrer enquoi
ces méthodess’avèrent insuffisantes
quand
on veut étudier la structure fine des débits et leurrépartition
dans le temps .Nous
indiquerons,
ensuite, les travauxqui
ont utilisé des méthodes nouvelles pour cetteanalyse
et nous montreronspourquoi
il était nécessaire de chercher d’autresprocédés
que ceux-là.Enfin,
nous donnerons lesprincipes
du nouveau moded’approche
conçu par HALPHEN; nous montrerons lafaçon
dont nousexploitons
cette méthode actuelle-ment et nous dirons ce
qu’il
faut vraisemblablement en attendre .NATURE
STATISTIQUE
DUPROBLÈME
Disons tout d’abord
qu’il
nous semble vain, voiredangereux,
de vouloir trou- ver unesignification profonde "métaphysique"
aux schémasproposés.
Ce seraitadmettre
qu’on peut
connaître la nature intime desphénomènes.
C’est vrai enMathématiques
où l’on se donnetoujours,
apriori,
un certain nombre d’axiomesrigoureux;
onpeut
alors valablement contrôler tout aulong
d’un raisonnement que les axiomes se trouvent vérifiés. Dans les sciencesexpérimentales
où les axio-mes ne nous sont pas connus, c’est chose très difficile. Tout au
plus
pourrons-nous déclarer dans certains cas
simples :
"Tel schémareprésente
bien lephéno-
mène
étudié,
tel schéma lereprésente
mal".En outre, dire valablement que tel schéma
représente
bien telphénomène implique
l’une des deux conditions suivantes :ou bien on
possède
des éléments decomparaison,
soit dans lepassé,
soit dans leprésent,
avec desphénomènes
de même nature où le schéma s’est avéré conve- nable,ou bien on se trouve dans les conditions
d’application
de théorèmesgénéraux
dela
statistique
permettant dejustifier l’application
à desphénomènes complexes
derésultats
simples. (Loi
desgrands
nombres parexemple).
C’est là une
évidence, peut-être,
maisparfois
oubliée car on est souvent conduit à utiliser des schémas sans aucun moyen decomparaison (Exemple,
esti-mation de crues millénaires à
partir
derelevés portant
surquelques années)
ousans
justification théorique
suffisante(loi
des débits maxima deGUMBEL).
ÉLÉMENTS STATISTIQUES UTILISÉS GÉNÉRALEMENT
EN HYDROLOGIE Les statisticienshydrologues
sont accoutumés à manier des débitsjourna- liers,
mensuels, annuels. Usuellement ces éléments sont considérés comme des variables aléatoires obéissant à des schémasclassiques.
D’unefaçon plus préci-
se, on admet souvent que le débit d’un mois donné
(si
on s’intéresse aux débitsmensuels)
est tiré "au hasard" dans une urne dont lacomposition dépend
essen-tiellement du mois considéré .
Il se pose alors un certain nombre de
problèmes.
Commentdéterminer,
"es- timer" diront les statisticiens, l’urne dont nous tirons les débits ? Comment dé- terminer lapériode
surlaquelle
sera calculé le débit ?ESTIMATION DES
PARAMÈTRES
En admettant
l’adéquation
du schémasimpliste,
"variable aléatoire tirée d’une urne" on peut se demander comment définir cette urne, c’est-à-dire com- ment définir la forme de la fonction derépartition
à retenir et ensuite commenten déterminer les
paramètres.
FORME DE LA FONCTION DE
RÉPARTITION
Il n’existe pas en
général
de méthode pouradopter
une forme de loi et l’in-tuition du statisticien
joue
ici ungrand
rôle.La
plupart
du temps c’est l’allure dupolygône
defréquence
de l’échantillon étudiéqui suggère
la formeanalytique
convenable pour F(x)
ou l’habitude du sta- tisticienqui
adéjà
rencontré des variables du même genre. Si lepolygône
estsymétrique
onadopte
laplupart
dutemps
une loi de GAUSS en raison des facilitésanalytiques qu’elle
offre aux calculs .Si le
polygône
estdissymétrique
onadopte
souvent une loi de GALTON ou uneloi de PEARSON.
Admettons maintenant que la forme
analytique
de la fonction F soit détermi- née. Il reste à trouver les valeurs desparamètres qui
yfigurent.
Parexemple,
dans la loi de GAUSS il faut estimer les valeurs de deux
paramètres,
la moyennem et
l’écart-type
a .Nous n’allons pas faire ici une théorie de l’estimation, nous bornant
simple-
ment à
signaler quelques
difficultésgénéralement
connues en théorie maisparfois négligées
dans lesapplications.
On sait
qu’on
estimegénéralement
m et cr àpartir
des formules suivantes :Or, on a
parfois
tendance à oublier les conditions de validité de ces formules.Nous
signalerons
seulement les deuxplus importantes : 1)
Les observations effectuées sontindépendantes.
2)
Ellesappartiennent
toutes à la même loi.INDÉPENDANCE
DES OBSERVATIONSLes formules d’estimation usuellement
employées supposent
que l’échantillon étudié se compose d’élémentsindépendants.
S’il n’en est pas ainsi l’estimation de la moyenne restevalable,
mais il n’en estplus
de même pour l’estimation des moments d’ordresupérieur.
Enparticulier
l’estimation del’écart-type
est modi-fiée. Dans un cas de ce genre le fait d’utiliser un
grand
nombre d’observations donnera une fausseimpression
de sécurité.HOMOGÉNÉITÉ
DES OBSERVATIONSAdmettons maintenant que les débits considérés soient
indépendants,
cequi
n’est vrai d’ailleurs pour les débits moyens mensuels
qu’en première approxima-
tion. Il ne serait pas correct pour autant de faire une estimation de
paramètres
àpartir
de leur totalité .Il est, en effet, raisonnable de supposer que les débits mensuels suivent tous des lois de même forme
analytique,
parexemple
des lois de GALTON. Mais il serait tout à fait inexact d’admettre que tous les débits moyens mensuels suivent la même loi de GALTON. La variation saisonnière des débits est bien connue;dans un
régime
nival parexemple,
les débits d’été ont une moyenneplus grande
que les débits d’hiver
(Voir figure 1).
Par
conséquent, mélanger
l’ensemble des mois de l’année donnerait un ré- sultat dénué designification statistique.
Il convient donc dans le cas
particulier
que nous donnons commeexemple
d’étudier la
longueur
despériodes
dont onpeut mélanger
les débits mensuels. Laplupart
dutemps,
on considèrechaque
moisséparément. Quelquefois cependant,
on coupe l’année en deux et on
mélange
les mois d’hiver d’unepart,
les mois d’été d’autrepart.
C’est d’ailleurs la une schématisation arbitraire car le passage d’une caté-
gorie à
l’autre ne s’effectue pas brutalement maisprogressivement.
Fig. 1
Arve au Pont de Carouge
Variation des
paramètres
caractéristiques de la loi de probabilité des débits moyens mensuelsINADÉQUATION
DESSCHÉMAS CLASSIQUES
Le schéma dont nous venons de
parler
s’avèregénéralement
suffisant pour les débitsmensuels,
annuels et pour les crues annuelles. Mais leproblème
chan-ge du tout au tout
quand
on aborde cequ’il
est convenud’appeler
la structure finedes
débits,
c’est-à-dire l’étude des débits à l’échellejournalière
ou horaire.Dans ce cas
là,
si onéprouve
tant de difficultés pourajuster
des schémas d’ur-nes aux débits
journaliers,
c’est parce que ces schémas ne conviennent pas.Ce
qu’on, pourrait
songer à tirer d’une urne, ce n’est pas unpoint
mais toutune courbe
représentant
l’évolution du débit au cours dutemps.
Il faudrait évi- demmentpréciser
la durée surlaquelle porterait
la courbe aléatoire et les mo-yens de l’obtenir.
Pourquoi
cette schématisation si naturelle n’a pas étéexploitée plus
tôt ?Parce
qu’elle
se heurte à des difficultésmathématiques
considérables.Nous allons essayer le
plus simplement possible
de montrer la nature de cesdifficultés.
On sait
qu’on appelle
variable aléatoire discrète unequantité
Xqui peut
pren- dre un certain nombre de valeurs x, X2 ...xp, chaque
valeur xiayant
laproba-
bilité p de se réaliser au cours d’uneépreuve, tirage
dans une urne, par exem-ple.
Il semble alors trèssimple
et très naturel de dire : dans le cas ou laquanti-
té X
peut prendre
non pas des valeurs isolées x mais des ensembles de valeurs constituant des fonctionsfi (t)
on affectera àchaque
fonctionfi (t)
uneprobabilité
pi comme on l’a faitprécédemment.
Si on se
place
d’unpoint
de vuegénéral
ceci est malheureusementimpossible
car il existe un nombre de fonctions
trop grand
pourqu’on puisse
affecter unnombre p, à
chaque
fonctionpossible.
Nous n’entrerons pas dans des détailsthéoriques
ausujet
de cettequestion
mais donnerons unexemple
familier pour montrer dequoi
ils’agit.
Vouloir affecter uneprobabilité
p à toutes les fonctionspossibles
serait enquelque
sorteéquivalent
à vouloir numéroter 100 boules avecles 50
premiers
nombres. Il y en aurait nécessairement 50qui
nepourraient
pas être identifiées.Les
probabilistes essayent depuis
de nombreuses années de tourner ces dif- ficultés sans avoir bien réussijusqu’à présent
à obtenir des solutions utilisables dans lapratique
courante.De leur
côté,
leshydrologues
ont bien senti la nécessité d’utiliser des mé- thodes nouvelles pour résoudre les difficultés inhérentes àl’analyse
de la struc-ture fine des débits. Nous
indiquerons plus
loin lesprocédés employés
dans uncertain nombre de cas concrets, mais
auparavant
nous définirons les élémentsqui
nous serviront constamment par la suite, à savoir les sérieschronologiques.
SÉRIES CHRONOLOGIQUES
On
appelle
sériechronologique
une série d’observations u(t, ),
u(t2.)...
u
(t,) ...
faites à des instantst1 , t1 ... tn .
S’il existe une relation fonctionnelleconnue entre u et t la série
chronologique
n’est pas autre chose que la suite des valeursprises
par la fonction u(t)
aux instantst,, t2’ ... tn .
Si au contraire la
quantité
u(t, )
n’est pas déterminée par un processus cer- tain connu, on est enprésence
d’une véritable sériechronologique.
Il en est ainsipar
exemple
du cours d’une valeurboursière,
du rendement annuel des récoltes deblé,
des débits observés dans les rivières.Remarquons
pour ce dernierexemple qui
nous intéressespécialement
ici, que la suite des débits est une sériechronologique particulière
un peu différentede celles que nous avons citées comme autres
exemples.
En effet, dans ces der-nières,
la suite étaituniquement
constituée par les valeurs u(t ).
Ainsi pour les rendements d’unerécolte,
il existe un chiffre par an. Au contraire, pour la suite desdébits,
ils’agit
d’unphénomène
continu que nous observons à des instants t1 ,t2
...t .
Cette remarque a deuxconséquence s
notable s .1)
Alors que dans les autres casenvisagés,
la suite était constituée par despoints isolés,
dans le cas desdébits,
ils’agit
d’une courbe continue surlaquelle
onconnait des
points.
2)
Nous ne pouvonsjamais
connaîtrecomplètement
le processus étudié même dans lepassé puisque
nous n’avons pas d’éléments sur les valeursqu’il prend
entre les
points
d’observation. Laplupart
dutemps,
nousremplaçons
le pro-cessus réel par un processus variant par sauts
brusques
auxpoints
de mesure,constant entre deux
points
observés etégal
sur cet intervalle à la valeur me-surée par
exemple
aupoint précédent.
D’autre
part,
les séries que nous étudionspeuvent
être de durée finie ou in- finie : nous n’en étudionsjamais
que destronçons
finis de duréeplus
ou moinslongue .
Nous verrons
plus
loinl’importance
de cette observation.CARACTÉRISTIQUES
D’UNESÉRIE CHRONOLOGIQUE
Traditionnellement,
ondistingue
quatre élémentsprincipaux
dans une sériechronologique :
- la tendance à
long
terme ou trend.- les mouvements
réguliers qui
sereproduisent
d’unefaçon plus
ou moinspériodique appelés
composantescycliques.
- les mouvements
périodiques appelés composantes
saisonnières.et enfin un reste
appelé
résidu aléatoireNotre but n’est pas de
présenter
ici une étude détaillée des séries chronolo-giques
engénéral,
mais derappeler
des notionsqui
nous serviront par la suite.Il convient de remarquer tout d’abord que la
décomposition indiquée
n’a pasune valeur absolue, J mais une valeur relative.
Considérons par
exemple
la série ci-dessous :Suivant l’intervalle de
temps qu’on prend
enconsidération,
on trouve : fortement croissante(intervalle t
1t2 )
une tendance à
long
terme fortement décrois sante(intervalle t2 t3 )
sensiblement constante
(intervalle t1 t4)
Si notre intérêt se
porte
sur les mouvementscycliques,
nousdistinguons
surl’intervalle
t, t4
uncycle
assezample auquel
se superpose un feston decycles
courts
d’amplitudes
voisines.Nous voyons bien ainsi la difficulté
qui
existe dans la définitionobjective
de scaractéristiques
que nous étudions.Ceci va nous mener au coeur du
sujet
en nous faisantpressentir
les écueilsauxquels
on se heurte dans l’étude des processus aléatoires réels.Précisons d’abord dans
quel
but sont effectuées ces recherches. Comme dans laplupart
des étudesstatistiques,
ils’agit
deprévoir
les états futurs àpartir
desétats
passés.
Il est donc bien tentant de rechercher les
périodes
quepourrait présenter
telphénomène puisque
laprévision
de l’avenir s’en trouverait faiteipso
facto à un résidu aléatoireprès.
C’est
pourquoi beaucoup d’analyses
de sérieschronologiques
sont axées surla recherche de
périodicités.
Nous allons d’abord examiner laplus
caractéristi- que de ces méthodes.MÉTHODES
DES COMBINAISONSLINÉAIRES D’ORDONNÉES
Cette méthode créée par M. et Mme LABROUSTE se
présente
de lafaçon
suivante :
Etant donné une courbe résultant de la
superposition
de sinusoïdes depério-
des et
d’amplitudes quelconques,
onpeut
trouver lespériodes,
lesphases
et lesamplitudes
des sinusoïdescomposantes,
au moyen de combinaisons linéaires ef- fectuées sur les ordonnées.Sans entrer dans les
détails,
nous donnerons lesgrandes lignes
de cette mé-thode.
Considérons une fonction
qui
sepré sente
sous la forme suivante :y = 2: ai
cos(03C9ix + ~i)
Il est facile de vérifier que si on effectue des combinaisons linéaires du
type
suivant sur les y :m
y (xo, 1 Kp y (x. + p) + y (x. - p)
les
Kp
étant des constantesqu’on
saitdéterminer,
on trouve : Y(xa, m) va?
a, cos(w;
x0 +xi )
Autrement dit, les fonctions y et Y sont formées des mêmes sinusoïdes af- fectées
d’amplitudes
différentes a;et oc;
ai. M. et Mme LABROUSTEqualifient
ces transformations de "non
déphasantes" puisqu’elles
conservent lespériodes
etles
phases.
Leur intérêt consiste en ceci : pour des valeurs bien choisies des coefficients K les
amplitudes
oc; ai sont toutes nulles sauf unequi
est trèsgrande.
Par suite, la fonction transformée Y donne immédiatement lapériode
et laphase
correspon- dantes wi etfi .
On obtientégalement l’amplitude
a, en divisant Y par oc; .Il existe un mode de calcul
permettant
de rendrenégligeables
successivement lesamplitudes
a1 ’ a2 ... ai ... enprenant
àchaque
fois une combinaison conve-nable de coefficients
Kp,
de telle sortequ’on
détermine deproche
enproche
tou-tes les
périodes
et toutes lesphases
duphénomène.
Avec la méthode LABROUSTE, nous avons donc un
procédé d’analyse
des sé-ries sinusoïdales très
puissant quoique
assez laborieux.Cette méthode a été utilisée sur les séries
chronologiques,
enparticulier
lesdébits de la Seine à PARIS pour découvrir la loi de récurrence des crues catas-
trophiques.
Or
l’hypothèse
même que nous avonsindiquée plus
haut sur la méthode LA-BROUSTE en donne les limites
d’emploi.
Si la courbe étudiée est formée par la
superposition
desinusoïdes,
les com-binaisons linéaires d’ordonnées permettront
d’expliciter
ces sinusoïdes.Si cette condition ne se trouve pas
réalisée,
nous ne pouvons tirer aucuneconclusion des résultats obtenus.
La méthode LABROUSTE ne
permet
pas de tester si une sériequelconque possède
despériodes;
ellepermet
de trouver lespériodes
d’une sériequi
encomporte.
Si on croit démontrer ainsi l’existence depériodes,
onprend
en faitpour conclusion une
hypothèse
apriori,
en aucun cas confirmée par le résultat du calcul.On serait tenté de
répondre
à cetteobjection
que sil’analyse
de LABROUSTEpermet
de trouver despériodes
c’est parce que cespériodes
existent réellement.Il n’en est
rien,
carl’analyse
effectuée porte sur un tronçon de la série seule- ment.Or, on montre que toute série
chronologique
nonpériodique peut,
sur un in- tervalle bornéquelconque,
êtreapprochée
d’aussiprès qu’on
veut par une com- binaison linéaire de sinusofdes dont lespériodes
et lesphases
sontpratiquement
arbitraires.
Par
suite, l’analyse
de LABROUSTEpratiquée
sur un tel intervalle révèle- rait l’existence de sinusoïdes . Bien mieux, suivant la manière dont s’effectueraitl’analyse,
on trouverait despériodes
et desphases
différentes.Si d’autre
part,
on effectuaitl’analyse
de LABROUSTE sur une autrepartie
de la
série,
on trouverait des sinusoides dont lescaractéristiques, périodes, phases
etamplitudes
seraient encore différentes de cellesqui
auraient été calcu- lées antérieurement.Par suite,
l’application
brutale de la méthode LABROUSTE à une série chro-nologique
dont il estimpossible
de savoir apriori
si elle estpériodique
ou non, nepeut
donner aucun résultat concluant en cequi
concerne la validité d’une extra-polation
dans l’avenir.Il existe un certain nombre d’autres méthodes basées sur des
propriétés
dif-férentes des processus, mais
qui
seproposent également
la recherche despé-
riodes.
Il en est ainsi
particulièrement
desprocédés d’analyse harmonique.
L’ANALYSE
HARMONIQUE
DESSÉRIES CHRONOLOGIQUES
L’analyse harmonique
d’une sériechronologique
conduit à l’établissement d’unpériodogramme qui
fournit les valeurs despériodes
éventuellesprésentées
par la série
chronologique.
Nous
indiquerons
trèsrapidement
leprincipe
de cette méthode.Considérons la série
chronologique
suivante :On calcule alors la
quantité
suivante :avec
ceci pour différentes valeurs de w. En
portant
sur ungraphique
w en abscisse etS¡(w)
en ordonnée on obtient ungraphique appelé périodogramme
de la série u¡ . Or, onpeut
montrer que si la série u est de la forme :J
la
quantité
S(w)
esttoujours
très voisine de zéro saufquand
w estégal
à l’unedes
périodes coj , auquel
cas S(0))
devientégal
àocj.
Autrement dit :Par suite le
simple
examen dupériodogramme
fournit immédiatement les va-leurs des
périodes
wj et desamplitudes correspondantes ocj.
Mais cette méthode toute séduisante
qu’elle paraisse
donne lieu aux mêmesobjections
que la méthode LABROUSTE. Elle est en effet valable seulement si on sait apriori
que la série étudiée estpériodique.
Il existe à la vérité un test
(test
deSCHUSTER)
donnant laprobabilité
pour que S excède une valeur donnéequand
uj est une variable aléatoire normale d’é- carttype
03C3. Mais ce test est valable pour une valeur de S choisie au hasard. Or,en
fait,
on choisittoujours
les valeurs lesplus grandes
de Spuisque
ce sont ellesprécisément qui indiquent
lespériodes
"valables" et d’autrepart
les variables usuivent souvent des lois non normales.
Par suite, les résultats
qu’on
obtient àpartir
de cette méthode sont illusoi-res et
l’application
erronée du test de SCHUSTER vient donner une confiancetrompeuse
dans lespériodes
mises en évidence.Un auteur italien étudiant des séries de
pluie
sur une centaine d’années(1820- 1921)
trouvejusqu’à
onzepériodes
s’échelonnant de trentecinq
à deux ans.L’ap- plication
incorrecte du test de SCHUSTER luipermet
d’en trouver huit hautementsignificatives (niveau
designification 10/00) !
1Là encore les résultats trouvés ne sont pas réellement
significatifs
parcequ’a priori,
on ne sait pas si la série étudiée estpériodique
ou non.Les méthodes que nous venons de passer en revue ont un caractère commun:
Elles se
proposent
deprévoir
l’avenir parl’extrapolation
de courbes effecti- vement observées dans lepassé.
Il y a là une sorte de définition fonctionnelle où laprobabilité
intervient très peu, et d’unefaçon
d’ailleurs erronée comme nousle
signalions plus
haut. De telles méthodes utilisent enquelque
sorte laprobabili-
té pour que
l’extrapolation
soit valable! Cetteprobabilité
est d’ailleurs souventune
question
d’"impression"
ou de "sentiment" chez les auteursqui
l’utilisent.Tel auteur ne dit-il pas "On sent que la
probabilité
estgrande
pour que lespério-
des observées dans le
passé,
se conservent dans l’avenir" !Le mode
d’analyse
que nous proposons repose sur desprincipes
tout à faitdifférents.
Nous cherchons à
décomposer
la sériechronologique
en élémentsplus
sim-ples
au moyen d’une"stylisation" analogue
à certainsprocédés
delissage.
L’analyse
nous fournit ainsi des élémentsplus simples
etplus
maniables que la série initiale et nous facilite l’étude des lois deprobabilité.
Nous chercherons ensuite la
prévision
de l’avenir non par uneextrapolation
des courbes observées dans le
passé
mais par l’utilisation des lois deprobabilité, après
avoir déterminé ces dernières sur la série dont nousdisposons.
La
première
tâche consiste donc àremplacer
la série observée par une autre dont les éléments seront calculés d’unefaçon mathématique.
On obtient ainsi lareprésentation
continue de la sérieconsidérée.
MÉTHODES
DEREPRÉSENTATION
CONTINUE DESSÉRIES CHRONOLOGIQUES
Une série
chronologique peut
êtrereprésentée
d’unefaçon
continue de deuxmanières.
1 ° On
peut ajuster
une courbe continueunique
sur l’ensemble de la série observée fut-elle trèslongue .
2° On peut
découper
la série en tranches delongueurs égales,
avec ou sans par- ties communes et effectuer unajustement
surchaque
tranche. C’est la méthodeemployée
dans les calculs de moyennes mobiles.D’une
façon générale,
lapremière
méthode est assez peu commode car elle manque desouplesse.
Le seul cas où ellepeut
donner satisfaction est celui oû la sériechronologique
est terminée. Dans les autres cas, l’observation d’un seulpoint supplémentaire
viendrait modifier la totalité del’ajustement.
La méthode que nous utilisons
appartient
à la secondecatégorie.
Elle n’estd’ailleurs pas nouvelle
puisque
M. FRECHET l’adéjà
utilisée dans une étudequ’il
avait effectuée sur la
représentation
des contours de crânes humains. Elle con-siste à
remplacer
la suite des débitsjournaliers
par desdéveloppements
de FOU-RIER calculés mois par mois.
ANALYSE DE FOURIER SUR LES
DÉBITS
Rappelons
encore une fois ici très nettementqu’il
nes’agit
pas dans cetteméthode de chercher ou de trouver des
périodicités
maissimplement
d’effectuerune
représentation
du processus. Pour clarifier les idées à cesujet,
nousrappel-
lerons brièvement
quelques propriétés mathématiques
des séries de FOURIER.Etant donnée une fonction
f (x)
continue et à variation bornée sur lesegment (o, 27T )
la série suivante :où
est uniformément
convergente
en x et elle définit une fonction f(x) périodique
depériode (27T ) égale
sur le segment(0, 2 n )
à la fonction nonpériodique
f(x).
On peut d’ailleurs effectuer un
développement analogue
surn’importe quel
autre intervalle
(a, b)
en effectuant sur la variable x la transformation suivante:Nous allons donner deux
exemples
trèssimples:
considérons sur l’intervalle(-71 , +TC )
la fonction y = x; la fonction suivante :est
périodique
etégale
à x sur l’intervalle considéré.Si nous prenons sur ce même intervalle
(-1t ,
+1t)
la fonction y =x2
la fonc- tion suivante :est
périodique
etégale
à x2 sur l’intervalle(-71 , + ’7t )
Nous voyons donc
qu’il
estparfaitement possible
dedévelopper
des fonctionsnon
périodiques
en sériespériodiques.
La seuleprécaution
àprendre
consiste àn’utiliser le
développement
trouvé que dans l’intervalleayant
servi à le définir.Dans la suite nous
appelons Xi
le débit moyenlogarithmique (1) journalier
dujour
i. Comme on l’a ditplus
haut, on peut considérer le débit instantanéloga- rithmique
X(t)
comme une fonction continue dont on connait les valeurs moyennesjournalières.
On aurait alors :T;
étant un instantcompris
entret,
-I ett,
Nous ne soulèverons pas de difficultés sur ce
point qui
relèveuniquement
del’analyse mathématique.
(1)
Cette appellation due à E. HALPHENdésigne
le logarithme décimal du débit moyen journalier .Disons
simplement
que nous construisons ledéveloppement
de FOURIER de la fonction X(t)
mois par mois àpartir
des valeurs X . Nousremplaçons
lescoefficients
théoriques :
-par le s valeur s suivantes :
On
pourrait
démontrermathématiquement
que cette substitution donne encore une sérieconvergent
vers X(t) moyennant
certaines conditions.Un
problème important
va se poser maintenant. Il nepeut
êtrequestion
évi-demment de calculer tous les termes de la série. Par
conséquent,
on va êtreobligé
de choisir le nombre de termes à retenir.NOMBRE
D’HARMONIQUES
A RETENIR ,On ne
peut parler
d’un choixobjectif
du nombred’harmoniques
nécessaires.Il faut bien voir le but que nous visons :
représentation
etdescription optimales
du processus suivi par les débits.
Il
s’agit
là d’unoptimum statistique qui
ne se confond pas du tout avec un op- timumanalytique.
Eneffet,
si on voulaitreprésenter
"au mieux"analytiquement
la fonction X
(t),
il faudrait calculer le nombre maximumpossible d’harmoniques.
On obtiendrait ainsi un
ajustement
trèssouple qui représenterait
très bienchaque
courbe
mensuelle,
mais d’un mois àl’autre,
on trouverait des courbes de FOU- RIER très différentes entre elles.Précisons donc ici le but
poursuivi :
Ils’agit
d’isoler dans le processus une tendancesystématique - quoique
aléatoire - et unecomposante purement
due au hasard dont nous étudieronsséparément
les lois deprobabilité.
Or, si le nombre
d’harmoniques
est trèsgrand,
lacomposante
purement aléatoire serapetite,
tout l’aléa résiduel étant absorbé par ledéveloppement trigonométrique qui
deviendra lui-même très variable d’un mois à l’autre.En
revanche,
si onprend
un nombred’harmoniques
trèspetit,
la tendancesera stable et
d’analyse plus simple
mais le terme résiduelprendra
uneimpor-
tance
trop considérable.
Notre
optimum
se situera entre ces deuxpôles
extrêmes .On
pourrait
lesymboliser
de lafaçon
suivante. Considérons laquantité :
La valeur n "la meilleure" de notre
point
de vue sera cellequi correspondra
au minimum du coefficient de corrélation
Z;
etZi-1 .
D’une
façon plus exigeante,
onpourrait
définir n par la condition que le cor-rélogramme
de la série desZi
serapproche
leplus possible
ducorrélogramme
d’une série
purement
aléatoire.L’imprécision
de ces définitions nous a conduitsà les
rejeter.
..On voit que la notion
d’optimalité
est assezvague etqu’il
n’est pas très facile d’en tirerparti
concrètement enimposant
la conditionsupplémentaire
que n soit le mêmequels
que soient les mois considérés.En
fait,
on nepeut
se décider àpartir
de critères aussiimprécis
et on faitlargement appel
à des considérationsempiriques.
Dans le cas concret
qui
nous intéressait nous avons choisi pour n la valeur 3 de sorte que notre formulation seprésente
de la manière suivante : ice
qui peut
s’écrire :Nous écrirons finalement le débit sous la forme suivante :
Z3i
étant un résidu aléatoire.Ceci
équivaut
à considérer le débit X(t)
comme lasuperposition
d’un pro-cessus
simple X*
où seuls lesparamètres
sont aléatoires et d’une variable aléa- toire Z dutype classique.
Avant de passer directement aux
applications,
noussignalerons
unepetite
difficulté de réalisation
pratique.
Comme nous le disions avec force
plus
haut, le processus étudié n’est paspériodique.
Or ledéveloppement
de FOURIER que nous utilisons est, lui,pério- dique,
de par sa construction même. Laconséquence pratique
de cette différencede structure est la suivante. Aux deux bouts de
chaque période étudiée,
le déve-loppement
de FOURIER s’écartesystématiquement
de la courbe naturellequ’il
doit
représenter .
Nous avonspallié
à cet inconvénient en effectuant lareprésen- tation,
non pas sur la durée réelle dechaque
mois, mais sur unepériode
de 36jours
encadrant le mois calendaire et nous n’étudions lacorrespondance
entrecourbe
ajustée
et courbe naturelle que sur le mois réel ennégligeant
les deux ex-trémités "aberrantes" du
système. L’avantage
de cette méthode est double.Nous obtenons une
représentation qui
est correcte et satisfaisante sur l’in- tervalle où nous la conservons et d’autrepart
les calculspratiques
se trouventtrès
simplifiés
par le fait que 36 est le dixième de360....
Il nous suffit de consi- dérer dans le calcul des coefficients a; etbi
desangles qui
varient demultiples
de 10".
APPLICATIONS DE LA
MÉTHODE
Nous avons
appliqué
cette méthode à la station dePont-de-Carouge
sur l’Arve.On trouvera en annexe, un certain nombre de
graphiques qui
donnent, pour différents mois, les courbes de débitslogarithmiques
et les courbes des écarts entre ces courbes naturelles et les séries de FOURIERcorrespondantes
arrêtéessuccessivement au
premier,
au second... au sixièmeharmonique. (Figures
2 à5).
On constatera ainsi que notre choix sur le nombre
d’harmoniques
à considé-. rer,
correspond
à uncompromis
entre le désir d’avoir une autocorrélation mini-ma et d’autre
part,
celui de conserver une série de FO URIER maniable.Arve au Pont de Carouge Mars 1932 Courbe des débits logarithmiques
Arve au Pont de Carouge Mars 1932
Ecart entre la courbe des débits logarithmiques et les séries de Fourier correspondantes
Fig. 3
Arve au Pont de Carouge Mai 1949 Courbe des débits logarithmiques
Arve au Pont de Carouge Mai 1949
Ecart entre la courbe des débits logarithmiques et les séries de Fourier correspondantes
Fig. 4
Arve au Pont de Carouge Juillet 1931 Courbe des débits logarithmiques
Arve au Pont de Carouge Juillet 1931
Ecart entre la courbe des débits logarithmiques et les séries de Fourier correspondantes
Fig. 5
Arve au Pont de Carouge Décembre 1933 Courbe des débits logarithmiques
Arve au Pont de Carouge Décembre 1933
Ecart entre la courbe des débits logarithmiques et les séries de Fourier correspondantes
Le tableau ci-dessous résume les éléments de notre choix à ce
sujet.
On y trouvera pour différents mois, les autocorrélations de la série des débitsloga- rithmiques
et des différents écartsZ;
Nous voyons que dans tous les cas, l’écart
Z3
a une autocorrélationbeaucoup
moins forte que le débit
logarithmique
lui-même.Nous ferons
cependant
à cetégard
deux remarques :Tout d’abord, les autocorrélations que nous trouvons pour
Z3
sont faiblesmais elles ne sont pas
nulles,
ni mêmenégligeables.
D’autre
part,
il n’est paspossible
de tirer une conclusion définitive de l’exa-men de
sept
mois seulement.Ces restrictions mises à
part,
nous étudieronsséparément
lapartie systé- matique
et lapartie
résiduelle de notredécomposition.
PARTIE FONCTIONNELLE DE LA
DÉCOMPOSITION
Nous
appelons partie
fonctionnelle de ladécomposition,
la série :i=3
X* (t) = a0 + 03A3 Ai
1=1 cos(i w t - ’fi)
Nous avons pu vérifier sur un certain
nombre
de mois(janvier,
mars,juin, novembre)
que les éléments : ao JA1, A.
etA3
étaient peu corrélés entre eux etqu’ils
suivent convenablement une loiharmonique.
Lesparamètres tg Cf1 ’ tg Y2
et
tg tf’3
sontindépendants
et suivent des lois normales .(Voir
lesfigures 7
à10).
Par suite, la
partie systématique X*
estcomplètement définie, puisque
saforme
analytique
est donnée et que la loi deprobabilité
desparamètres qui
yfigurent
est déterminée.Il nous reste à considérer la
partie
résiduelle.PARTIE
RÉSIDUELLE
DUDÉVELOPPEMENT
Le tableau que nous avons donné
plus
haut montre que l’autocorrélation de la sérieZ3
n’est pasnégligeable généralement.
Nous en déduisons que le processusZ3
n’est pas à valeursindépendantes.
Fig. 6
Arve au Pont de Carouge Janvier
Polygone de fréquence des amplitudes et des phases des développements de Fourier
Fig. 7
Arve au Pont de Carouge Avril
Polygone de fréquence des amplitudes et des phases des développements de Fourier
Fig. 8
Arve au Pont de Carouge Juin
Polygone de fréquence des amplitudes et des phases des développements de Fourier
Fig. 9
Arve au Pont de Carouge Septembre
Polygone de fréquence des amplitudes et des phases des développements de Fourier