R EVUE DE STATISTIQUE APPLIQUÉE
B ERNARD B URTSCHY
J ACQUES S ERVAIN
Modélisation statistique de la température de surface de la mer
Revue de statistique appliquée, tome 34, n
o3 (1986), p. 21-47
<http://www.numdam.org/item?id=RSA_1986__34_3_21_0>
© Société française de statistique, 1986, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
MODÉLISATION STATISTIQUE
DELA TEMPÉRATURE DE SURFACE DE LA
MERBernard BURTSCHY
(1)
etJacques
SERVAIN(2)
(1)
Ecole Nationale Supérieure des Télécommunications, 46, rue Barrault, 75634 Paris Cedex 13.(2) Laboratoire d’Océanographie Physique, Université de Bretagne Occidentale, 6, avenue Victor Le Gorgeu, 29200 Brest.
Présente Affilation : Antenne ORSTOM, IFREMER BP 337 22273 Brest-Cedex
RÉSUMÉ
Des séries mensuelles de température océanique et atmosphérique à l’interface air-mer sont
analysées sur une zone de l’Atlantique Nord-Est, proche du plateau continental européen.
L’objectif est d’établir la meilleure technique statistique pour prévoir l’évolution de la température
de surface de la mer. Les séries temporelles utilisées couvrent les années 1947-1982.
Différents jeux de coefficients de modélisation (méthodes ARIMA univariées et à fonctions de transferts) sont calculés sur la période 1947-1979; la performance prévisionnelle (pour 1 à 3 mois d’avance) est testée sur les années 1980 à 1982. Afin de minimiser l’erreur de prévision de la température de surface de l’océan, il est nécessaire de quantifier les fluctuations saisonnières de
l’impact des anomalies mensuelles passées à l’aide d’une méthode originale basée sur le transfert saisonnier optimal. Cette erreur est réduite pour les mois où la température de surface de la mer est particulièrement stable (hiver-été). La forte inertie thermique du paramètre océanique explique
que l’auto-transfert soit généralement plus important que le transfert croisé entre les deux
températures. Des situations inverses se produisent toutefois pendant les mois d’établissement ou
de destruction de la thermocline saisonnière. Ce dernier résultat peut s’expliquer par une sensibilité prononcée de l’océan superficiel à la variabilité atmosphérique durant ces périodes. D’autre part, le caractère stochastique de la saisonnalité (par rapport au caractère déterministe) est mis en évidence. Pour la prévision de l’anomalie mensuelle de surface de la mer avec un mois d’avance, la méthode optimum proposée permet une réduction de moitié de l’écart-type résiduel.
Mots clés : Modélisation
statistique,
Coefficients detransfert,
Variation saison-nière, Température
de surface.Key
words: Statisticalmodelling,
Transfercoefficients,
Seasonalvariation,
Sea surfacetemperature.
INTRODUCTION
Dans le Nord-Est de l’océan
Atlantique,
le contenucalorifique superfi-
ciel est
principalement régi
par le bilanthermique
à l’interface air-mer. Lapart
due à l’advection estréduite;
ellereprésente
moins de 15 % aux abords duplateau
continental. Le bilanthermique
étant lui-même essentiellement ra-diatif,
latempérature
de surface de la mer suit une évolution dominée par uncycle
saisonnier. En se référant à unsignal
annuel moyen calculé sur unelongue période,
onpeut
définir les anomalies successives de latempérature
desurface. Les séries
chronologiques
ainsicomposées représentent
la variabilitéthermique
interannuelle.22
Dans le
golfe
deGascogne,
les courants de surface sont faibles ettourbillonnaires,
cequi
sous-tend une modification lente descaractéristiques hydrologiques
des masses d’eau. Cettestationnarité,
associée à lagrande
inertie
calorifique
de la mer,permet
un caractère conservatif des anomaliesthermiques
de l’océansuperficiel (KRAUS
etMORRISON, 1966;
REY-NOLDS, 1979).
Unepropriété
similaire n’existe évidemment pas pour lesmasses d’air
atmosphériques. Toutefois, lorsque
l’on étudie lesystème océan-atmosphère
de manièrecouplée,
il estparfois possible
de décelercertains
phénomènes
conservatifs au niveau de l’interface. La liaison ther-modynamique
s’effectue dans les deux sens et il s’ensuit des actions et des rétro-actions entre les deux milieuxpouvant
entretenirpendant quelques
moiscertaines anomalies
climatiques (FRANKIGNOUL
etHASSELMAN, 1977;
SERVAIN, 1980).
Nous nous proposons, dans un but
prévisionnel
de l’anomalie mensuelle de latempérature
de surface de la mer,d’exploiter statistiquement
les pro-priétés
conservatives decelle-ci,
en s’aidant simultanément de sa liaison avecla
température
de l’air. Pour cetobjectif,
nousanalysons
les sérieschronologi-
ques formées à
partir
d’observations de ces deuxparamètres pendant
lapériode
1947-1982 sur une zone del’Atlantique proche
des côtesfrançaises.
Différentes méthodes sont
utilisées,
mettant enjeu l’analyse
desautorégres-
sions
simple
et croisée des deuxtempératures
de surface.L’impact
saisonnierdu
couplage thermique océan-atmosphère
est mesuré. Il nouspermet
d’affinerun modèle
statistique
deprévision
de latempérature
de surface de la mer. Dans la discussionfinale,
nous établissons les aboutissements d’une telle étude.1. DISCUSSION DES
PARAMÈTRES UTILISÉS
Les données de
climatologie
de surface utilisées iciproviennent
de lacollecte des
rapports météorologiques
de navires marchands de toutes nationa- lités. Unepremière
source d’informations fut achetée au Environmental DataService,
Asheville N.C.(U.S.A.)
et regroupe des données de 1947 à 1972. Une seconde source nous a étécommuniquée
par le Service deClimatologie
Marinede la
Météorologie Française
etcomplète
les observationsjusqu’en
décembre1982. La zone retenue, volontairement restreinte
(2°
de latitude par 2° delongitude),
est située aux abords duplateau
continental lelong
du rail denavigation
Brest-LaCorogne (Fig. 1).
Les relevés
météorologiques
des navirescomportent
nombre d’informa-tions,
concernant notamment lestempératures
de surface de la mer et del’air,
le vent et la
pression barométrique.
Une étudepréliminaire (SERVAIN, 1979)
a montré
cependant qu’à
une échelle detemps
de l’ordre dumois,
lapression
et la force du vent étaient peu corrélées avec la
température
de surface de lamer. Il reste
qu’en
zoneocéanique proche
du littoraleuropéen
les deux seulsparamètres,
vraimentreprésentatifs
de la liaisonclimatologique
moyenne mensuelle entre l’océan etl’atmosphère,
sont lestempératures
de surface dela mer et de l’air
(Fig. 2).
Les évolutions moyennes annuelles des deux
températures
de surfacsuivent un
cycle similaire,
avec un maximumthermique
en étéqui apparaît e
Revue de Statistiques Appliquees, 1986, vol XXXV,
n°3
Figure 1. - La zone géographique utilisée est limitée en latitude par les parallèles 46°N, 48°N
et en longitude par les méridiens 6°W, 8°W.
phase (mi-août)
et un minimumthermique
en hiver décalé d’environ un mois entre lesignal
de latempérature
de l’air(mi-février)
et celui de latempérature
de la mer
(mi-mars).
De fin avril àseptembre
la mer estlégèrement plus
froideque l’air. C’est
pendant
cettepériode
que l’océan accumule sonénergie calorifique
en provenance del’atmosphère.
Pendant le reste del’année,
lesignal thermique
de la surface de larper
estsupérieur
à celui del’air,
favorisantainsi le transfert
énergétique
del’océan
versl’atmosphère
par le flux de chaleur sensible et latent.Dans la suite du texte, on notera par M et A les séries se
rapportant respectivement
à latempérature
de surface de la mer et à latempérature
desurface de l’air.
L’écart-type
de l’anomalie mensuelle de latempérature
desurface de la mer
(SM
#0.6 °C)
estpratiquement toujours
inférieur à l’écart-type équivalent
pour latempérature
de l’air(SA
# 0.8°C).
Ceci marque le caractèreplus
stationnaire de lathermodynamique
marine par rapport à celle del’atmosphère.
Nous notons toutefois une modulation saisonnière dans lerapport SM/SA.
Celui-cidépasse
rarement 0.5 enhiver,
alorsqu’en
été ilavoisine l’unité. Ce dernier résultat
s’explique
par des mouvements atmo-sphériques
moinsprononcés
en saisonestivale, provoquant
une diminution de la variance de latempérature
de l’air. Par contre, durant cettesaison,
le contenuthermique
de l’océan est concentré sur une couche demélange
peuépaisse
au-dessus de la
thermocline,
cequi
facilite uneplus grande
variabilité de latempérature
de la surface de la mer et, nous le verrons par lasuite,
uneplus
grande
sensibilité aux variationsrapides
del’atmosphère.
24 Revue de Statistiques Appliquees, 1986, vol XXXV, n° 3
2. LA
MÉTHODOLOGIE
D’ANALYSE2.1.
L’analyse
des sérieschronologiques
Une série
chronologique
est un ensemble d’observations ordonnées dans letemps;
en serestreignant
aux sérieschronologiques discrètes, finies,
avec desobservations
régulièrement
etégalement espacées,
on notera les sériesZi, Z2 , ..., Zt
,...Il est assez naturel
d’analyser
la manière dont un instant t est lié à ses p instantsprécédents représentés
parZt - 1 , Zt - 2, ..., Zt - p
cequi
revient à calculerl’autorégression (d’ordre p)
de la série :où at
représente
l’erreur au temps t.Ce modèle
peut
êtregénéralisé (BOX
etJENKINS, 1968)
en introduisant les réactions aux qperturbations
subies par le modèle aux instants t -1, t
-2,
..., t - q et
représentées
par les erreurs ai-i, at-2, ..., at-q :Ce modèle est
appelé
un modèleARMA(p,q)
i.e.AutoRegresive Moving Average
ou encoreAutoRégression
àMoyenne Ajustée.
Les ordres p et q du modèle sontdéterminés grâce
à l’examen des coefficients d’autocorrélation de la série : l’autocorrélationpzz(k)
avecdécalage
k de la série Z mesure la corrélation entre les observationsZt
etZt-k.
L’analyse
d’un telmodèle, impliquant
une seule sérieZ,
est nomméeanalyse
univariée.La liaison entre deux séries Z et X
peut
être modélisée par deuxéquations :
Où
e(Zt ) représente
l’erreur du modèle de la série Z(de
même pourX).
Dans le cas le
plus général,
ces deuxéquations
ne sont pasindépendantes
l’une de l’autre et il faut les estimer simultanément selon un modèle bivarié.
L’étude de la liaison entre deux séries
implique
un nouvel outild’analyse,
la corrélation croisée
pzx (k)
avecdécalage
k. Maisl’interprétation
directe dela corrélation croisée est
impossible
car elledépend
des autocorrélations des deux séries(GRANGER
etNEWBOLD, 1974).
Les autocorrélations sontéliminées en calculant la corrélation croisée sur les résidus des séries
après
modélisation univariée de chacune d’entre elles
(HAUGH, 1976;
HAUGH etBOX, 1977) :
cette nouvelle corrélation estappelée
corrélation croisée « blan-chie »,
alors que la corrélation croisée issue du calcul direct sur les deuxséries,
sans transformation aucune, est nommée corrélation croisée « non blanchie ».
26
Figure 3. - Fonctions de corrélations croisées « non blanchie » (a) et « blanchie » (b) entre les séries des anomalies de température de surface de la mer et de l’air.
La ligne en pointillé indique le seuil de l’intervalle de confiance à 95 %. La partie gauche des tracés est relative à l’influence de la température de l’air sur la température de l’eau. La partie
droite représente l’influence inverse.
Il
peut
arriverqu’une
seule des deux influences(soit
X surZ,
soit Z surX)
soitsignificative
etqu’il n’y
ait pas de « feedback » : à l’examen des corrélations croisées blanchiespzx (k),
on constaterait alors la nullité(au
sensstatistique)
de ces corrélations soit pour k >0,
soit pour k 0. La nullité pour k = 0impliquerait
l’absence de liaison instantanée entreZt
etXt (i.e.
sansdécalage)
et la nullité pour tous lesdécalages,
l’absence de liaison.Revue de Statistiques Appliquees, 1986, vol XXXV, n° 3
Dans le cas où une seule des deux influences est
significative (par exemple
X surZ), l’équation
obtenues’apparente
à unerégression, qu’on appellera
le « transfert ».Exemple
de transfert :La
figure
3 montre unexemple
de corrélations croisées non blanchie etblanchie entre les deux séries étudiées. Il est bien évident que seule la
partie
inférieure de la
figure (la
corrélationblanchie)
nous est utile pourl’interpréta- tion,
la corrélation non blanchie nefigurant qu’à
titrepédagogique.
On observel’existence d’une
importante
corrélation instantanée(0.54)
entreMt
etAi.
D’autre
part,
la liaison entreMt
etAt-l
estsignificative (0.25)
et l’on notel’absence de tout « feedback » c’est-à-dire de liaison entre, par
exemple, Mt-l
et
At.
Ceci autorise une modélisation par uneéquation unique
dustyle
Mt =f(Mt-1, At, At-, ).
2.2. Le
problème
de la saisonnalité des sériesLa forte saisonnalité des
chroniques
étudiées icicomplique singulière-
ment
l’analyse
sur leplan statistique.
Aussi est-ild’usage
dans ce cas d’éliminera
priori
la variation saisonnière afin d’en extraire « l’anomalie ». La définition même de « l’anomalie » est délicate. Ilpeut s’agir
eneffet,
soit d’une différenced’amplitude
entre lesignal
d’une annéespécifique
et celui de l’année moyenne, soit d’undéphasage
entre ces deuxsignaux,
soitplus généralement
d’unejuxtaposition
des deux casprécédents.
S’il n’existe pas de méthodeparfaite
dans le domaine de la
désaisonnalisation,
certainestechniques
sontplus
efficaces que d’autres selon les circonstances. Celle de BOX et JENKINS
(1970)
traitedynamiquement J-a
saisonnalité par différentiation :La saisonnalité est dans ce cas traitée
stochastiquement
et lasérie, auparavant
nonstationnaire, apparaît beaucoup plus simple
à traiter. Lesdangers
d’une tellesimplification
ont été mis en évidence par SLUTSKY(1927) :
enparticulier,
s’il existe des tendances ou des saisonnalités déterminis- tes, celles-ci serontcomplètement masquées
et des modèlesinadéquats peuvent
être identifiés. La vérification de telssymptomes
se fait aisément avec le modèleAR(2) qui
a despropriétés périodiques lorsque
les racines dupoly-
nôme associé sont
complexes.
Soit le modèleAR(2) :
où B est
l’opérateur
de retard : BZt - Zt - 1.
Si les racines du
polynôme
associé en B sontcomplexes «pi
+ 4 (P20)
les
caractéristiques
dusignal
définies par safréquence fo
et par son amortis-sement d sont données
(BOX
etJENKINS, 1970)
par :28
S’agissant
d’une série mensuelle(période
12 doncfo
=1 / 12)
dontl’amortissement est constant
(d
=1),
on aLe modèle saisonnier s’écrira sous la forme :
Si le
calcul
des racines dupolynôme
d’un modèle saisonnier faitapparaître
des racinescomplexes proches
de 1 en valeurabsolue,
il estlégitime
de différencier. Mais si deux racines ouplus
sontsupérieures
à 1 envaleur
absolue,
il est fortprobable qu’une composante
déterministe soitprésente.
Pour éliminer la variation
saisonnière,
une autre méthode consiste àsoustraire à
chaque
terme de la série la moyenne mensuellecorrespondante
calculée sur l’ensemble de
l’historique (HIPEL
etMc LEOD, 1980) :
Cette
méthode, appelée
« méthode des moyennes », estparticulièrement simple
maispossède
deux inconvénientsmajeurs :
elle ne tient pascompte
des différences entre variances mensuelles et elle suppose que la série n’a pas de tendance.Le
premier
inconvénient est aisé àsupprimer :
il suffit de diviser par l’écart type du moiscorrespondant :
où
Ej représente
l’écart type du moisj.
Cette méthode
nécessite,
pour une sériemensuelle,
12 estimations de moyenne et 12 estimations d’écarttype,
soit 24paramètres.
L’estimation dece
grand
nombre deparamètres peut
être réduite en lesapproximant
par les séries de Fourier(PARZEN
etPAGANO, 1979).
Les formulespermettant
d’estimer les coefficients de Fourier et leurapplication
à l’estimation desMj
et
Ej
sont bien connues dans la littérature(CROLEY
etRAO, 1977).
L’utilisation de toutes les composantes de Fourier est
équivalente
à l’estima-tion des
Mj
etEj.
S’il
peut paraître légitime
de considérer apriori
l’absence detendance,
il ne faut pas oublier que toute la notion d’anomalie en
dépend.
Cette absence de tendance constitue unehypothèse qu’il
estpossible
de vérifier à l’aide d’une méthode de désaisonnalisation telle que X 11(SHISKIN et al., 1967) : Xll,
méthode de désaisonnalisation très utilisée enéconomie,
recherche laRevue de Statistiques Appliquees, 1986, vol XXXV, n° 3
Figure 4. - Tendance (par la méthode X11) de la température de surface de la mer (trait continu)
et celle de l’air (trait discontinu).
Les tirets sur l’axe temporel indiquant le mois de décembre de l’année en regard.
tendance d’une série par
applications répétées
de filtrespondérés
basés surla moyenne mobile. Dans le tracé de la tendance des deux
températures
desurface par XI 1
(Fig. 4),
une relation étroite dans le domaine des bassesfréquences
est mise en évidence. On note enparticulier
une forte oscillationproche
de deux ans(l’Oscillation Quasi-Biennale, OQB, déjà remarquée
de nombreuses fois lors d’étudesantérieures,
ANGELL etKORSHOVER, 1974;
ZVEREV, 1977; SERVAIN, 1979).
Les deux séries semblent aussi être modulées par une fluctuation dont lapériode
serait une dizaine d’années.Pour la
température
de surface de la mer, nous notons unelégère
décrois-sance
proche
dequatre
dizièmes dedegrés
entre les années 1950 et les années 1980. Ce refroidissement fait suite au lent réchauffement séculairequi
a vuson
apogée
vers 1950(FIEUX
etSTOMMEL, 1975; SERVAIN, 1976).
Enrevanche il n’existe
apparemment
aucune tendance linéaire entre les deux extrémités de la série de latempérature
de l’air. On segardera d’analyser
lestransferts entre séries
désaisonnalisées,
les mauvaises identifications étantfréquentes (NEWBOLD, 1980).
La saisonnalité faitpartie intégrante
dutransfert.
La recherche de la saisonnalité pose un
problème plus général :
ils’agit
de déterminer
qu’elles
sont les partsrespectives
descomposantes
détermi- nistes oustochastiques
de cette saisonnalité(HAVENER
etSWAMY, 1981),
étant bien entendu que la méthode des moyennes est un moyen de
supprimer
la
composante
déterministe enpréservant
la saisonnalité. Onappellera
dansla suite anomalie centrée la série dont on a retiré les moyennes mensuelles
respectives
et anomalie norméelorsque
de surcroît elle a été divisée parl’écart-type correspondant.
Les sériesqui
n’auront pas subi ce traitementseront identifiées dans la suite sous le nom de séries
brutes,
séries que l’onsera amené à différencier pour
préserver
leur stationnarité.30
Dans le but de vérifier le déterminisme de la composante saisonnière et d’en mesurer toutes les
conséquences,
toutes les méthodes seront testéessur les trois
types
de séries(brutes, centrées, normées).
2.3. Modèles univariés et à fonctions de transferts
L’objectif
de l’étude estl’analyse
et laprévision
de la série de latempérature
de surface de la mer M. Dans unepremière étape, l’analyse
univariée de cette série sera effectuée par la méthode
ARIMA (AutoRe- gressive Integrated Moving Average).
Cetteanalyse
seraeffectuée,
commeexpliqué ci-dessus,
sur la série brute et les deux séries d’anomalies(centrée
et
normée).
Le testprévisionnel
del’extrapolation permettra
d’établir unepremière
based’analyse.
La série A est
susceptible
d’êtreexplicative
de M. La fonction de corrélation croisée sera utilisée afin de détecter lesdécalages
et la formed’influence.
Cependant,
un calcul correct de la corrélation croisée nécessite que les deux séries soientpréalablement
« blanchies » de leur autocorrélation(HAUGH
etBOX, 1977)
cequi
induit uneanalyse
univariée de A. Le modèle à fonctions de transfert obtenu sera testéprévisionnellement
et confronté aumodèle univarié pur.
3. LES
RÉSULTATS UNIVARIÉS
ETÀ
FONCTIONS DE TRANSFERTS3.1. Les résultats univariés
Les deux séries brutes M et A ont été rendues stationnaires à l’aide d’une différenciation saisonnière dont l’utilisation
paraît s’imposer
sansambiguïté
à l’examenvisuel
des autocorrélations. Le caractèrestochastique
de la saisonnalité
(cf. 2.2)
est confirmé par le calcul des racines dupolynôme
associé au modèle
correspondant :
les racines sontproches
de 1 en valeurabsolue. Aussi le raisonnement
portera
non sur la série dedépart
mais surl’accroissement saisonnier :
Les séries des anomalies ne
présentent
aucune difficulté d’identification.Il en est tout autrement des modèles sur séries différenciées : les
modèles, beaucoup plus complexes
àidentifier,
sont aussiplus
riches(tableau I).
Ilsfont très nettement
apparaître
l’oscillationquasi-biennale
de 24 mois citéeci-dessus.
Si l’on examine les deux modèles
(plus simples)
relatifs à l’anomalienormée,
on obtientrespectivement
pour M et A les modèles suivants :Sa représente l’écart-type
résiduel(calculé
sur lesai).
Revue de Statistiques Appliquees, 1986, vol XXXV, n’ 3
TABLEAU 1 La modélisation univariée
Ces deux modèles sont des modèles
autorégressifs
d’ordre 1 avec desinerties différentes. Une variation de 1° à l’instant t se
répercutera
de lafaçon
suivante les mois suivants :
32
Une meilleure réduction de la variance
et
une meilleureperformance prévisionnelle
de latempérature
de surface de la mer en découlent naturelle- ment, cequi rejoint
lephénomène physique
d’uneplus grande capacité
demémorisation de l’océan.
3.2. Les fonctions de transferts
La
question posée
est alors de déterminer si la connaissance de Apermet
d’améliorersignificativement
laprévision
de M. Nous avons vuprécédemment qu’après
examen des corrélations croisées blanchies entre les deuxséries,
ilpouvait
êtreenvisagé
une modélisation de M suivantl’équation M, = f(Mt-1, A,, A,-,).
Deux
conceptions s’opposent
alors. Laconception descriptive
modélisecette liaison afin de bien tenir
compte
de la nature de l’influence(tableau lIa).
Ainsi pour l’anomalie
normée,
nous aurons la relation :Mt -
0.47At -
0.21Ai-.
+ 0.54Mt-l
+ atSa =
0.64 Legain
en écarttype
résiduel estsignificatif
car il estpassé
de 0.78(univarié)
à 0.64. Laprévision
ne s’estcependant guère
améliorée car pourprévoir Mt+ 1,
il fautprévoir At+,
1 cequi
n’estguère
efficace en raison de la faible inertie de A. L’autreconception (tableau IIb)
estplus prévisionnelle.
Lors du calcul de la
prévision
de M à l’instant t +1,
on ne connait pas la valeur deAt+1.
On identifie alors un modèle décalé entreMt
etAt-1
enignorant
le terme de liaison instantanéAt.
Il nes’agit
certes pas du meilleur modèle au sens de ladescription
mais la corrélation croisée estsignificative.
On a ainsi le modèle suivant pour l’anomalie normée :
Mt =
0.11At-i
+ 0.59Mt-i
+ atSa =
0.77La réduction de variance est à
peine
sensible et laperformance prévisionnelle guère
meilleure. Force est donc de constater que sil’impact
instantané de
At
surMt
estsignificatif,
il est peu efficace dupoint
de vueprévisionnel
à cause de la faible inertie de A. Ceci illustre bien le fait quece
qui
est efficace pour la modélisation ne l’est pas forcément pour laprévision.
Enconséquence,
le modèle basé sur les fonctions detransferts,
s’ilpermet
de biencomprendre
la nature del’impact
de latempérature
del’air,
n’est pas
compétitif
d’unpoint
de vueprévisionnel
parrapport
au modèle univarié pur.Revue de Statistiques Appliquees, 1986, vol XXXV, n° 3
4. LE TRANSFERT SAISONNIER
4.1. Vers une nouvelle forme de transfert
Comme toutes les méthodes
appliquées
à des sériessaisonnières,
laméthode des fonctions de transfert a l’inconvénient de ne pas individualiser les mois et, par
conséquent,
de calculer une sorte decomportement
moyen.34
TABLEAU III Le transfert saisonnier
Or l’examen
approfondi
des résidus des modèlesprécédents
montre que l’influence de l’anomalie varie selon le mois considéré. Cette constatation conduit à réestimer les divers coefficients del’équation
de transfert mois par mois.Le tableau III montre la variation mensuelle des coefficients de
l’équation
de base de l’anomalie normée :Mt = 0.47
At -
0.21At-1
+ 0.54 Mi-i + atLes coefficients des divers modèles varient dans de
grandes proportions
et l’examen des
écarts-types
résiduels montre que certains mois sont mieux modélisés que les autres.Le tableau IV montre la variation mensuelle des coefficients de
l’équation
décalée de l’anomalie normée :Mt =
0.11At -
1 + 0.59M,
1 + at4.2. La
régression
pas à pas à saisonnalité évolutivePlusieurs coefficients des tableaux III et IV ne sont pas
statistiquement significatifs.
D’autrepart, l’application
des fonctions d’autocorrélations etd’autocorrélations
partielles
sur les séries résiduelles montre que certaines ne sont pas aléatoires. Cecisignifie
concrètement que ce ne sont pas seulementRevue de Statistiques Appliquees, 1986, vol XXXV, n° 3
TABLEAU IV Le transfert saisonnier décalé
TABLEAU V Transferts saisonniers optimaux
36
les coefficients
qui
varient selon lesmois,
la structure du modèle restantfixe,
mais
qu’il
faut aussi remettre en cause la forme del’équation.
En fait rien
n’empêche
d’identifier uneéquation
différente pourchaque
mois selon la
méthodologie
des transferts si ce n’est que cetteapproche
estfastidieuse : pour des données
mensuelles,
il faudrait identifier et estimer 12équations.
Cetteapproche
estpossible
car nous avons la chance dedisposer
d’une série suffisammentlongue.
Les différenteséquations
de cemodèle,
que l’onpourrait appeler
modèle àéquations variables,
sont résu- mées dans le tableau V.Comme les séries sont toutes fondamentalement
autorégressives,
uneautomatisation devient
possible grâce
àl’autorégression
pas à pasoptimale
telle
qu’elle
estpréconisée
par GRANGER et NEWBOLD(1977, p. 176).
Cela revient à chercher
parmi
tous lesdécalages
le sous-ensemblesignificatif.
Pour des raisons
physiques évidentes,
nous avons limité la recherche à 12décalages
mensuels pour M et 3 pour A. Desdécalages supérieurs
n’auraient aucun sens et n’introduiraient que des liaisons
purement
fortuites.Notons que cette méthode
originale
donne les mêmes résultatsqu’une
identification
équation
paréquation
enayant l’avantage
de l’automatisme.Cette
approche
peut encore être amélioréegrâce
à une utilisationjudicieuse
del’analyse
en composantesprincipales (les
composantes mineu- res, cf.Annexe).
4.3. Discussion des transferts saisonniers
optimaux
En
comparant
lesécarts-types
des erreurs(Sa)
donnés par les ta- bleaux IV etV,
on observe que notre méthoded’optimisation
deséquations
du transfert
apporte
une amélioration sensiblesept
mois surdouze, cinq pendant
la saison froide(janvier
àmai)
et deuxpendant
la saison chaude(juillet
etaoût).
La valeur deSa
diminue de 0.11 pour les mois dejanvier,
avril et
juillet,
elle diminue de 0.16 pour le mois de mars. La modélisationoptimale
de latempérature
de surface de la mer a lieu pour les mois où la situationthermique superficielle
est bienétablie,
c’est-à-dire mars(Sa
=0.68)
et août
(Sa
=0.65).
Il n’est pas étonnant de constater que cettetempérature
de surface demeure difficile à modéliser
pendant
les mois de forte transitionthermique,
à savoirjuin (Sa
=0.81)
etseptembre (Sa
=0.83).
Une schématisation des
principaux
caractères des transferts saisonniersoptimaux
est visualisée sur lafigure
5. Une lecture attentive enapporte
lesenseignements
suivants :-
L’autorégression
dupremier
ordre de latempérature
de surface de la mer estprépondérante
9 mois sur 12. Les 3 mois restants sontmai, juin
et
septembre,
c’est-à-dirependant
l’établissement et ladisparition
de lathermocline.
L’autorégression
d’ordressupérieurs (2
ou3)
demeureimpor-
tante
pendant
les mois d’hiver et deprintemps.
Une influence notable estsignalée
entre les anomalies de latempérature
de surface de la mer des moisd’avril-mai et les anomalies
thermiques
de l’hiver suivant(janvier, février, mars).
Tous cespoints
sont sans doute à relier au fait que la structureRevue de Statistiques Appliquees, 1986, vol XXXV, n° 3
Figure 5. - Schématisation des coefficients de transferts saisonniers optimaux pour la modéli- sation mensuelle de la température de surface de la mer.
thermique
de la mer estglobalement homogène
surplusieurs
dizaines de mètrespendant
la saison froide. Si de fortes anomalies detempérature
sontgénérées
durant cettepériode,
le volantthermique
de la couchesuperficielle
de l’océan
augmente.
Une tellepropriété peut
ainsi faciliter la transmission d’unepartie
de ces fortes anomalies detempérature
lors des moissuivants,
avant et
après l’apparition
de la thermoclinesaisonnière,
cette dernièrejouant
ici le rôle d’écran
thermique pendant
lapériode
estivale.- L’oscillation
quasi-biennale
estprésente
sous la forme de coeffi- cients de transfertsnégatifs
entre latempérature
de surface de la mer d’un été et celle de l’été de l’année suivante. Ce résultat est conforme à des étudesplus
anciennes(DAVIS, 1967; WRIGHT, 1968) qui
tendaient à démontrer38
une
plus grande
sensibilité de la saison estivale à cettepériode
de deux ans.Une
analyse
encomposantes principales
menée sur les différents mois de l’année(non
montréeici)
nous apermis
de vérifier cettehypothèse,
notam-ment
pendant
lapériode
1950-1965.- Le fait le
plus intrigant
est sans doutel’apparition
de coefficients de transferts trèssignificatifs
entre latempérature
de l’air et latempérature
de la mer pour la modélisation de cette dernière
pendant
les mois dejuin-juillet
et deseptembre-octobre.
Il arrive mêmequ’en juin
et enseptembre
ces seuls coefficients soient
présents, reléguant
par là même tout transfert de latempérature
de la mer sur elle-même.Toutefois,
ceci ne doit pas faire illusion. Nous avons vuprécédemment qu’il
était malaisé de modéliser latempérature
de surface de l’océanpendant
les mois de transitionthermique.
Il est clair que
pendant
cespériodes,
la structurethermique superficielle
dela mer est
fragile.
Elleperd beaucoup
de saqualité
demémorisation,
cecin’étant pas
compensé qu’en partie
par uneplus grande
sensibilité à l’in- fluence de la variabilitéthermique atmosphérique.
5. LA PERFORMANCE
PRÉVISIONNELLE
5.1. Les indicateurs
La modélisation de séries
chronologiques
simultanées et de leurs liaisonsest intéressante car elle permet de mieux cerner leur comportement. Mais si la
description
est un desobjectifs
del’étude,
le but ultime reste laperformance prévisionnelle.
Se pose alors inévitablement la définition des critères de mesure, despériodes
d’estimation et de testsprévisionnels.
Notons
Zt
la valeur réelle de la série à l’instant t et Z(t;
t +i)
laprévision
faite à
partir
de l’observation t(i.e.
on connaît la sériejusqu’à t)
pour l’instantt + i.
L’erreur commise à t + i d’une
prévision
effectuée à t s’écrit :Deux
paramètres
sont à définir. Lepremier
est le nombre P de mois enamont pour la
prévision.
Le deuxièmeparamètre
à définir est lalongueur
dela
période
de test de laprévision :
soit[1,T] la période
demodélisation,
parexemple [janvier 1947,
décembre1979].
Lapériode
de testprévisionnel
sera[janvier 1980,
décembre1982].
La difficulté dejugement
de laprévision provient
du faitqu’on
ne saitjamais
si la valeur réelle decomparaison
deprévision
est une valeur que l’onpourrait qualifier
de « normale » ousi,
aucontraire,
elle est un peuexceptionnelle :
dans ce cas, il est difficile de déterminerqui,
de laprévision
ou de la valeur deréférence,
est mauvaise.Toute
l’ambiguïté
dujugement
de laqualité
d’uneprévision
tient en cedilemme.
Aussi,
dans lasuite,
troispériodes
seront choisies pour tester laprévi-
sion :
Revue de Statistiques Appliquees, 1986, vol XXXV, n° 3
[janvier 80,
décembre80] :
12 mois[janvier 80,
décembre81] :
24 mois[janvier 80,
décembre82] :
36 moisTrois horizons
prévisionnels
seront considérés : lesprévisions
à1,
2 etmois à l’avance.
Les indicateurs
prévisionnels
s’écriront sous la forme :P : horizon
prévisionnel (1, 2,
3mois)
H : la
période
test(12, 24,
36mois).
Ainsi
constitué,
l’indicateur est un indicateurglissant.
Dans le cas d’uneprévision
trois mois àl’avance,
en décembre79,
onprévoira janvier,
février etmars 80 et on calculera la fonction
d’erreur; puis
enjanvier 80,
onprévoira février,
mars, avril etc.Il ne reste
plus
maintenantqu’à
définir la fonction d’erreur f. La mesurela
plus
communément utilisée est laMoyenne
de la Somme des carrés des Erreurs(MSE),
la fonction freprésentant
le carré de l’erreur :Cet
indicateur,
utilisé dans laplupart
des travauxthéoriques
etappliqués,
ne
permet
pas l’utilisation de tests car ilssupposent
que les erreurs aient lespropriétés
d’un échantillon(en particulier
vis-à-vis del’indépendance
deserreurs),
cequi
n’estjamais
le cas.Une alternative pour l’évaluation de la
performance prévisionnelle
estfournie par la
Moyenne
des valeurs Absolues des Erreurs(MAE),
la fonction f étant la fonction valeur absolue.Cet indicateur
privilégie
une fonction linéaire des erreurs au lieu d’une fonctionquadratique,
c’est-à-dire une moinsgrande
sensibilité auxgrandes
erreurs.
Enfin,
uneMoyenne
des Erreurs est souvent calculée afin de fournir unindicateur de
déréglage
ME :Dans la mesure où il n’existe pas de mesure
simple
et universellementacceptée,
tous les testsprévisionnels
ci-dessous serontjugés
à l’aide de ces troiscritères.