R EVUE DE STATISTIQUE APPLIQUÉE
R. S NEYERS
Sur un critère de sélection de séries multidimensionnelles types à usage normalisé
Revue de statistique appliquée, tome 27, n
o2 (1979), p. 69-74
<http://www.numdam.org/item?id=RSA_1979__27_2_69_0>
© Société française de statistique, 1979, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
69
SUR UN CRITÈRE DE SÉLECTION
DE SÉRIES MULTIDIMENSIONNELLES TYPES A USAGE NORMALISÉ
R. SNEYERS
Institut royal météorologique de Belgique
1. INTRODUCTION
Au cours des dernières
années,
les servicesclimatologiques
ont été confron- tés deplus
enplus fréquemment
avec lademande,
d’untype
nouveau, relative à des sérieschronologiques
multidimensionnelles devantpermettre
l’étude compara- tiveobjective
de diverssystèmes dépendant
directement des conditions météoro-logiques
comme, parexemple,
lessytèmes
decaptation d’énergie
solaire ou les sys- tèmes de conditionnement d’air.Le souhait des utilisateurs est de recevoir pour des
époques spécifiées
del’année des séries d’observations
représentatives
des conditionsmétéorologiques
moyennes,
c’est-à-dire,
fournissant le meilleur résuméclimatologique
del’époque
de l’année considérée et
respectant
aussi bien les liaisons naturelles entre valeurs simultanées que celles entre les valeurs successives.En d’autres termes, ces séries doivent conduire à des valeurs
empiriques
aussi
proches
de la normale quepossible :
1 )
de la moyenne et de la variance dechaque élément ; 2)
des covariances entre les diverséléments ;
3)
des corrélations sérialesqui régissent
l’évolution de ces éléments dans letemps.
Diverses solutions à ce
problème
ontdéjà
étéproposées
ou sont àl’étude,
notamment dans le cadre du
sous-projet
"conditionsclimatiques
et année de réfé- rence" inclu auprojet
OTAN-CCMS"L’emploi
rationnel del’Energie" [ 1 ], [2], [3], [4].
On doit malheureusement les considérer commeinadéquates
en raisonsoit de leur manque de
généralité,
soit de lacomplexité
de leurméthodologie,
soitencore du manque d’uniformité du résultat
auquel
elles conduisent.Ces écueils
peuvent
toutefois être évités si l’onadopte
une méthode statis-tique
de sélection fondée sur la valeurprise
par la formequadratique qui
est à labase de la méthode des moindres carrés
généralisés.
Une telle méthodeoffre,
en outre,l’avantage
depermettre
les sélections lesplus diverses, puisqu’elle s’applique
aussi bien dans le cas du choix du meilleur résumé.
climatologique
naturelqu’à
celui du choix de l’ensemble naturel
caractéristique
des conditions lesplus
extrêmes.Le but de cette note est de
présenter
lastatistique
de sélection et d’en donnerun
exemple d’application.
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 2
Mots-clés :
Sélection ;
sériesclimatologiques.
70 2. LE CRITERE DE SELECTION
Soit la série aléatoire
simple
de valeurs du vecteur x à kcomposantes :
représentant
l’évolution d’une année à l’autre d’une variablemétéorologique
à kdimensions. En outre, soit v =
~vjj’~ I
la matrice(non singulière)
des variancescovariances des éléments du vecteur x,
c’est-à-dire, qu’on
a :Si
03BC(03BCj)
==E[x(xj)]
est la moyenne du vecteur x, lastatistique
définie par leproduit
matriciel :possédera
unerépartition
deX2 à k degrés
de liberté dès que lescomposantes
duvecteur x sont
réparties conjointement
selon une loinormale ;
cetterépartition
ne sera
qu’approchée
dans le cas contraire.Cela
étant,
l’élément de la série xiqui s’approchera
le mieux de la moyenne seracelui qui
conduit à la valeur deXi
laplus proche
de zéro. Deplus, grâce
à la loi deX2,
on pourra faire uneestimation
exacte ouapprochée
de laprobabilité
associée à
chaque
valeur deXi,
c’est-à-dire àchaque
élément xi de la série chrono-logique.
Dans la
pratique,
le vecteur J1 et la matrice v ne sont pas connus ; aussi convient-il de lesremplacer
dans(3)
par leurs estimations :La
statistique
de sélection devient ainsi :sa
répartition
selon une loi dex2
n’étantplus qu’approchée
dans tous les cas.Notons
toutefois
que siXi,
1 =1, 2, ... , n désigne
la sérieordonnée
desvaleurs de
Xi
et siF(X)
est la fonction derépartition
de lastatistique Xi,
commeona(cf[5]p. 19) :
en
posant :
on
peut procéder
à une estimation nonparamétrique
de laprobabilité
associéeaux valeurs de la
statistique Xi.
3. APPLICATION A LA SELECTION DE SERIES
CLIMATOLOGIQUES
TYPE.Dans la
pratique,
les séries demandées sont des séries de valeursjournalières
d’un ou de
plusieurs
élémentsmétéorologiques appartenant
à un même mois. Si Nest le nombre de
jours
du mois considéré et si n est le nombre d’années d’observa-Revue de Statistique Appliquée, 1979, vol. XXVII, n° 2
71
tion dont on
dispose,
la sélection doit conduire au choix d’une série de N observa- tionsjournalières
d’un même moisparmi
n séries semblables.Dans ces
conditions,
siyi, s; (y)
etri (y),
i =1, 2, ... ,
n, sont pour l’élémentmétéorologique
y, les valeursempiriques respectives
de la moyenne, de la variance et de la corrélation sériale fournies par les valeursjournalières
de chacun des n mois de lapériode d’observation,
la sélection devraporter
sur les valeurs d’un vecteur xcomportant
un nombre detriplets [y, s2 (y), r(y) égal
au nombre d’éléments mé-téorologiques
considérés simultanément.Il est clair toutefois que le nombre de
composantes
du vecteur xpeut
être réduit selon les nécessitéspratiques,
parexemple,
en abandonnant un ouplusieurs
coefficients de corrélation sériale.
Par
ailleurs,
afin depouvoir
déterminer correctement lapart qui
revient àchaque
élément dans la valeur trouvée pour lastatistique i,
ilpeut
être utile de passer auxcomposantes
centrées réduites définies par la relation :Dans ce cas, la matrice des variances-covariances des composantes zi se ramène à la matrice de
corrélation ~ ~jj’~
entre les divers éléments du vecteur x.4. EXEMPLE. SELECTION DES MOIS CONSTITUANT L’ANNEE TYPE DANS LE CAS DE LA VARIABLE CONJOINTE TEMPERATURE DE L’AIR - RAYONNEMENT A UCCLE
(PERIODE 1958-1975).
Les
composantes
de la variable multidimensionnelle considérée ici sont les moyennes mensuelles de latempérature
de l’air et durayonnement
reçu sur une surface horizontale ainsi que les variancesempiriques
déduites des valeursjourna-
lières de ces éléments calculées pourchaque
mois de lapériode
1958-1975. Ceciconduit,
pour le mois dejanvier,
aux valeursti, vi(t),
gi etvi(g)
du tableau1,
ainsiqu’aux
valeurs réduites x1, x2, x3 et x4 calculées selon3.(1).
Lesstatistiques X
ont ensuite été déterminées pour les
couples (x1, X2), (x3, x4)
ainsi que pour la variable à 4 dimensions(xi
x2, X3,X4).
Il
apparaît
de la sorte que pour latempérature seule,
deux mois dejanvier,
ceux de 1961 et de
1970, s’approchent
le mieux de lanormale,
tandis que pour lerayonnement seul,
lastatistique X
conduit àjanvier
1960. Par contre, pour lesdeux éléments
pris conjointement,
le mois dejanvier
à retenir est celui de 1967.Il ressort, en outre, de ces résultats que les conditions extrêmes observées en
janvier
1963 ont été caractérisées par un déficit trèsimportant
de latempérature
et par un excès un peu moins
important
à la fois de la moyenne et de la variabilité durayonnement.
L’adéquation
d’une loi dex2
à 4degrés
de liberté à larépartition
de la statis-tique X
dans le cas des variablesconjointes
x1, x2, X3 et x4 a étévérifiée,
parailleurs,
en examinant lesprobabilités
que cette loiassigne
aux valeurs extrêmeset à la
9è
valeur(médiane inférieure)
de lastatistique
obtenues de cette manière pour chacun des douze mois de l’année(tableau 2).
A cet
effet,
on note que si F est la loi derépartition
des éléments d’unesérie aléatoire
simple
d’effectifégal
à18,
la loi derépartition
du maximum de laRevue de Statistique Appliquée, 1979, vol. XXV 11, n° 2
72 TABLEAU 1
Valeurs
empiriques
des moyennesti
et gi de latempérature
de l’air et du rayonnement à Uccle et variancescorrespondantes
des valeursjournalières vi(t)
etvi(g)
pour les moisde
janvier
de 1958 à 1975. Valeurs réduitesxi ,
X2’x3
et x4 et valeurs de lastatistique Xi
pour les
couples (x1, X2) (X3 ’ 1 X4)
et pour le vecteur(x1
1 X2 x3,x4).
TABLEAU 2
Probabilités
Fmax, Fmin et F9
que laloi du X2à 4 degrés
de libertéassigne
à laplus grande
valeur de lastatistique X,
à saplus petite
valeur et à lage
valeur dans la série ordonnée de 18 valeurs obtenues pour chacun des douze mois
Revue de Statistique Appliquée 1979, vol. XXVI I, n° 2
73
série est p18
(cf [5]
p.19)
et il s’ensuit que les 12 valeurs de F18qu’on
en déduitseront
réparties
selon une loiuniforme,
c’est-à-dire que lastatistique
de Fishercorrespondante :
possède
unerépartition
dex2
à 12 x 2 = 24degrés
de liberté.Comme les valeurs de
Fmax
et de(1 - Fmin)
du tableau 2 conduisent respec- tivement à31,8
et à31,5
pour une valeurcritique
de36,4
au niveau0,05,
onpeut
conclure à un accordacceptable.
De même,
pourF9,
on a(cf [5]
p.20) :
d’où,
pour la moyenneF9
des douze valeurs deF9 :
Avec, F9
=0,434,
il vient ainsi :soit à nouveau une valeur inférieure à la valeur
critique 3,84
au niveau0,05
de la variablex2 à
1degré
deliberté,
et ici aussi un bon accord avecl’hypothèse
nulle.5. CONCLUSIONS
En
résumé,
le critère de sélectionproposé présente
effectivement lesqualités
de
rationalité,
desimplicité
etd’objectivité indispensables
au choix normalisé de sériestype
pour lesapplications
dont il a été fait mention au début de cette note.Accessoirement,
on auraremarqué
la bonneadéquation
de larépartition
des valeurs de la
statistique X
avec une loi deX2
et ce bienqu’aucune précaution
n’ait été
prise
pour s’assurer de la normalité de larépartition conjointe
des élémentsqui composent
le vecteur x.Il va de soi
qu’on peut
souhaiter réunir au maximum les conditions néces- saires à cette normalité enprocédant
aux transformationsappropriées. Rappelons simplement
à ce proposqu’ici
cette transformation consiste en une fonctionpuis-
sance
(ici
la racinecarrée, puisque
l’on a substituél’écart-type empirique
à lavariance
empirique)
et que dans le cas où il aurait été faitappel
au coefficient de corrélationsériale p,
cette transformation est donnée par la relation :BIBLIOGRAPHIE
[1]LUND
H. -Report A 3,
Secondsymposium
on the Use ofComputers
forEnvironmental
Engineering
Related toBuildings, Paris,
June 1974.Revue de Statistique Appliquée, 1979, vol. XXVII, n° 2
74
[2]
SAITO H. and MATSUO Y. - Standard Weather Data of ShaseComputer
Pro-gram of Annual
Energy Requirements
andExemple
Results ofHourly
Loadfor 10 Years in
Tokyo, Paper
A4,
SecondSympsoium
on the Use ofCompu-
ters for Environmental
Engineering
Related toBuildings, Paris,
June 1974.[3] ANDERSEN B.,
EIDORFFS.,
LUNDH.,
PEDERSENE.,
ROSENORNS.,
VALBYORN O. 2014
Meteorological
Data forDesign
ofBuilding
and Installa-tion : A Reference Year. Status
Byggeforskningsinstitut,
SBI -Rapport
89 -Ko benhavn 1974.
[4]
KORSGAARDV.,
LUND H. - Test reference Year(TRY),
Finalreport
NATO - CCMSProject
on "Rational Use ofEnergy" - Sub-Project"
ClimaticConditions and Reference
Year",
1977.[5]/
SNEYERS R. - Surl’analyse statistique
des sériesd’observations,
Note tech-nique n° 143, OMM,
Genève 1975.Revue de Statistique Appliquée, 1979, vol. XXVI I, n° 2