R EVUE DE STATISTIQUE APPLIQUÉE
R. M EIGNIEZ
Le test des intervalles intermaximaux
Revue de statistique appliquée, tome 7, n
o2 (1959), p. 87-95
<
http://www.numdam.org/item?id=RSA_1959__7_2_87_0>
© Société française de statistique, 1959, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
LE TEST DES INTERVALLES INTERMAXIMAUX
par
R. MEIGNIEZ
Psychologue
àEbauches S.A .(Neuchâtel), Suisse (1)
BUT DU TEST :
Il
s’agit
d’un testnon-paramétrique
devant mettre en évidencequ’une
suitetemporelle
n’est pas au hasard. Ils’intègre
dans la mêmeperspective
que le test du nombre de maxima décrit dans uneprécédente publication (2).
DEFINITIONS ET RAPPELS :
Soit une suite
temporelle Sn
de n valeursinégales quelconques :
Vl. v2, ... , v". On suppose que la suite estcirculaire,
c’est-à-dire que vnprécède vl(2).
On nomme maximum toute valeur Vq telle que l’on ait simultanément
vq > vq_,
etVq
>vq, 1
.(2)
On nomme intervalle le groupe de valeurs
compris
entre deux maximaconsécutifs,
ces derniers exclus. Lagrandeur
de l’intervalle est le nombre de valeurs de ce groupe.Soit k le nombre d’intervalles de
Sn.k
est doncégalement
le nombre de maxima. SoitEn (k) l’espérance
du nombre de maxima pour une suite circulaireau hasard de n valeurs.
La table des
probabilités
cumulées des valeurspossibles
de k pour unevaleur donnée de n a été fournie
depuis
n = 4jusque
n = 46. Audelà,
il a étéadmis que la
quantité :
obéissait
approximativement
à une loi normaleréduite. (2)
En fonction de ces
résultats,
on aproposé
de considérer les valeurs de kou de z extrêmes par
rapport
à ces distributions commesymptomatiques
de sui-tes non au hasard. On a
cependant
relevé que le test ne retientqu’une partie
trèsréduite de
l’information présente
dans ledonné.
Aussiprésentons
nousaujour-
d’hui un test
plus
efficace.Soit N ;
le nombre d’intervalles degrandeur
iprésents
dans la suitetempo-
relle circulaire aléatoire
Sn.
SoitEn (Ni) l’espérance
de cettequantité.
Le test---
(1)
L’étude de ce test a été réalisée dans le cadre du ServicePsychologique
d’Ebauches S. A.dirigé
par Philippe de Coulon. -Nous les remercions vivement des facilitésqu’ils
ont pro- curées à notre travail.(2)
"Le test du nombre demaxima",
par R.Meigniez,
Revue de StatistiqueAppliquée
,VOi..VI n° 2, 19 5 8.
revient à mesurer l’écart entre ces valeurs effectives et leurs
espérances,
iprenant
toutes les valeurspossibles.
Un
premier objectif
sera donc de calculer la valeurEn (Ni).
MODE GENERAL DE CALCUL DES
E, (Ni):
Soit la suite circulaire au hasard
S’n.
On en extrait au hasard unfragment
s de
(i
+4) valeurs, qu’on peut
coder sous la forme :Définissons par a l’événement : A
maximum,
aucun x maximum"
a
" Anon-maximum,
"" b il · B
maximum,
"B
non-maximum,
IlNous avons
identiquement :
D’autre
part, l’expression :
exprime
laprobabilité qu’au
moins un des deux évènements a et b seproduise.
On obtient alors par addition de
(2)
et(3)
et soustraction de a :Or,
P(ab)
estprécisément
laprobabilité
que lefragment
s détermine unintervalle
i,
et il est d’autrepart
clair que l’on a :puisque
dans la suite circulaireSn
on a lapossibilité
d’extraire nfragments
dif-férents de la
grandeur
de s, soit de i + 4 valeurs.En
conséquence,
le calcul deEn (Ni)
se ramène à celui de P(ab)
et donc àà la résolution de
l’expression (5).
LES PERMUTATIONS CONCAVES :
La notion de
permutation
concave nouspermettra
de donner un contenualgebrique
aux termes del’expression (5).
Soit un fragment
de suite de r valeursdifférentes.
Nous nommons permu- tation concave de ces r valeurs toutepermutation
non circulairequi
necomporte
pas de maximum interne. Autrementdit,
la valeur laplus
élevée se trouve obli-gatoirement
enpremière
ou en dernièreposition parmi
les r valeurs dufrag-
ment.
Il est clair
qu’on peut
obtenir toutes lespermutations
concaves de r va-leurs en
ajoutant
laplus grande
de ces valeurs successivement à droite et àgauche
de chacune despermutations
concaves des r-1 autresvaleurs,
cequi
double le nombre de ces dernières
permutations.
Si donc
Ur
est le nombre despermutations
concaves de rvaleurs,
etpuis- qu’on
a visiblementU2 - 2,
on aura :Donc,
siPu (R)
est laprobabilité qu’un fragment
R de r valeurs au hasardprésente
unepermutation
concave, on aurad’après (7),
et étant donné que le nombre de toutes lespermutations quelconques possibles
de r éléments est r ! :APPLICATION AU CALCUL DE P
(a)
ET P(b) :
Considérons le
fragment :
fragment
extrait de s(voir (1»
On a,
d’après (8) :
De même si l’on considère le
fragment :
S2 = {
yl,A,
X 11 X2,... 1 Xi,B } également
extrait de s, on a :Or,
si nous considérons la suitefragmentaire
s, nous voyons quePu (sl) représente
laprobabilité qu’elle
réalise au hasard le cas:A maximum ou non ;A,
Xl, X2, ... , B sans maximum interne.De même, Pu (S2) représente la probabilité
que la suite s réalise au hasard le cas : A nonmaximum ; A,
xl, x2, ... , B sans maximum interne.P
(a) représentant
pour la suite s laprobabilité
de l’événementA maximum
aucun x
maximum,
on aura donc finalementlogiquement :
soit, d’après (9)
et(10) :
formule
qui,
par raison desymétrie, exprime également
la valeur de P(b).
APPLICATION DE
(8)
AU CALCUL DE ex :La même méthode
s’applique
au calcul de a .D’après l’expression (1)
de s, on voit quePu (s)
est laprobabilité
de : Aet B non
maxima ; A,
xl, .... X!,B,
sans maximum interne.Parallèlement,
l’inspection du fragment
SI nous montre quePu (SI)
est laprobabilité
de : A(ou)
etB maximum ou non ;
A,
xi, ... , xi,B,
sans maximum interne. On enconclut, d’après
la définition de a dans(4)
que :Soit, d’après (8) :
ESPERANCE DU NOMBRE D’INTERVALLES DE GRANDEUR i :
En
remplaçant
dans(5)
les termes du second membre par leur valeur en(11)
et(12),
il vient :Et, d’après (6) :
On
peut
chercher laprobabilité correspondante
à cetteespérance.
Soitdonc
P;
laprobabilité qu’un
intervallepris
au hasard soit degrandeur
i. On aétabli dans le travail cité en note
(2)
que, JEn (k)
étantl’espérance
du nombretotal d’intervalles pour une suite circulaire au hasard de n
valeurs,
on a :On aura donc :
On constate que les
P~
sontindépendants
de n, saufexceptions
que nous allonsenvisager.
Cas particuliers
deP~ :
:En
effet,
notre raisonnement repose sur une structure de s(cf. (1» qui implique
la relation :Il nous reste donc à calculer
P;
pour les casextrêmes,
très peuproba-
bles pour n
grand :
i = n-1 et i = n-3(le
cas i = n-2 estabsurde,
commeimpli- quant
lacontiguité
de deux valeursmaxima).
a) Cas i - n -1 :
Un seul maximum est
possible :
laplus
forte valeur deSn.
Pour le
fragment s3
constitué par les n-1 autresvaleurs,
on a selon(8) :
Comme on
peut
extraire un seul telfragment,
on a en raisonnant commeci-dessus :
Et, d’après (15) :
b) Cas i-n-3:
On observe
simplement
que :Soit,
endéveloppant :
Ce
qui donne, après regroupement
sur les dénominateursidentiques :
En
remplaçant
dans(20), d’après (19)
et(21),
il vient :On voit donc que
Pn-i
etPn-3 dépendent
bien de n, mais décroissent trèsrapidement lorsque
cette variablecroit,
cequi
les rendpratiquement négligea-
ble s.
Probabilités cumulées
Pi
> m :~
Il est intéressant pour les besoins
pratiques
de connaître laprobabilité
cumulée pour les valeurs extrêmes
de P ;.
Soit m un entier n-4. Soit Pi >m laprobabilité qu’un intervalle
extrait au hasard soit d’unegrandeur qui dépasse
m.Observons le dernier membre de
(21).
Il estclair, d’après
le raisonne- mentqui
yaboutit, qu’on
obtiendrait de la même manière :en
substituant simplement
m à n-4.D’où :
On vérifie aisément par
(24)
quePi
>o = 1Valeurs
numériques
desP; :
La formule
(16)
nouspermet
cecalcul,
avec la réserve que i n-4 doit êtrevérifié.
Nous donnons ci-dessousquelques
valeursfondamentales, et,
à titre decomparaison,
les valeurscorrespondantes
pour la loi dePoisson,
devariable i-1 et de
paramètre
1(valeur
pourlaquelle l’espérance
de i est la mê-me dans les deux
distributions. ).
On remarquera que la loi de Poisson fournitune
approximation
trèsgrossière
de la loi des intervallesintermaximaux.
TABLEAU 1
Pi Poisson
Vérification
expérimentale
de la loides P i :
En extrayant
d’une urne au hasard etjusqu’à épuisement
198 billes numé-rotées de 1 à
198,
et enrépétant
100 foisl’opération,
on a obtenu 100 suites auhasard.
On a considéré les 58premiers
intervalles dechaque
suite et détermi-né les
N ;.
On a considéréqu’en
faisant le total des Ni pourchaque
valeur de idans les 100 suites on obtiendrait une
approximation
valable de cequ’on
aurait trouvé dans une suite circulaire de 5 800 intervalles. Le tableau II compare ces résultatsexpérimentaux
aux valeursthéoriques
5 800P; .
TABLEAU II
Ni 5 800
Pi
L’adéquation théorico-expérimentale parait bonne.
Lapremière
tentationqui vient
àl’esprit
est de calculer unX 2 sur
labase
du tableau II. Mais cette pro- cédure soulèverait de gravesobjections
pour des raisons denon-indépendance.
En
effet,
supposons pour illustrerqu’ au
cours de l’extraction de nos billes numérotées de l’urne on en vienne à former un intervalle degrande
taille(par exemple,
i =8).
Il y a une forteprobabilité
que le dernier maximum sortiqui
borne cet intervalle
possède
une valeurnumérique
élevée parrapport
aux au-tres valeurs de
l’urne,
sansquoi
cette suite degrandeur
8 deviendrait encoremoins
probable (raisonnement qui s’applique
d’ailleurs aussi au maxima de gau- che de lasuite). Or,
laprobabilité
forte que le maxima de droite soit élevéaugmente
à son tour laprobabilité
que l’intervalle suivant à sortir soit lui-même degrande
taille. Autrementdit,
lagrandeur
d’un intervalle est une fonction aléa- toire de celle de l’intervalleprécédent,
et nous avons affaire à une variété de cha3ne de Markov. Les cases du tableau II ne concernent donc pas en droit desfréquences
d’occurenceindépendantes,
et latechnique duX2 ne parait
pasappli- cable.
Nous avons
cependant pu
montrer que cetteobjection
n’est pasabsolue,
endémontrant
expérimentalement
que laquantité :
se
comporte
avec une bonneapproximation
comme une loide ~c ; au
moins à par-tir d’une certaine valeur de
N,
nombre d’intervalles total dufragment
de suiteconsidéré.
Onrappelle
que N ;représente
le nombre d’intervalles degrandeur i,
et
Pi
laprobabilité théorique
calculéeplus
hautqu’un
intervallepris
au hasardsoit de
grandeur
i. Il est à noter que sur ceplan expérimental
la circularité des suites n’estplus prise
enconsidération.
APPROXIMATION DE
K(2)
A L’AIDE DE LA DISTRIBUTION DEx2
Pour
chacune de nos 100 suites aléatoires de 58 intervalles obtenues partirage
de billesnumérotées,
on a calculé la valeur K(2) à la manière d’unx2 ,
selon
l’expression (25).
Pourcela,
on a utilisé les 4 classes : i =1,
i =2,
i=3eti~ 4. Les
"fréquences attendues" N1~
dans chacune de ces classes étaient res-pectivement 23, 2 ; 19, 3 ; 9, 9 ; 5, 5.
En
possession
de nos 100K( 2) ,nous
avons lu dans la table desX2 1 avec
3degrés
de
liberté,
les 100 seuils deprobabilité correspondants. L’hypothèse
était que, N étantélevé,
les effets markoviens s’en trouveraient amoindris. Nous avonsainsi obtenu le tableau suivant :
TABLEAU III Seuils lus
dans
1la table ~
Nbre. théor.
de K (2)
>Nbre. expér.
de K ( 2 ) >
On voit que
l’adéquation
n’est pasmauvaise,
etqu’en particulier
les va-riations tendent à se compenser de
proche
enproche.
Agauche
et à droitede . 50,
on trouverespectivement
51 et 49 valeurs. Si l’on détaille les extrê-mités,
la concordance devient encoreplus frappante :
TABLEAU IV Seuils lus dans
la table
Nbre. théor.
de Kt 2) J Nbre.
expér.
de K( 2 ) >
Notre
conclusion,
c’estqu’au moins
àpartir
d’un nombre assez élevé d’in- tervalles il estpossible
d’utiliser K(2) >pour tester si une suite est ou non aléa- toire du
point
de vue des tendances localesqu’ elle peut
ou non renfermer. Il con-viendrait
d’investiguer plus
à fond cettepossibilité
enfonction de lagrandeur
de N.
UTILISATION
PRATIQUE
DU TEST :Résumons tout d’abord la
démarche.
Soit une suite de N intervalles donton se demande si elle est
l’objet
de variations localesgraduelles significatives,
ou au contraire encore d’une absence
significative
de telles variationsgraduel-
les. On pourra par
exemple
avoir à se poser desproblèmes
demélange.
On
comptera
doncNi,
nombre d’intervalles dechaque grandeur,
i =1,
i =
2,...,
i ~ m,présents
dans la suite. Soit t le nombre des classes ainsi dis-tinguées.
On comparera
pour chacune des t classes leNi
obtenu avec la valeur théo-rique
NP¡ les Pi étant fournis par letableau 1,
et l’on calculeraK{ 2)
selon la formule(25).
On entrera dans la tabledesx2
avec t-1degrés
de liberté avec unevaleur
de Légale
à celle deK{ 2).
. Le seuil deprobabilité
ainsiobtenu pourra
être considéré comme uneapproximation
valable du seuilauquel
nous pouvons dire que notre suite n’est pas aléatoire sousl’angle considéré.
Prenons un
exemple simple.
On surveille l’évolution d’un indiceéconomique
annuel concernant un certain
produit,
indicequ’il
a étépossible
d’obtenir pour les 58 dernières années. On se demande à ce propos si l’indice varie defaçon indépendante
tous les ans, ou si une même source de variationpeut
être suppo- sée à l’oeuvre surplusieurs
années successives. Dans ce cas, on suppose que lanon-indépendance
des années successivespeut
se manifester aussi bien parune
gradualisation
des variations de l’indice que par des réactions d’alternance tendant à faire se succéder une valeur forte à une valeur faible etréciproque-
ment.
L’hypothèse
testée est donc celle del’indépendance
des indicessuccessifs,
1et
s’oppose
à celle de lanon-indépendance
locale sous toutes sesformes.
On se contente de donner
ci-après
le début et la finsupposés
de la suite des 58 indices :.157 .124 .112 .135 146 .
.113 .169 .152 .147 .136 .148 .109
. 173 . 161...084
105 .096 . .117 (.157)
On a
souligné
ensemble les valeursqui
consituentunmême intervalle.. 15?, qui figure
en tête de lasuite,
estrépété
entreparenthèses
comme valeursupplémentaire
à la fin de lasuite,
car, du fait que celle-ci estsupposée
circu-laire,
iljoue
le rôle d’unmaximum,
entouré par . 117 et . 124.On
compte
le nombre d’intervalles dechaque grandeur :
ce sont les valeurs ditesexpérimentales
du tableauqui
suit. Les valeurs ditesthéoriques
sont obte-nues en
multipliant
par 58 lesprobabilités P¡
du tableau I.D’où le tableau résumant le calcul de
K~ 2’ :
Théorique Expérimental
Différence
(Différence) (2)
(Diff. )l2ïThéor.
On voit conc que le calcul de K(2) > est
identique
à celui.d’un X2 .
La valeur obtenue de Kt 2) >(ici, 8, 37)
est ensuite lue dans une table dex2 avec
un nombre dedegrés
de libertéégal
au nombre de classes moins un(ici,
4 - 1 =3),
et l’onobtient en
regard
le seuil deprobabilité auquel l’hypothèse
del’indépendance
locale des indices successifs
peut
être admise étant données nos valeursexpé-
rimentales.
Or,
nous lisons dans la table que pour8,
37 et 3degrés
de liberté on setrouve
placé
entre les seuils deprobabilité
02 et .05. Cecisignifie qu’on
n’aqu’entre 2%et5
ejo de chances de ne pas setromper
en affirmantl’indépendance
locale de notre suite.
L’hypothèse
del’indépendance
est doncrejetée
à un seuilde P =
.05,
souvent considéré comme un seuil"raisonnable" (alors qu’elle
neserait pas
rejetée,
parexemple,
à un seuil de ..01).
CONCLUSION
Le test des intervalles intermaximaux est dans son
principe parent
de ce-lui de
Olmstead(1) qui
considèrel’importance
des suites croissantes et décroi- santesprésentes
dans la suite totaledonnée.
Autrementdit,
cet auteur consi- dère le nombre de valeursqui séparent
un maximum du minimumsuivant,
ou unminimum du maximum
qui
lui succède.Il serait sans doute utile de se livrer à une
comparaison
du test d’Olmsteadavec celui des intervalles intermaximaux.
il est à noter que le test des intervalles intermaximaux
peut également s’appliquer
sous forme de test des intervallesinterminimaux,
par raison de sy-métrie.
Si on entend en effet par minimum toute valeur inférieure à cellequi
laprécède
et à cellequi
lasuit,
l’ensemble de nos considérationss’applique
im- médiatement à ce nouveauchamp,
enremplaçant simplement
la notion de permu- tation concave par celle depermutation
convexe.Dans cette
perspective,
il y aurait lieu de trouver le moyen de combinerl’application
successive desdeux points
de vue aux mêmesdonnées.
Nous pensonsqu’on
accroitrait-ainsi la sensibilité du test sans pour autantcompliquer
la pro-cédure.
( 1 )
Olmstead, "Distribution of sample arrangements for runs up anddown",
1 cité par E. Morice , 1in Revue de Stat.