R EVUE DE STATISTIQUE APPLIQUÉE
R. M EIGNIEZ
Le test du nombre de maxima
Revue de statistique appliquée, tome 6, n
o2 (1958), p. 97-106
<
http://www.numdam.org/item?id=RSA_1958__6_2_97_0>
© Société française de statistique, 1958, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
LE TEST DU NOMBRE DE MAXIMA
par
R. MEIGNIEZ
Psychologue
àEbauches S. A. (Neuchâtel,Suisse)
BUT DU TEST -
Le test du nombre de maxima est un test non
paramétrique
destiné à met-tre en évidence le fait
qu’une
suitetemporelle
n’est pas au hasard.PRINCIPE -
Soitune suite
temporelle
S de n valeursinégales quelconques
v l’ v2 ..v~~On suppose
que la suite estcirculaire,
c’est-àdire que vn
précède
vl . Parexemple,
la suite despoints disposés
sur le cercleci-contre,
sansorigine privilégiée
et pourlequel
on a défini un sens de lec-ture
positif,
estune suite circulairevj., v2’...
1 vn . On nomme maximum toute valeurvq
telle quel’on ait simultanément
vq
>vq-l
et Vq > Vq+l.Soit k le nombre de maxima de la suite circulai-
re S. Si
F~ (k) représente
la fonction desprobabilités
cumulées de k pour une valeur donnée constante
de n,
le test consiste àéprouver
k par
rapport
à cette distribution à un seuil donné. Autrementdit,
pour des va- leurstrop
fortes outrop
faibles de k parrapport
àF~ (k),
on concluera quel’hy- pothèse
nulle de la suite au hasard est àrejeter
à ce certain seuil.FORMULE FONDAMENTALE -
On sait que le nombre de
permutations
différentes de m valeursinégales disposées
circulairement est(m - 1)!
Considérons toutes les
(n - 2)!
suites circulairespossibles
formées parn - 1 valeurs
inégales.
Enajoutant
de toutes lesfaçons possibles
à chacune deces suites une valeur V
supérieure
à toutes lesautres,
on aura obtenu toutes les---
.
(1) L’étude de ce test a été réalisée dans le cadre du Service
Psychologique
d’Ebauches S.A. ~dirigé
parPhilippe
de COULON, dans le but d’étudier la succession des temps dans lestravaux
répétitifs
simples de l’industrie. Nous remercionségalement
le Pr. BADER, de l’Université de Neuchatel, pour sesprécieuses suggestions,
et l’Institut fürangewandte
Mathematik de Zürich
qui
a’calculé les distributions deFn
(k) pour des valeurs de n allant de 4 à 500.suites circulaires
possibles
S formées par n valeursinégales.
En
effet,
chacune des(n - 2)!
suitesoriginelles
a pu recevoir V en n - 1positions
différentes. On a donc obtenu(n - 1 )!
suitesS, qui
sont évidemmenttoutes différentes entre elles.
Or, (n - 1)!
estprécisément
le nombre des per- mutations différentes pour une suite circulaire de n valeurs. Il en résultequ’on
a bien obtenu ainsi toutes les suites circulaires
possibles
formées par n valeursinégales.
Considérons ces
(n - 1)!
suites Sobtenues,
et demandons-nous comment se sont formées toutes cellesqui comprennent
un nombre donné k de maxima. Il est clairqu’elles
n’ont pu êtreproduites
que de deuxfaçons :
Cas A : A
partir
de suitesoriginelles S1,
de(n - 1)
valeurs et kmaxima,
et oùl’adjonction
de V n’a pas ensuite introduit de maximumsupplémentaire.
Cas
B :
Apartir
de suitesoriginelles
S 2, de n - 1 valeurs et k - 1maxima,
et oùl’adjonction
de V a ensuite introduit un maximumsupplémentaire.
Ces deux cas sont les seuls
possibles
pour l’obtention de k maxima selon leprocédé
décrit. Eneffet, l’adjonction
de V nepeut
ni accro3tre deplus qu’un,
ni abaisser le nombre de maxima d’une suite. Les suites
Si
de k maxima etS 2
dek - 1 maxima sont donc bien les seules à intervenir dans la création de suites S à k maxima.
Reprenons
donc deplus près
les cas A et B.Cas A :
D’après
la définition dumaximum,
il est clair que le nombre de maximade S1
ne variera pas,chaque fois que V
sera introduit encontiguité
à un des maximade
Si’
cequi peut
se faire pour chacun de ceux-ci de deuxfaçons,
soit sur sadroite,
soit sur sagauche.
Autrementdit,
l’ancien nombre de maxima étant aussiégal à k,
onpeut
écrirequ’à partir
dechaque
suiteS 1
on a pu former 2k nouvelles suitespossédant
chacune k maxima.Cas B : Il est
également
clair que le nombre de maxima deS 2
se sera accru d’une unitéchaque
fois que V n’aura pas ét é introduit encontiguité
à un maximum de S 2 .(k - 1)
étant le nombre de maxima deS 21
V sera introduit encontiguité
à l’un d’euxdans 2(k - 1) cas. Puisque
Vpeut
être introduit de(n - 1) façons
différentes dansS2,
il en résulte que V n’aura pas été introduit encontiguité
à un maximum dans :Autrement
dit,
àpartir
dechaque
suiteS 2
on a pu former(n -
2k +1)
nou-velles suites
possédant
chacune k maxima.Toutes les suites différentes
possibles
de n valeurs et k maxima ont étéobtenues,
commeon l’a vu,
par notreprocédé
et àpartir
des seules suites detype S 1
etS2 .
Si
donc A/
(~, (3 ) représente
engénéral
le nombre defaçons différentes
dedisposer
circulairement a valeurs de manière àobtenir R maxima,
onpeut
écri-re :
Comme valeur
particulière
de~(n, k)’
on obtient facilement~(3, 1)
=2,
nombre de
façons
différentes dedisposer
circulairement 3 valeurs de manière à avoir un maximum(ce qui
en l’occurence a lieu dans tous lescas).
REPRESENTATION DE
(3)
SOUS FORME DE RESEAU - Soit le réseau R suivant :Le mode de formation de ce réseau est le suivant :
- A la
pointe supérieure
deR,
onporte 2,
valeur deÔ(:3,l).
- Le
long des obliques
k =1,
k =2, etc... ,
onporte
les valeurs 2k.- Le
long
de chacune desobliques perpendiculaires
auxprécédentes,
onporte
lasuite décroissante des nombres entiers en
commençant
par 1 pour lapremière oblique, par 2
pour ladeuxième,
etc.- Les valeurs nodales sont
égales
à la somme desproduits
des nombresportés
sur les deux
segments obliques supérieurs qui
y aboutissent par les valeurs nodales situées à l’autre extrémité de cessegments.
Si nous considérons parexemple
la valeur nodale située à l’intersection de(k = 2)
et(n = 6),
nous la calculerons ainsi(3
x8)
+(4
x16) =
88.Ces
quatre
conventions sont suffisantes et nécessaires pour déterminer R . On vérifie facilement que, siA’/~ ~
est la valeur nodale située à l’in- tersection del’oblique
k et de l’horizontale n, on a effectivement vérifié(3)
pourles A’. Puisque
d’autrepart
on apris
laprécaution
d’introduire au sommet du réseau la valeurparticulière A’/o ~B = A/~ jB =2~
on en conclut que lesA 1 (,,, k)
sont
identiques
auxA~~ .
Autrementdit,
les valeurs situées sur une même ho- rizontale nreprésentent
bien le nombre defaçons
différentes dedisposer
n va-leurs circulairement de
façon
à obtenir desquantités
k données de maxima.On peut faire
deux remarques intéressantes sur le réseau. Toutd’abord,
que le nombre de noeuds non nuls pour un n donné est
égal à 2
pour npair
et à(n ; 1)
pour nimpair.
Ceci reflètesimplementla
même nécessité où se trouve la limitesupérieure
dek, d’après
la définition même des maxima.La seconde remarque, c’est que la somme des valeurs nodales pour cha- que
ligne
horizontale est évidemmentégale
à(n - 1) !,
nombre despermutations
possibles
de n valeurs circulaires. On adonc,
pour laprobabilité
d’ obtenir k ma- xima pour une suite au hasard de n valeurs :(4)
Le réseau R et la formule
(4 ) permettent
le calcul deproche
enproche
desk
Pn (k).
Nous donnonsci-après
un extrait de la table desFn(k) = s
p=lPn (p),
c’est - à-dire de la table des
probabilités
d’obtenir k maxima ou moins pour n valeurs. Cet extraitporte
sur des valeurs de n allant de 1 à 46.ESPERANCE
MATHEMATIQUE
DU NOMBRE DE MAXIMAEn
général, l’espérance En (k)
du nombre de maxima pour une suite de nvaleurs se calcule facilement.
En
effet,
si les n valeurs v sontrangées
dans l’ordrecroissant,
leurs rangs étant1, 2,...,
q,...,(n - 1),
n, laprobabilité
que la valeur de rang q soitun maximum dans la suite S au hasard est le
produit
de laprobabilité qu’elle
aitdans cette suite une valeur
plus petite
à sa droite par laprobabilité qu’elle
en aitune à sa
gauche lorsqu’elle
en adéjà
une à sa droite. Autrementdit,
on a :D’où : o o
Soit, d’après
les formules connues d’addition despremiers
nombres :Nous ne connaissons malheureusement pas les moments d’ordre
supérieur
au
premier
pourPn (k).
APPROXIMATION DE LA DISTRIBUTION DES
P~ (k)
POUR n ELEVE -Il semble que la distribution tende assez
rapidement
vers la normalitélorsque
n croit. Cettehypothèse
a été vérifiéejusque
pour n = 500.Pour n
grand,
on pourra proposerl’approximation
suivante : laquantité
peut
alors êtreapproximativement
considérée comme une variable normale ré- duite. Parexemple,
pour n = 70 et k =30,
on obtient z =4, 06,
valeur normalequi
admet à sa droite une fraction de la courbe de Gausségale
à2/ 100. 000 (par
un calcul
exact,
onpeut
voir que la surface defréquence correspondante
seraitpour
F~ (k)
en réalité de1 / 100. 000).
Diverses
comparaisons
que nous avons fait entrel’approximation
nor-male et les
fréquences
réelles deFn (k),
sur des valeurs de ncomprises
entre 30et
500,
nous ont montré quel’approximation
est assez bonne àpartir
de h = 40.Jusque là,
il est conseillé d’utiliser la table deFn (k).
---..-
(1) Formule
proposée
par le Prof. Dr. RUTISHAUSER de l’Institut deMathématiques Appli-
quées
de l’EcolePolytechnique
Fédérale de Zurich.APPLICATION
PRATIQUE
DU TEST -Un
exemple pratique d’application
fera voir le but du test et samanipula-
tion. Nous
l’empruntons
àHald
à travers la citationqu’en
fait E.Morice(2).
Deux solutions de concentration différente d’une même
substance
ont étéplacées
l’une au-dessus de l’autre dans unmélangeur,
la solution laplus
con-centrée
ayant
été versée lapremière. Après mélange,
unrobinet, placé
à lapartie
inférieure dumélangeur,
apermis
de recueillir à intervallesréguliers
58
éprouvettes
successives dont on a mesuré la concentration.Les chiffres successifs sont donnés dans le tableau
ci-après. (A
lire ho-rizontalement. Nous avons
souligné
les maxima en traitspleins,
etsouligné
enpointillés
un maximum rendu douteux par unex-aequo).
38
33 29 16 44 21 16 1719
122
28
22 14 7 1321
15 34 2315 19
32
24 14 1322
8 30 1115 24
26
14 1125
17 1019
56j_67U)lj)281414
15
16
13 11 9 1 19 21--
Selon
Hald,
unmélange
insuffisamment réalisé pourra être testé par laprésence
d’une concentrationtrop élevée,
engénéral,
pour lespremières
obser-vations, trop
basse pour les dernières. Notrepoint
de vue ici sera évidemmentlégèrement
différent : nous pourrons parexemple
penserqu’un mélange
insuf-fisant amènera la concentration des
éprouvettes
voisines àreprésenter
des va-riations
graduelles, typiques
du passageprogressif
d’une zone de concentration à une autre dans lemélangeur.
Ces variationsgraduelles,
outendances,
doivent nécessairement se traduire par un abaissement du nombre de maxima obtenu parrapport
au nombrequ’on
en attendrait dans le cas d’unmélange parfait,
c’est-à-dire du hasard.
Notre ex-aequo nous pose une
question :
notre suite circulaire de 58 va-leurs
possède-t-elle
16 ou 17 maxima?Proposons,
commetoujours
enpareil
cas, la solution deprudence :
tou-jours
se mettre dans la situation la moins favorable. Autrementdit,
si mon in- tention était de prouver que lemélange
est malfait,
doncqu’il
y a destendances, j’adopterai
17 maxima. Si au contraireje
veux prouver laperfection
dumélange, je
considèreraiqu’il n’y en
a que 16.Ceci est évidemment valable
lorsqu’il n’y
a pastrop
de maxima douteux.Sinon,
nous pensons que laquestion
des ex-aequos mérite d’être traitée théori-quement
àpart.
Supposons
doncd’abord que
monhypothèse
m’entraîne à admettre 17 ma-xima. Nous savons.que la formule de z :
z = 20132013~2013obéit
approximativement
à l. 1 éd "t ~ 1
tOI’ 0, 4 n
51 +1,
5 - 581 14 à une loi normale réduite. En
remplaçant,
il vient z =4,82 - - 1,
14 va-leur pour
laquelle
nous lisons dans la tableintégrale
de la loi de Gaussqu’elle
laisse à sa
gauche 12, 7%
de la distribution(le
chiffre exact fourni par la loi du---
(1)
Hald : "Statisticaltheory
withengineering applications ",
J. WILEY, 1952(2)
E. MORICE :"Quelques
testsnon-paramètriques",
in Revue deStatistique appliquée.
Vol IV,ri 4,
de 1956.nombre de maxima serait
12, 4%).
Si nous travaillons au seuil de . 05(c’est-
à-dire
5%)
l’existence de tendances n’a donc pas été démontrée.Voyons
maintenant le casoù j’admettrais
16 maxima dans ma donnée.Nous obtenons cette fois : z =
20132013 ’ ~20132013 = - 1~76 23, 2
valeurqui
laisse à sa gau- che3, 9%
de la surface deGauss( 1 ).
Autrementdit,l’existence
de tendances est cette fois démontrée au seuil de . 05.On remarquera que nous n’avons considéré que la
gauche
de la distribu- tion parce que nous nousposions
leproblème
de l’existence ou non de tendancesayant
abaissé le nombre demaxima,
et non leproblème plus général
de la nonconformité de notre donnée à une suite au hasard
(ce qui
aurait pu se réaliser aussi bien par un excès demaxima).
CONCLUSIONS -
Le test du nombre de maxima
(ou
deminima,
les deuxquantités
étant iden-tiques)
est un test nonparamétrique d’application
trèsrapide.
Il suffit en effet decompter
le nombre de maxima de la suite en la bouclant circulairement. Cette dernièreprocédure
ne distort que d’une manièrenégligeable
lasignification qu’on peut
accorder au test.Il est bien évident que le test laisse
échapper
uneimportante quantité
del’information incluse dans les données. Aussi
parait-il
toutindiqué
de l’utiliser là où ces dernières sont.abondantes,etgagnent
à être considérées àgrande échelle,
comme par
exemple
en cequi
concerne lestemps
courts de travailrépétitif
dansl’industrie.
Le test semble
également
intéres-sant pour
s’appliquer
à la recherche de tendances au sein d’une donnée d’au-tre part
instable. Autrementdit,
étantdonné un
phénomène
aléatoire soumis à debrusques irrégularités qui
en dé-place
l’ensemble desvaleurs,
existe-t-il d’autre
part
des tendances locale- ment mais constamment à l’oeuvre ? On aura une idée d’un telphénomène d’après
le schéma ci-contre. Notre test n’est en effet que peu influencé parun
changement général
de niveau des valeurs(au
contraire parexemple
destests de
médiane),
alorsqu’il enregis-
tre bien les tendances locales
répétées .
En
règle générale,
,puisque En(k) ) = 2013~
, comme nous l’avons vu, onpeut
poser que des k
supérieurs
à cettequantité tendent
à détecter l’existence decycles
brefs sur le mode d’une alternance de valeurs fortes et de valeurs faibles. In-
versement,
les k inférieurssignalent
l’existence de tendances. Il y a lieu de seméfier des
phénomènes
decompensation
entrepériodes marquant
laprédominance
de l’un ou l’autre de ces
phénomènes.
---
(1) En réalité 3, 7% pour Fn (k) en valeur exacte.
k
TABLE DE
Fn (k) = P~1 Pn (p)
(1) En tête de