R EVUE DE STATISTIQUE APPLIQUÉE
M. A. C AMBOIS H. F ONTAINE
Présentation d’une méthode de segmentation effectuée à partir de deux fichiers différents. Application à la sécurité routière
Revue de statistique appliquée, tome 28, n
o4 (1980), p. 37-49
<http://www.numdam.org/item?id=RSA_1980__28_4_37_0>
© Société française de statistique, 1980, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
37
PRESENTATION D’UNE METHODE DE SEGMENTATION EFFECTUEE
APARTIR DE DEUX FICHIERS DIFFERENTS
Application à la Sécurité Routière
M.A. CAMBOIS et H. FONTAINE (1)
I. INTRODUCTION
En matière de sécurité
routière,
lephénomène
accident est si peufréquent
au
regard
de lapopulation
des conducteurs et des kilomètresqu’ils parcourent, qu’il
est assez difficile àappréhender
directement àpartir
d’échantillonreprésen-
tatif des usagers de la route.
On
dispose
leplus
souvent d’unepart,
d’un fichier recensant les accidents et d’autrepart
de fichers reflétant la circulation sur le réseauroutier ;
c’est donc àpartir
detypes
de donnéesd’origine
tout-à-fait différente que nous effectuonsnos études de
risque ;
nous définissons lerisque
comme le nombre d’accidentsrapportés
aux kilomètres parcourus.L’objet
de cet article estd’exposer
une méthodepermettant
d’ordonner les variablesdisponibles
en fonction de leur incidence sur lerisque.
Ce genre deproblème
n’est passpécifique
à la sécurité routière et se retrouve trèsprobable-
ment dans d’autres domaines où le
phénomène
à étudier est rare parrapport
à lapopulation susceptible
d’être atteinte(dans
le domaine de la médecine parexemple).
Nous avons effectué une étude visant à rechercher différents facteurs acci-
dentogènes
enpassant
par la détection d’ensembles de "véhicules x conduc- teurs x environnement"présentant
desrisques
anormalement élevés en matière de sécurité routière : ceci afin despécifier
la nature des mesures ou actions àentreprendre.
Il était souhaitable de faire intervenir sans apriori
leplus grand
nombre de variables
possibles.
Pour arriver à cebut,
on aprocédé
de lafaçon
suivante :
On a retenu toutes les variables communes aux deux fichiers reflétant l’un la
circulation,
l’autre les accidents. Les variablesquantitatives
ont été renduesqualitatives.
On acomparé
les distributions de ces variables sur chacun des deux fichiers afin de détecter cellesqui
fontapparaître
desrisques particulièrement
forts ou faibles pour des groupes d’individus donnés. En
effet,
pour une variable donnée lesrisques
sont d’autantplus hétérogènes
que les distributions des acci- dentés et des circulants sont différentes. Nous allons maintenant détailler leprin- cipe
de cette méthode.---
(1)
Chargées
d’études à IDrganisme National de Sécurité Routière.Revue de Statistique Appliquée, 1980, vol. XXV))),n° 4
Mots-clés :
Analyse
de données.Segmentation.
Hiérarchisation.II. METHODE
Nous avons utilisé une méthode
d’analyse statistique
dont leprincipe
suitcelui de la
segmentation.
Dans unesegmentation classique
on cherche àexpliquer
une variable
privilégiée
parplusieurs
autres variables. Dans notre cas la variableprivilégiée n’apparaît
pas de manièreexplicite,
elle résultesimplement
de la compa- raison des distributions des accidentés et des circulants. Apart cela,
leprincipe
estle même à savoir que l’on cherche à dichotomiser l’ensemble des individùs en deux sous-ensembles les
plus
différenciéspossibles
et à réitérer cette démarche autant de foisqu’on le juge
utile pour l’étude.a) Décomposition
de chacune desétapes
de lasegmentation
Première
étape
L’objectif
est de chercher unepartition
des individus en deux sous-popu- lations lesplus hétérogènes possibles
entre ellesquant
à leurrisque.
Cetteparti-
tion sera déterminée par la dichotomie de l’ensemble des modalités de la variable
qui
donne "la distance" laplus
élevée entre la distribution des accidentés et la dis- tribution des circulants. La distance entre les distributionspeut
être définie de différentes manières. Cepoint
sera détaillé ultérieurement.Soit p le nombre de variables communes aux 2 fichiers. On
appelle Xi
l’unede ces variables : i allant de 1 à p, ni le nombre des modalités de cette variable.
Par
exemple,
la variable Saison aura 4 modalités(Printemps, Eté, Automne, Hiver).
La distribution de l’ensemble des accidentés suivant les
n.
modalités de la variable X. sera :1
avec
Celle de l’ensemble des circulants :
avec
Etant donné une dichotomie définie par un ensemble K d’indices de la variable
Xi
et soncomplémentaire L,
deux nouvelles distributions sont obtenues :-
(a iK’ aiL)
chez les accidentés avec39
-
(c iK’ CiL)
chez les circulants avecOn calculera une distance entre ces deux nouvelles distributions.
Notons que pour une variable à
n. modalités,
il existe2ni-1 -
1 dichotomiespossibles,
si l’on nepart
d’aucun apriori.
Ce nombre croît trèsrapidement
avecn. ; il atteint par
exemple
pourn.
= 24(le
nombre de marques ettypes)
8 388 607.Nous
verronsplus
loin comment contourner cette difficulté.Une distance étant
théoriquement
calculée pour toutes les dichotomiespossibles
de toutes lesvariables,
on retiendra la variable et sa dichotomie donnant la distance laplus grande
entre les distributions "accidentés" et "circulants".Ceci constituera notre
premier
critère desegmentation.
Il en résultera deux ensem-bles d’individus à l’intérieur
desquels
on examinera lesstatistiques
des autresvariables relatives aux accidents et à la circulation.
Deuxième
étape
Sur chacun de ces deux groupes
précédemment définis,
onrépétera
le proces-sus de la lère
étape.
Il sera déterminé la nouvelle dichotomie de variablequi
soitla
plus
discriminante pour lerisque.
On obtiendra alors 4 sous-groupes, surlesquels
de nouvelles
statistiques
seront calculées.Nième étape
On
répétera
le même processus pour les2N-1
groupes déterminés àl’étape précédente.
On obtient ainsi un arbre donnant une hiérarchie des différents critères pour chacune des branches.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 4
Règles
d’arrêtLe traitement étant relativement
lourd,
deuxrègles
d’arrêt ont été retenues:- le nombre de pas sera
égal
au nombre de variables intervenant dans la seg-mentation,
ceci afin de laisser une chance de sortie à chacune d’entre elles(il
sepeut cependant qu’une
même variableapparaisse
à des niveaux différents avec une dichotomiedifférente).
- Dès
qu’un
groupe déterminé à une certaineétape représentera
un pour-centage trop
minime d’accidentés ou decirculants,
on arrêtera le processus desegmentation
sur ce groupe. Il semble apriori qu’une
limite inférieure à 10 % soit raisonnable.b)
Distancesproposées
Soit une dichotomie de la
population
initiale :(I, II)
(aI, ail) :
la distribution des accidents(aI + aII - 1) (cI, cil)
: la distribution des circulants(cI
+cil
=1 )
:
risque
relatif du groupe 1(rapport
desfréquences)
:
risque
relatif du groupe II.Plusieurs
types
de distancespeuvent
êtreproposées ;
nous en utiliserons deuxici ;
chacune d’elles conduisant à uneinterprétation
différente de l’arbreen résultant. Il va de soi que l’une d’elles étant
choisie,
elle sera utilisée exclusi- vement àchaque
pas de lasegmentation ;
cequi
conduit à deuxsegmentations possibles.
- Distance du
X2
avec lapopulation
des circulants enréférence
Lorsqu’il n’y
a que 2 classes commeici,
cette formule sesimplifie (ai=1 - aIl et cI
= 1- Cu).
On obtient alors :
En terme de
risque,
ellepeut également prendre
la forme suivante :ou encore :
41
- Distance du
X2
avec lapopulation
des accidentés enréférence
ou encore :
Lors de
l’analyse
des résultats on examinera laspécificité
de chacune de cesdistances et les
phénomènes qu’elles
fontapparaître.
c)
Réduction du nombre de distances à calculer àchaque étape
Nous avons vu,
qu’étant
donné une variablequalitative
définie par un certain nombre declasses,
le nombre de dichotomies que l’onpeut
former croît très viteavec le nombre de classes.
A
partir
de la variable "saison" parexemple
à 4 classesPrintemps (P),
Eté(E),
Automne
(A),
Hiver(H),
onpeut
former 7 dichotomiespossibles :
Si nous avons P variables dans la
segmentation
la ième variableayant
niclasses,
il faudrait former7 (2 1)
dichotomies et calculer pourçhacune
d’elles une distance au 1er pas. Aux passuivants,
le nombre de distance à calculerne unninue que très
légèrement.
Ceci rendraitl’exploitation informatique
extrême-ment lourde et coûteuse.
Nous avons fait le choix de ne pas former toutes les dichotomies
possibles.
En
effet,
certaines d’entre elles nous semblent d’emblée peu intéressantes pour ce que l’on recherche.Prenons
l’exemple
d’une variable à trois modalités :- La distribution des accidentés est
{a1 ,
a2 ’a3 }avec
al + a2 + a3 = 1- La distribution des circulants est
{cl ,
C2’C3 } avec
CI + c2 + C3 = 1- Les
risques
associés àchaque
modalité sontrl ,
r2lr3
avec ri =ail ci
pour i allant de 1 à 3.
Classons ces modalités par ordre croissant de
risque.
Nous obtenons alorsri ril
rIIILa définition du
risque
est telle que si les deux distributions sontdifférentes,
il y auratoujours
unrisque supérieur
à 1 ettoujours
unrisque
inférieur à 1.La dichotomie
qui
rassemblerait les classes 1 et III ne ferait que neutraliserces
différences,
cequi
est contraire au but recherché. Nous allons doncrejeter
Revue de Statistique Appliquée, 1980, vol. XXVII I, n° 4
d’emblée ce
type
de dichotomies pour ne retenir que cellesqui préservent
l’ordredes
risques.
Enl’occurrence,
pour le cas de 3modalités,
il existetoujours
une di- chotomiepréservant
l’ordre derisques,
soit{I}
contre{II, III}
soit{1,11}
contre{III} qui
donnera une valeur de la distancesupérieure
à celle de la dichotomie{1,111}
contre{II}.
Ceci n’a pas été démontré pour une variable à
plus
de troismodalités,
maisnous en avons retenu le
principe ;
il est d’ailleurs fortprobable
que dans lamajorité
des cas, la dichotomie donnant la distance la
plus grande
se trouveparmi
les dicho-tomies ordonnées.
Nous avons donc
procédé
de la manière suivante : Soit une variablequalitative Xi
àni
modalités :[a 1 ’
a2 ... ,ani]
la distribution desaccidents
[c 1 ,
C2 , - - -cn.] ]
la distribution des circulants[r1,
r2 , ....,r ni] le
vecteur derisque
relatifavec pour
tout j
de 1 à nir.
Les classes de la variable
Xi
vont être ordonnées par ordre croissant derisque :
Soit
[rI ,
rII ,....rNi. ] le
vecteur ordonné desrisques.
Nous retiendrons la dichotomie donnant la distance la
plus grande parmi
les
(ni - 1)
dichotomiessuivantes,
formées encoupant
en deux lapartition
ordon-née,
la coupure variant de lapremière
à la dernière classe.Il suffit de calculer les
(ni - 1)
distancescorrespondantes
et de retenir laplus
élevée.
Ce
processus fait passer le nombre de calculs pourchaque
variable i de(2ni-1-1)à(ni-1).
Le
gain
est considérable dès que le nombre de modalités est élevé.III. APPLICATION
PRATIQUE
SUR UN EXEMPLE111.1.
Description
des fichiersNous avons utilisé les fichiers suivants :
43
- Fichier des accidents
Le fichier d’accidents dont on
dispose
est le fichier national des accidentscorporels qui
a été constituéchaque
année par le S.E.T.R.A.(1) jusqu’en
1976.On y trouve des variables concernant
l’infrastructure,
lesintempéries,
levéhicule et le conducteur accidentés. Ce fichier est normalement un fichier exhaus- tif de tous les accidents
corporels.
Sa taille est trèsimportante,
environ 250000accidents y sont recensés
chaque
année.- Fichier de circulation
Nous
disposons
d’un fichier résultat d’uneenquête
aux stations servicequi
est un reflet de la circulation de Juillet 1973 à Juin 1974 sur l’ensemble du réseau
routier,
enagglomération
et en rase campagne. Larégion parisienne
en est exclue.Les observations ont été faites entre 8 h et 20 h. Seuls les véhicules
légers
ont étépris
encompte :
ils sont au nombre de 8 623. Les données recueillies concernent le véhicule et le conducteur etsont représentatives
des kilomètres parcourus.Le nombre d’accidents
correspondant
à ces critères étant trèsélevé,
on n’ena retenu
qu’un
dixième defaçon
àalléger l’exploitation.
Les variables communes aux deux fichiers sont les suivantes :
Pour le conducteur :
- -
Catégorie socio-professionnelle (12 modalités) . agriculteur, artisan, petit commerçant
. industriel,
groscommerçant . profession libérale,
cadresupérieur
. cadre moyen, technicien
. employé
debureau,
chauffeurprofessionnel . agent
demaîtrise,
ouvrier. employé
de maison. membre de l’armée et de la
police
. membre du
clergé . étudiant,
retraité. sans
profession
. sans
réponse
- Age
du conducteur(7 modalités)
. 18-19 ans
. 20-24 ans . 25-29 ans
. 30-39 ans . 40-49 ans
. 50-64 ans
. 65 ans et
plus
- Sexe du conducteur
(2 modalités)
. Masculin . Féminin
(1) Service d’Etudes Techniques des Routes et Autoroutes.
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 4
- Ancienneté du
permis
de conduire(5 modalités)
. 1 à 2 ans
. 3 à 4 ans
. 5 à 9 ans . 10 à 19 ans . 20 ans et
plus
Po ur le véhicule :
-
Marque
et type(21 modalités)
Les résultats obtenus à
partir
de cette variableayant
un caractère confi- dentiel nous ne le ferons pasapparaître
de manièreexplicite.
- Année de mise en circulation du véhicule
(5 modalités)
. 1971-1972 . 1969-1970 . 1966-1968
. 1965 et années
précédentes
Date et saison :
- Saison
(3 modalités)
. Juin, Juillet, Août, Septembre
. Octobre, Novembre, Décembre,
Janvier. Février, Mars, Avril,
Mai- Jours
(2 modalités)
. Jours ouvrables . Week-ends
Cette
segmentation
nous donnera une hiérarchie des facteurs accidento-gènes
pour l’ensemble desparamètres
concernant levéhicule,
le conducteur et lapériode.
On testera sur ces variables les deux distances
proposées
afin de mettre enévidence leur caractère propre.
111.2.
Analyse
des résultatsSegmentation
utilisant la distance duX2
avec les circulants en référence.On a obtenu un arbre
qui
ordonne les variables de l’étude et définit uncertain nombre de groupes. Pour chacun de ces groupes l’examen des nouvelles distributions de toutes les variables nous a
permis d’approfondir l’analyse
defaçon
à ne pas laisser passer des
phénomènes sous-jacents qui pourraient
être liés aux pa- ramètresdiscriminants ;
ceci se limitant évidemment aux variablesdisponibles.
En
premier lieu,
onpeut
constater que la distance utilisée à tendance à faireapparaître
des groupes tout-à-faitmarginaux (1
à 2 % decirculants) ayant
par ailleurs desrisques
relatifs assez élevés.Ainsi,
un certain nombred’étapes
de la seg- mentation a mis en évidence ces groupes ; dans ce cas on a décidé de ne pas ac- cordertrop d’importance
à l’ordre d’arrivée de la variablecorrespondante
dans45
le
classement,
sans toutefoisperdre
de vue quel’émergence
de ces groupespeut correspondre
à une réalité à ne pasnégliger (par exemple
lephénomène jeunes conducteurs).
Lasegmentation
ne sera paspoursuivie
sur des groupesreprésentant
moins de 7 % de la
population
des circulants.On
peut
noter queplus
une variable a demodalités, plus
lepourcentage
depopulation correspondant
à chacune d’ellesdiminue ;
lerisque peut
ainsiprendre
des valeurs assez élevées : en
effet,
si un groupereprésente
1 % descirculants,
ilsuffit que les accidents
correspondant représentent
5 % de l’ensemble pour que lerisque
soitégal
à5 ;
alors que pour un groupe formant 20 % descirculants,
il faudrait que lepourcentage
des accidentscorespondant
soitégal
à 100 pour donner la valeur 5 aurisque,
cequi n’arrive jamais.
On trouvera
ci-après
l’arbre résultant de cettesegmentation
ainsi que lesstatistiques
concernant lapopulation
entière.On
peut
en tirer les remarques suivantes :a)
Lapremière étape fait apparaître
lacatégorie socio-pro fessionnelle
comme va-riable la
plus
discriminante pour lerisque.
Elledistingue
deux groupes :- d’une
part :
lesagriculteurs,
les artisans etpetits commerçants,
les em-ployés,
les chauffeursprofessionnels,
lesagents
de maîtrise et lesouvriers,
les étu-diants,
les retraités et les personnes sansprofession
avec unrisque
de1,25.
Cegroupe
représente
65%
des circulants.- d’autre
part :
lesindustriels,
les groscommerçants,
lesprofessions
libé-rales,
les cadressupérieurs,
les cadres moyens et lestechniciens,
les membres del’armée,
de lapolice
et duclergé
avec unrisque
de0,54.
Ce groupereprésente
35 % des circulants.
On
peut
constaterqu’en
moyenne lepremier
groupe a un niveau de revenusinférieur au second. Pour
simplifier,
nousemploierons
laterminologie
suivante :- C S P à bas revenus
- C S P à hauts revenus
Le
risque
descatégories
à bas revenus estplus
de deux foissupérieur
à celuides
catégories
à hauts revenus. On va tenter de faireapparaître
lesphénomènes sous-jacents
à cettepremière partition
par l’examen desstatistiques
dans chacun des deux groupes.Pour la
population
des circulants onpeut
noter sur les autres variables les distorsions suivantes :- Les C S P à hauts revenus ont en moyenne leur
permis
3 ansplus
tôt que les autres(la
moyenned’âge
étant sensiblement lamême).
- Les C S P à bas revenus roulent
plus fréquemment
avec despetites cylin-
drées et des modèles
anciens, l’âge
du véhicule étantpratiquement
le même.- Les C S P à hauts revenus
parcourent proportionnellement plus
de kilo-mètres l’été
(Juin
àSeptembre)
quependant
le reste de l’année.Au vu des
statistiques
sur l’ensemble de lapopulation,
il s’avère que cesremarques sont très liées au
risque :
en
effet,
lerisque
diminue avec l’ancienneté dupermis,
les modèles anciens ont unrisque plus
élevé que les autres et la circulation de Juin àSeptembre
est relati-vement moins
dangereuse
quependant
le reste de l’année.Revue de Statistique Appliquée, 1980, vol. XXVII I, n° 4
STATISTIQUES
A PARTIR DES DEUX FICHIERS ACCIDENTES ET CIRCULANTSEffectifs
bruts 8 623 circulants 16 605 accidentés47
Revue de Statistique Appliquée, 1980, vol. XXVIII, n° 4
b)
La deuxièmeétape fait apparaître
deux nouvelles variables :- L’ancienneté du
permis
pour les C S P à hauts revenus en isolant les débu- tants avec unrisque 2,3
foisplus
fort que les autres. Bienqu’en
soi le manqued’expérience
soit un facteur derisque,
il se trouve par ailleurs que ce groupe formé d’individusjeunes (en
moyenne 23ans)
conduit relativementplus
depetites cylin-
drées et d’anciens modèles
réputés
comme des véhicules moins sûrs.- Les marques et
types
pour les C S P à bas revenus isolant les modèles avec unrisque 1,7
foisplus
élevé que les autres. On nedistingue
pas d’autres différences notables entre les deux groupes ainsi formés.c)
La troisièmeétape
estcomplémentaire
de laseconde,
dans la mesure où l’onretrouve les mêmes variables inversées :
ainsi,
dans les C S P à hauts revenus la marque ettype
succède à l’ancienneté dupermis
Dans les C S P à bas revenus
l’âge
et l’ancienneté dupermis qui
sont des va-riables très
liées,
succèdent à la marque et autype.
Dans le groupe des véhicules à hautrisque
les débutants sont isolés comme sous-groupeplus dangereux ;
pour les autresvéhicules,
ondistingue
les conducteurs de moins de 25 ans et deplus
de 65 ansprésentant
unrisque plus
élevé que les autres.d) Quatrième étape.
Il estremarquable qu’à
ceniveau, quel
que soit le groupe danslequel
on se trouve, c’est lapériode
de l’annéequi apparaît,
en isolant àchaque
fois les 4 mois d’été(Juin
àSeptembre)
commepériode plus
sûre que le reste del’année,
lesrisques
relatifs étant tout-à-faitcomparables,
les mois lesplus
froids sont1,5
à1,7
foisplus dangereux
que les mois d’été.e)
Auxétapes
suivantes on retrouve les mêmes variables :âge,
ancienneté du per-mis,
marque ettype
etcatégorie
socioprofessionnelle
avec d’autres modalitéssegmentantes.
Les conducteursayant
leurpermis depuis plus
de 20 ansapparais-
sent
plusieurs
fois comme groupeparticulièrement
sûr.Inversement,
les conduc- teursâgés
deplus
de 50 ans ou 65 ansapparaissent
comme groupeplus dangereux.
A aucun moment, les variables suivantes ne sont apparues directement comme discriminantes :
-
l’âge
du véhicule- sexe
- jour ouvrable,
week-endCeci n’est pas étonnant dans le cas des deux dernières variables où le
risque
est très
proche
de1, quelles
que soient les modalités(hommes : 0,97
et femmes :1,14 ; jours ouvrables : 1,00
et week-end :0,99).
Dans le cas de la
première variable,
lerisque
croîtrégulièrement
avec l’an-cienneté du
véhicule,
tout en restant dans une fourchette assez restreinte(moins
d’un an :
0,81 ; plus
de 8 ans :1,38).
Nous mentionnons que nous avons
également
effectué une autresegmenta-
tion en utilisant la distance
du x2
avec les accidentés en référence. Nous avonsnoté que l’ordre d’arrivée des variables était le même et que la tendance de cette distance était d’isoler les groupes
marginaux
àrisque particulièrement
faible. Ceci n’est pas étonnant étant donné la manière dontpeut s’exprimer
cette distance enfonction du
risque (cf. § Il.b).
Remarque :
Nousdisposions également
d’une autreenquête
reflétant la circula- tion. Les observations étaient faites au bord de la route sans arrêter les véhicules.49
Les données recueillies concernent
l’infrastructure,
les conditionsclimatiques
etles
types
de véhicules. Unesegmentation
a été effectuée àpartir
de ce fichier decirculation et du fichier accident. On a été confronté ici à des
problèmes
d’homo-généité
de codification d’un fichier à l’autreplus importants
queprécédemment.
En
effet,
le recueil de donnéesimplique
une normalisation descodifications,
enparticulier
pour les variables demétéorologie
et d’infrastructure(force
du vent,déclivité de la
chaussée).
Il est donc apparu des distorsions dans les distributions de ces variables tout à fait artificielles et necorrespondant
pas à desrisques
réels.Il est
primordial
avant d’effectuer cetype d’analyse
de s’assurer del’homogénéité
de la codification des les deux fichiers utilisés.
IV. CONCLUSION
Comme toute
segmentation,
cetype d’analyse
est assez lourd et coûteuxmalgré
le choix que nous avons fait de réduire le nombre de dichotomies àprendre
en
compte.
Un autre inconvénient s’estajouté
ici dans la mesure où il a fallu veiller à ce que lessystèmes
de codification soientcompatibles
d’un fichier à l’autre. Maisune
segmentation classique
effectuée àpartir
d’un fichierunique
réunissant pourchaque
individu des données sur sescaractéristiques
habituelles et sur ses accidents s’il y alieu,
se heurte à d’autresproblèmes
tout aussidélicats,
liés à la rareté duphénomène
étudié. Dans ce cas, la méthode que nous avons mise aupoint peut
constituer un outil
statistique plus adapté.
Revue de Statistique Appliquée, 1980, vol. XXVIII, no 4