R EVUE DE STATISTIQUE APPLIQUÉE
F. H ATTON
F. F ACY
F. L AURENT
Une méthode simple de comparaisons partielles
Revue de statistique appliquée, tome 24, n
o4 (1976), p. 75-78
<http://www.numdam.org/item?id=RSA_1976__24_4_75_0>
© Société française de statistique, 1976, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
UNE MÉTHODE SIMPLE
DE COMPARAISONS PARTIELLES
F. HATTON
*,
F.FACY *,
F. LAURENT *INTRODUCTION
Au cours d’une
analyse statistique
est souvent abordée l’étude de larépar-
tition d’un caractère
qualitatif dichotomique
dans divers groupes desujets, répartition
matérialisée par lespourcentages
observés danschaque
groupe(soit
k le nombre de cesgroupes).
Le test
global
duX2
derépartitions
observées met en évidence une éven-tuelle différence
significative,
traduisant l’existence d’une différenceglobale
entre ces k
pourcentages.
Mais on désire, biensûr,
affiner ces résultats et voir où se situent exactement lesdifférences ;
en somme, on veut classer et même ordonner les kpourcentages
pl P2 ... Pi ... Pk -Ceci
peut
être réalisé à l’aide d’une des méthodes decomparaisons partielles
entre les
pourcentages pris
deux àdeux, quand
k est relativementpetit.
Maisil y a de nombreux
problèmes
où k est"grand" :
il en est ainsi parexemple,
pour la
comparaison
desdépartements français
où k estsupérieur
à 90. Laméthode des
comparaisons partielles paraît
alors difficilementapplicable :
- en
effet,
le nombre de tests nécessaires s’accroît trèsrapidement puisqu’il est égal à k (k - 1)
est
égal 2
- mais surtout, les résultats ainsi obtenus sont difficilement
interprétables
du fait même de la
multiplicité
des tests réalisés.Aussi, propose-t-on ici,
une méthode de classificationplus simple,
baséesur la
comparaison
dechaque pourcentage
Pi, p2 ... Pi ... Pk aupourcentage
moyen P observé pour l’ensemble de la
population.
Cette
méthode,
si elle nerépond
pas exactement àl’objectif précédemment décrit, permet
toutefois de différencier 3 sortes de groupes :- groupes pour
lesquels
le pourcentage observé pi ne diffère passignifica-
tivement du
pourcentage
moyenP,
(*) Section "Statistique, Epidémiologie et Informatique" I.N.S.E.R.M. - D.R.M.S. 44, Chemin de Ronde - F - 78110 Le Vesinet.
Mots-clés : Test de
comparaison.
- groupes pour
lesquels
pi diffèresignificativement
deP,
et tels que pi > P- groupes pour
lesquels
pi diffèresignificativement
deP,
et tels que pi PMETHODE PROPOSEE
- Soit une
population
de Nsujets, séparée
en k groupes de nisujets :
n1, n2 ... ni ... nk ;- soit un caractère
qualitatif dichotomique,
parexemple
C absent ouprésent,
les indices 0 et 1correspondant respectivement
à C absent et Cprésent ;
on
dispose
donc des données suivantes :On désire savoir pour
chaque
groupe i si lepourcentage
observé pi diffèresigni-
ficativement du
pourcentage
P observé pour l’ensemble de lapopulation.
Onteste donc
l’hypothèse
nulle P =Pi
contrel’hypothèse
alternative P =1=Pi
Pour
cela,
on calculera l’écart réduit e entre P et pi :On sait que P et pi ne sont pas
indépendants.
On calcule facilement que
N1-nil correspondant
aupourcentage
desujets présentant
le caractère CN-ni
parmi
lessujets
des(k - 1)
groupes, autres que le groupe i(ensemble
de lapopulation,
à l’exclusion dessujets
du groupei).
Soit 1T ce dernier
pourcentage,
on a donc :où 7T et pi sont
indépendants.
En cas
d’hypothèse nulle,
on aurait : 7r = pi - PDonc,
De
même,
En
définitive,
soit
En
définitive,
on a donc la formule de eLa différence entre P et pi sera
significative
aurisque
a donné si :e,,,, étant la valeur lue sur la table de la loi normale réduite pour le
risque
achoisi.
Soit si
En résumé :
et dans ce cas :
si si
DISCUSSION
- L’intérêt du test
proposé
est évidemment limité et ne permet pas d’or- donner tous les kpourcentages
les uns parrapport
aux autres.Cependant, grâce
à sonutilisation,
il estpossible
dedifférencier, parmi
cesk
pourcentages,
trois sous-ensembles différents par rapport au pourcentage moyenglobal
observé pour l’ensemble de lapopulation
et ceci en fonction d’unrisque a
donné :- groupes où les
pourcentages
sont inférieurs aupourcentage global,
- groupes où les
pourcentages
ne diffèrent pas dupourcentage global,
- groupes où les
pourcentages
sontsupérieurs
aupourcentage global.
Cette classification constitue une
première approche
duproblème qui
nous intéresse ici et
paraît
toutspécialement
intéressante pour les compa- raisons depourcentages
ou de taux observés dans lesdépartements français
aussi bien en ce
qui
concerne la mortalité que la morbidité.Il serait en outre
possible
de l’affiner en constituant des sous-ensemblesplus
nombreux en fonction dudegré
designification,
c’est-à-dire en recherchant lasignification
des tests pour diverses valeurs de a.-
Toutefois,
à cetégard
il faut noter que le nombre de tests effectués étant assezgrand, puisqu’il
estégal
à(k - 1),
il est difficile d’attribuer unevaleur formelle à ce
risque
d’erreur a.On devra donc
agir
avecprudence,
et ne tenircompte
que des différencessignificatives
pour unrisque
a inférieur à la valeur habituellement retenue.- Pour
terminer,
on peut remarquer que la formule trouvée serapproche
du test de
comparaison
d’un pourcentage observé à unpourcentage théorique
que l’on aurait pu effectuer en considérant le
pourcentage global
P comme unpourcentage théorique ;
on aurait alorsadopté
le test suivantEn
comparant
les formules(1)
et(2)
on voit que le testqui
estproposé ici,
estplus puissant puisqu’intervient
un facteur correctifsupérieur
àl’unité,
Remerciements :
Nous adressons nos