R EVUE DE STATISTIQUE APPLIQUÉE
A NIS A BI F ARAH
Un test pour le contrôle de la qualité du travail dans un recensement
Revue de statistique appliquée, tome 22, n
o1 (1974), p. 67-86
<http://www.numdam.org/item?id=RSA_1974__22_1_67_0>
© Société française de statistique, 1974, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
67
UN TEST POUR LE CONTROLE DE LA QUALITÉ DU TRAVAIL
DANS UN RECENSEMENT
Anis ABI FARAH
Université
Libanaise,
Faculté des Sciences,Hadeth-Beyrouth
Liban1 - INTRODUCTION
Dans un recensement, la
qualité
du travailpeut
être mesurée par la pro-portion
d’unitésstatistiques
recenséeseffectivement ;
ou encore par la propor- tion p d’unitésstatistiques oubliées ;
engénéral
p varie de 2 à 6 %.L’objet
de cet article est deprésenter
une méthode de contrôle dequalité.
On compare entre eux
plusieurs
modèlesprobabilistes,
afin de choisir le meilleur modèlequi
servira pour la construction d’un testclassique
ouséquentiel.
Cetest
porte
sur les valeurs quepeut prendre
laproportion
p, il nouspermet
alors de contrôler laqualité
du travail au fur et à mesurequ’il
est fourni.2 -
2.1 -
Description
de la méthode de contrôle.Supposons qu’on
veuille recenser leslogements
dans une ville donnée V.La ville V est considérée comme étant
quadrillée
par unquadrillage
aussi finqu’on
ledésire ; (on pourrait
se servir des tournées déterminées par lesrues),
de telle sorte quechaque logement appartienne
à unpâté
delogements
età un seul.
Un
enquêteur E1,
estenvoyé
pour recenser leslogements
dans unerégion RI
de Vcomprenant fI pâtés,
enremplissant
unquestionnaire approprié
pourchaque logement.
Un
enquêteur E2
estenvoyé
pour recenserindépendamment
deEl
leslogements
d’unesous-région R2
deRI
1 formée def2 pâtés
choisis au hasardparmi
lesfI pâtés
deRI,
On a bienR2
CRI
etf2 fl.
Soit X l’ensemble des
logements
deR2
recensés parEl ,
et soit Y l’ensembledes
logements
recensés parE2
dans la mêmerégion R2.
Onpeut
écrire la rela-tion suivante :
Revue de Statistique Appliquée, 1974 - vol. XXII N° 1
Les ensembles au second membre sont deux à deux
disjoints.
Remarque : L’indépendance
entreEl
etE2 peut
être assurée en les choisissantau hasard
parmi
l’ensemble des recenseurs, et en veillant à cequ’ils
ne soientpas courant du fait
qu’ils
recensent la mêmerégion R2.
2.2. - Modèles
mathématiques.
Soient pl 1 et p2 les
probabilités
d’oubli d’unlogement quelconque
par lesenquêteurs El
etE2 respectivement.
Uneexpérience
aléatoire consiste à considérerchaque logement
deR2 ;
ilpeut appartenir (indépendamment
desautres
logements)
à X - Y ou à Y - X ou à X n Y ou enfin àR2-
X U Y.Posons :
Ayant
pour réalisations ni , n2’ n3 et n4respectivement.
Si n est le nombre
théorique
delogements
dansR,
la loi deprobabilité
de
(N1, N2 , N3, N4)
estmultinomiale ;
sesparamètres
sont[n ; (
1 -Pl)
p2 ,( 1 - P2 )
P 1(1
1 -P 1 ) (
1 -P2 ),
p1p2]. N 1 , N2, N3
etN4
sontquatre
variables aléatoires liées par la relationN1
+N2
+N3
+N4 =
n. Autrementdit,
cesont les coordonnées d’un
point
aléatoire d’un sous-espace linéaire à trois dimensions.2.3. - Loi conditionnelle de
(N1, N2, N3).
Un inconvénient du modèle décrit
au §
2.2. estqu’on
ne connait pas n ; sinon leproblème
seraitpartiellement
résolu. L’information fournie par la réalisation deNI, N2
etN 3
devrait nouspermettre
de définir un autre modèle utilisable par la suite pour la construction du test.On considère pour cela la loi conditionnelle de
(Ni, N2 , N3)
sachantque
NI
+N2
+N3 = 1.,
Soit
(NI, N2, N3, N4)
de loi multinomiale[n ; r1 ,
r2, r3,r4]
En
posant :
69
Donc
[N1, N2, N3 /N1
+N2
+N3 = l]
suit une loi multinomiale deparamètres
3.1 - Modèle à retenir pour faire le test
portant
sur les valeurs de p, 1 Un critère pour retenir un modèleMI
1plutôt qu’un
autreM2
consiste àcomparer les
quantités
d’information au sens de Fisher des deux modèles ausujet
duparamètre
pl. Celuiqui
a unequantité
d’informationplus grande
sera
préféré
à l’autre.Quelle
est alors laquantité
d’informationI(Mi)
fournie par une réalisa- tion d’une variable aléatoire Z ausujet
duparamètre
pl , si Z a comme loi deprobabilité Mi :
1 / mi
: Z suit la loi décrite dansle §
2.2.2/ M2 :
Z suit la loi décrite dansle §
2.3.3/ M3 :
On considère la variable aléatoireN1
+N2 /N1
+N2
+N3
lelle suit une loi binomiale
1 ; 1 2
On a :
Revue de Statistique Appliquée, 1974 - vol. XXII N° 1
Le calcul donné en Annexe
Al
conduit à :Le calcul donné en Annexe
A2
donne :Remarque :
Dans le modèleMI E2
ne nousrenseigne
par sur la valeur du para- mètre pl.3.2. -
Comparaison
deI(M1 )
etI(M2).
Si Pl P2 ,
pi
etp2 2
sontnégligeables
à côté de pl ou de P2 on a :3.3. -
Comparaison
deI(M1)
et deI(M3)
En
négligeant
Pl P2 ;p i
etp2
à côté de p 1 ou de p2 comme on a faitau § précédent
on obtient :71 D’où :
Exemple numérique :
p1 =0,02
et P2 =0,06
donneI(M3) I(M1) ~ l n 0,2050.
Il y a environ
4/5
de l’informationqui
estperdue
si l’onadopte
le modèleM3
au lieu du modèleMi
Or n n’est pas connu et l’on nepeut prendre
dans cecas que le modèle
M2 .
3.4. - Etude du cas p1 = P2 = p.
Si les deux
enquêteurs El
etE2
fournissentthéoriquement
un travailde même
qualité,
en d’autres termes si Pl = p2 - p, lesquantités
d’infor-mation fournies par les modèles
Mi, M2
etM3
ausujet
duparamètre
p,sont
respectivement 1’(Ml), I’(M2)
etI’(M3)
où :avec
Le calcul
(cf
AnnexeA3)
conduit àavec
Le calcul
(cf
AnnexeA4)
donneLe calcul
(cf
AnnexeAs)
donne encore :Revue de Statistique Appliquée, 1974 - vol. XXII N° 1
La
quantité
d’information fournie par le modèleMl
ausujet
de p setrouve alors doublée.
Remarque
2 - De même si l’on compareI’(M1)
à’(M2)
on obtient :Il vaudrait mieux utiliser le modèle
Ml plutôt
que le modèleM2. Mais,
vu
qu’on
nepeut
pas obtenir une réalisation deN4
on estobligé
d’utiliser le modèleM2 ;
il en résulte uneperte
d’information relative de l’ordre de2p
sin est à peu
près égal
à l.Remarque
3 - Lesquantités
d’informationl’(M2)
etI’(M3)
sontégales :
lessecond et troisième modèles sont
équivalents,
en ce sensqu’ils apportent
lamême
quantité
d’information ausujet
de p. Ceci est dû à lapropriété
énoncéeau §
3.5.3.5 -
Proposition.
NI
+N2/N + N + N = [
est un résuméexchaustif
ausujet
de p.Démonstration - En effet la fonction de vraisemblance L est :
avec ~(n1, n2/N
1 +N2 = n1 + n2)
estindépendante
duparamètre
p.73
3.6. - Généralisation de la
propriété
donnée dansle §
3.5.Proposition -
Si(NI, N2,
...Nh-1, Nh)
est de loi multinomiale(n ;
pl, p2 , ...,ph)
et si Pl = alg(p),
P2 =03B12 g(p),...,
ph-1 =03B1h-1g(p),
alors
N1
+N2
+... +Nh-1
est un résuméexhaustif
ausujet
de p.Démonstration - La fonction de vraisemblance L est donnée par :
et en
remplaçant
les pi par leurs valeurs on obtient :où P est la loi de
probabilité
deNI
+N2
+ ... +Nh-I qui dépend
du para- mètre p ;et 0
est la loi deprobabilité
de~
étant fonction des ni et non de p.Remarque 4 -
Dans le cas où 03B11 = 03B12 = ... = 03B1h-1 =1,
et h =
3,
on obtient le cas décritau §
3.5.3.7. - Généralisation de la méthode décrite
au §
2.1.On suppose
qu’on
aenvoyé
menquêteurs El, E2 , ... , Em
pour recenserindépendamment
les uns des autres leslogements
de larégion R2 R2
se trouvealors
partitionnée
en 2mparties disjointes
Revue de Statistique Appliquée, 1974 - vol. XX 11 N° 1
Soit
Al
larégion
deslogements
oubliés par tous lesenquêteurs
sansexception,
et
N1 =
cardAl (l’homologue
duN4
de2.2.).
Si pl est laprobabilité
d’oublide
E1,
P2 celle deE2,
... , Pm celle deE.,
alors laprobabilité qu’un logement appartienne
àAl
est pi , p2, ... , pm .De
même,
soitA2
larégion
deslogements
oubliés par tous lesenquêteurs
sauf le 1er. et soit
N2
= cardA2
.On a :
et ainsi de suite pour les autres
régions,
la dernièrerégion
estA2m
dont le car-in
dinal est
N2m
et telle queP[logement f A2m] = n (1 - pi).
On constateque les
probabilités respectives
desrégions Ai
sont les termes dudéveloppement
du
produit : [pl + (1 - p1)] [P2 + (1 - p2)] ... [Pm +(1 -pj].
Alors :
(N1, N2 ,
... ,N2m)
est de loi multinomialeAutrement dit
(N1’ N2,
... ,N2m)
est de loi mult.[n ;
r1, ... ,rj,..., r2m]
m m m
en
posant
r1 =03A0 pi, r2
1- p1) ff
pi, ..., r2m -03A0(1
1 -Pi)’
Toutrj
s’écrit sous la forme pir’ k
ou(1
12013 p1) r’k ;
lesr’ k
étant les termes dudeveloppement : [p2
+(1
1P2)] [p3
+(1
1 -p3)]
...[Pm
+(I
1- pm)].
Ce2m-l
qui
faitque rk -
1.En calculant la
quantité
d’informationI(p1)
on trouve alors :Remarque -
Laquantité
d’information ausujet
de pi est seulement fournie parEl ;
les autresenquêteurs n’apportent
aucune informationsupplémentaire
au
sujet
de p1.75 3.8. - Etude du cas où PI = p2 = ... = pm
On a alors :
(NI, N2,
... ,N2m) qui
suit une loi multinomiale dont lesparamètres
sont :La
quantité
d’informationI(p)
fournie alors ausujet
de p par une réali- sation de(N1, N2,
... ,N2m)
est :L étant la fonction de vraisemblance de ce
modèle, (cf
AnnexeA6)
3.9. - Deuxième méthode.
Soit
hl
le nombre delogements
oubliés parEl,
... ,hm
le nombre delogements
oubliés parEm . hl , h2 ,
...hm
sont des variables aléatoiresindépen-
dantes en
probabilité
ethi
suit une loi binomiale deparamètres
n et pquelque
soit i =
1, 2, ... ,
m.La fonction de vraisemblance est alors donnée par :
d’où
et
Remarque -
On constate que les deux modèles 3.8. et 3.9. donnent la mêmequantité
d’information ausujet
de p.3.10. -
Proposition.
suit une loi
multinomiale ;
etCette
proposition
est démontrée en AnnexeA7 .
Revue de Statistique Appliquée, 1974 - vol. XX Il N° 1
Remarque -
Si m est suffisammentgrand,
on a :Au
contraire,
si m =2,
on a :formule
déjà
trouvée au§
3.4.4.1. -
On considère les
hypothèses des § 2.3.,
et 3.4. On a vu que dans le casoù pl - p2 - p les modèles
M2
etM3
sontéquivalents
et queest un résumé exhaustif au
sujet
de p(§ 3.5)
p étant laprobabilité
d’oubli desrecenseurs
El
etE2.
Donc on a intérêt à ce que les deuxenquêteurs El
etE2
aient la mêmeprobabilité
p afin depouvoir
se servir du modèleM3
pourconstruire le test
portant
sur la valeur de ceparamètre
p.4.2. - Test de
l’hypothèse Ho :
Pl 1= P2 co ntre
H1
:p1 ~
P2 .La loi de
probabilité
deNI
sachant queNI
+N2 -
1 estbinomiale ;
deparamètres
Si
l’hypothèse
nulle est vraie Pl = P2q 1
et sil’hypothèse
alternative est vraie.
q ~ 1 2 :
0q
1.D’ailleurs on voit facilement que q >
1/2 signifie
P2 > pl , et q1/2
l’inverse.
D’où la
région critique
w du test est définie par :L0 L1
c à l’intérieur de larégion critique,
c’est-à-dire :77
où k
désigne NI
ouN2 (notations
de 2.2. et2.3).
Donc on ne
rejette
pasl’hypothèse
nulle si c2 > k > CI et on larejette
dans le cas contraire.
Donc on obtient un test bilatéral
symétrique.
Remarque -
Sil’hypothèse
nulleHo :
Pi = P2 n’est pasrejetée
onadopte
le modèle
M3 du § 3. 4, c’est-à-dire,
la loi deNi + N2/N1 + N2 + N3 = l
avec pl = P2 =
p et
onprocède
à la construction d’un testportant
sur la valeur de p. Mais dans le cas oùl’hypothèse
nulleHo
estrejetée,
il fautadopter
le modèle
M2 du § 3.1,
en considérant la loi de(N1, N2, N3/N1 + N2 + N3 = l)
avec
Pl =1=
P2 ; et l’on construit alors un testportant
sur les valeurs du para- mètre pi ensupposant
que p2 est connu.Dans ce
qui suit,
on suppose queHo
n’est pasrejetée
et l’onprocède
àla construction d’un test
classique
et un testséquentiel portant
sur la valeur de p.(Modèle M2 du § 3.4).
Dans le second cas, deux tests
analogues peuvent
être construits facilement utilisant le modèleM2 de §
3.1.4.3. - Test
classique
del’hypothèse
nulleHo p Po
contrel’hypothèse
alternativeHl : p Pl
En
adoptant
le modèleM’ 3 du § 3.4.,
on a :NI
+N2
est la somme des nombres deslogements
oubliés parEl
et recensés parE2
et ceux, oubliés parE2
et retrouvés parEl
On a :
L0
c dans larégion critique
w.Li
Ce
qui
donne dans le cas oùPo Pl,
unerégion critique
définie par k > constante C.Revue de Statistique Appliquée, 1974 - vol. XX II N° 1
4.4. -
Application numérique
et calcul de lapuissance
du test.On admet en
général
dans les recensements uneproportion
d’unités oubliéesallant de 2 à 6 %. On va donner dans
ce §
une liste des tests del’hypothèse p Po
contrel’hypothèse
alternativep P1,
oùPo = 0,02
etPl prenant
successivement les valeurs
0,03 ; 0,04 ; 0,05 ; 0,06 ; 0,07 ;
et0,08. (Table n° 1)
On vaindiquer
dans cette table la taille 1 del’échantillon,
larégion critique,
l’erreur a de
première espèce
et lapuissance
du test.Table
N°
1 Puissances des tests, 1 -j3
4.5. - Test
séquentiel
del’hypothèse
nulleHo p Po
contreHl : p > Pl
avecPo Pl
On considère ici aussi la variable aléatoire
qui
suit une loi binomiale.Si
Ho
est vraie :a une loi binomiale
et si
Hl
estvraie,
elle a une loi binomiale deparamètres
En
prenant
pour erreur a etj3 (de première
et deuxièmeespèce
respec-tivement)
on obtient :79
Figure 1 - Graphiques des droites
Dl
etD2
définissant les trois régions du tests.Figure 2 -- Graphique de
l’O.C.L(p)
du test. Figure 3 -Revue de Statistique Appl iquée, 1974 - vol. XX Il N° 1
L’enquêteur E2
continue à recenser tant que k varie entre les deux limitesindiquées
dansl’inégalité
double :Di
1 kD2 ;
etlorsqu’on
a kDi
1 ouk
D2,
on arrêtel’échantillonnage
pour ne pasrejeter
ou pourrejeter l’hypo-
thèse nulle
(respectivement).
4.6. -
Application numérique.
Donnons aux
paramètres du § 4.5,
les valeursnumériques
suivantes :Po = 0,02 ; Pl = 0,05 ;
a =0,05
et03B2 = 0,05.
D’où
ro =
0,0392
et r1 =0,0952 Dl
etD2
ont pouréquations respectives.
Voir
figure 1,
2 et 3 où l’on donnerespectivement
lesgraphes
deDi
1 etD2 , l’O.C
du test et la courbe du nombre moyen d’observations necessaires pour le test.5. CONCLUSION
On
peut
retenir le modèleM’3
pour contrôler laqualité
du recensement, à condition que les deuxenquêteurs El
etE2
fournissent un travail de mêmequalité.
Cette conditionpeut
être satisfaite en choisissantEl
etE2
au hasarddans un groupe
homogène d’enquêteurs.
Onpeut chaque
fois tester si pi estégale
à p2 en faisant le testdu §
4.2.Un test
séquentiel
nouspermet
alors de décideraprès chaque
observation faite par le secondenquêteur (ou
un grouped’observations).
Le test fournit une réduction dans le nombre d’observations nécessaires par
rapport
au testclassique (a et (3
étant les mêmes pour lesdeux tests).
81
Cette réduction est de l’ordre de 15
%
au moins. C’est-à-dire que, dans lecas où r =
0,063
= s et a =0,05
etj3
=0,05,
on a besoin de 200 observa- tions pour le testclassique
et de 170 observations environ pour le testsequentiel.
(voir
Tableaun°
1 etfigure n° 3).
Cependant,
si le testdu §
4.2 nous conduit àrejeter l’hypothèse
nullePl - ?2’ alors on devra utiliser le modèle
M2
pour faire le testportant
surles valeurs de Pl’ en
supposant
p2 connu. On pourra construire d’une manièreanalogue
un testclassique
et un autreséquentiel
pour contrôler laqualité
durecensement.
BIBLIOGRAPHIE
[1 ] DIRECTION
CENTRALE DE LASTATISTIQUE
AU LIBAN -Enquête
par
sondage
sur lapopulation
active 1970 volume I.[2] FELLER,
W. - An introduction toprobability
and itsapplications. Wiley.
[3] KENDALL,
M.STUART,
A. - The advancedtheory
ofstatistics,
LondonGriffin.
[4] KOHN,
A. - A cost effectiveness model for airpollution
control with asingle
stochastic variable. Journal of the American Statistical Asso-ciation,
March 1972.[5] MINTON,
G. - Vérification error insingle sampling inspection plans
forprocessing
survey data. Journal of the American Statistical Associa-tion,
March 1972.[6] WALD,
A. -Sequential analysis.
JohnWiley
and Sons inc.Eighth Printing,
October 1966.
[7] U.S.
BUREAU OF THE CENSUS - United States Census ofPopulation
andHousing 1960 ; quality
ofpreparatory operations, microfilming
andcoding, Washington,
D.C. : U.S. GovernmentPrinting
Office.ANNEXES
Al
Calcul deI(M2)
du3.1/2 :
Revue de Statistique Appliquée, 1974 - vol. XXII N° 1
A2
Calcul deI(M3).
du3.1/3 :
83
A3
. Calcul del’(M1)
du3.4/1 :
D’où
A4.
Calcul del’(M2)
du3.4/2 :
D’où :
Revue de Statistique Appliquée, 1974 - vol. XX 11 N° 1
As.
Calcul del’(M3)
du4.4/3 :
A6.
Calcul deI(P)
du 3.8, : On a :85 D’où
A7
Démonstration de laproposition
3.10.Considérons la loi de
probabilité du §
3.8. Onpeut montrer,
commeon l’a fait
au § 2.3.,
que la loi conditionnelle deest
multinomiale,
avec lesparamètres
répétés (m k) fois
On a :
D’où :
Revue de Statistique Appliquée, 1974 - vol. XXII N° 1