R EVUE DE STATISTIQUE APPLIQUÉE
J. U LMO
F. B ASTENAIRE
Analyse d’un plan factoriel d’expérimentation dont les résultats sont qualitatifs
Revue de statistique appliquée, tome 5, n
o2 (1957), p. 13-18
<
http://www.numdam.org/item?id=RSA_1957__5_2_13_0>
© Société française de statistique, 1957, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
ANALYSE
D’UN PLAN FACTORIEL D’EXPÉRIMENTATION
DONT LES RÉSULTATS SONT QUALITATIFS
par
J. ULMO
et F. BASTENAIRE.
Statisticiens à l’institut de Recherches de la
Sidérurgie
Il arrive que dans un premier
dépouillement rapide
des résultats d’uneexpérience planifiée
defaçon factorielle,pour
examinerl’influence
d’unfacteur
contralé, on soit conduit àprocéder
de lafaçon
suivantea) Classer les résultats en deux
catégories
1 ou Il;b) Calculer les
proportions
de résultats de l’une descatégories
I parexemple,
observés pour chacun des niveaux Al, Az, ...., Ar dufacteur
contrdlé;c)
Comparer
cesproportions obseruées
Xl, X2, ...., Xr.La
comparaison
de cesproportions
observées ne paraît pas àpriori
releverdes méthodes
classiques
decomparaison
deproportions
car chacune d’elles estcalculée sur un ensemble N de résultats
qui
neproviennent
pas d’une seulepopulation
mais de kpopulations,
àpriori différentes puisqu’elles correspondent
chacune à des combinaisons
différentes
des autresfacteurs
contrôlés B, C, D.. à raison de Vi résultats par combinaison.Ce que l’on sait
toutefois,
c’estqu’aux différents
niveaux A,,, A, dufacteur
A correspondent les mêmes combinaisons des autres facteurs contrdlés et les mêmes nombres y, (i = 1, 2, ...., k) de résultats par combinaison.L’hypothèse
que l’on désire tester est donc que lesprobabilités
pl, P2t...., pk des résultats de lacatégorie
1correspondant
aux k combinaisons des autresfacteurs
contrdlés nedépendent
pas du niveau dufacteur
A.L’étude qui suit montre que les méthodes
classiques
decomparaison
deproportions
tout en n’étant pas lesplus efficaces,
c’est-à-dire encorrespondant
àun
risque
depremière espèce inférieur
à celui pourlesquelles
elles sont établies,sont
toutefois
valables.1
ÉTUDE
DE LA DISTRIBUTION DE XSoit ni i-1,2, ... k le nombre de résultats de la
catégorie
considéréeI,
obtenus partirage
de V; résultats dans lune U) decomposition
pi , q; = 1 - pini a une distribution binomiale de moyenne vi pi , variance vi pi q-, ·
La
proportion
des résultats de lacatégorie
1 obtenus en faisant vitirages
dans chacune des k urnes est : k
M ni S k
x - i 1 N - = - N
N N où S =2-t
i=1 n’ 1 est le nombre totalk
des résultats de la
catégorie
1 etN - ~
1=1 vi le nombre total destirages.
On a
et
et, par suite , E
(x)
=S v. p.
P.. enposant
p. =~B~:p,
et, par suite, E
(X) =2013’20132013201320132013-L=
p. enposant
p. -2013~2013201320132013
p. est la
proportion
moyenne de lacatégorie
1 dans l’ensemble constitué par la réunion de v, urnesU1 ,
v2 urnesU 2 ,....
vk urnesUk
Si
p. , =
2013L-~2013-L ~ ~
est laproportion
moyenne de lacatégorie
I dans l’ensemble des kurnes. 2 -
et
ni étant
déjà
la somme de vi valeursindépendantes
d’une variabie aléatoire Xiprenant
la valeur 1 si on tire un résultat de lacatégorie
I et la valeur 0 si ontire un résultat de la
catégorie
II, S est la somme de N telles valeurs et X leur valeur moyenne. Par suite,si
N n’est pas trop faible et si l’ensemble des pi n’est pastrop
voisin de 0 ou 1 : les distributions de S et de X sont très sensi- blement normales.Il --CALCUL D’UNE LIMITE
SUPÉRIEURE
DEL’ÉCART-TYPE
DE XQUI
NEDÉPENDE QUE
DE PSi l’on connaissait
7~ ,
leproblème
de lacomparaison
de r valeurs obser- véesX,
1Xz , ...,
Xr serait trèssimple puisqu’il
se ramènerait au test del’hypothèse
d’une même moyenne pour r variables normalesindépendantes, d’écarts-types
connus, testqui
consiste àregarder
sine diffère pas
significativement
deX2
avec r-1degrés
de liberté.(Dans
le casoù r = 2, il revient au même de
regarder
si2013~ A
ne diffère passignificati-
vement d’une variable normale
réduite). t/o’~+c~
vement d’ une variable normale
réduite) . X1 X2.
Mais étant donné
l’expression
de0~ ,
la connaissance de la seule valeur Xne nous
permet
pas d’estimerO»x .
. Il faudraitpouvoir
estimer les p; ce que,précisément,
nous ne voulons pas faire et nepourrions
du reste pas faire defaçon
valable si les9,
sontpetits
comme c’estgénéralement
le cas(par exemple
Vi =
1) .
Nous avons alors cherché à trouver une limite
supérieure O"XL de CTX
dontla valeur
puisse
êtreestimée,donc,ne dépendant
que de p. que l’onpeut
estimer par X~E (X)
=p,~
. On verra dansIII/a
que laprécision
de cette estimationestau moins
égale
à celle duparamètre
d’une distribution binomiale àpartir
de lafréquence
relative obtenue sur Ntirages.
On voit, en
effet,
que sil’hypothèse
nulle estrejetée
avec o’~ ’ elle lesera a fortiori avec
eT X .
Par contre,l’hypothèse
nullepeut
êtreacceptée
aveca XL
sans l’être avec(Ty..
En d’aatres termes, enremplaçant QX
pary~ ,
’on obtient un test dont le
risque
depremière espèce
est inférieur aurisque
"nominal" pour
lequel
il a été établi.Une
première
limitesupérieure
de O*2 vient
X immédiatement àl’esprit. C’ est
celle que l’on obtient en
majorant pi qi =
pi(1 - Pi )
par1/4
soit1/4
N.Mais on
peut
aussi tenircompte
du fait que l’on connaît la valeur de p.=20132013201320132013~-
et chercher la limitesupérieure
des valeursde a"2correspon-
p N
z~
~,p
X pdant à une
valeur
donnée p.de 201320132013201320132013~ .
. xOn
peut
écrire :A. ’8 ... -.i
On voit donc que chercher le maximum de
cr revient
achercherle minimul deE
vip? compte
tenu du fait queE ’Ji Pi
=Np.=Cte.
La méthode des
multiplicateurs
deLagrange qui
consiste à déterminer le valeurs desPi
et de À rendant minimum02
=S
vip? X E
Vi(Pi
-p
donne -b02
2 vi piX~ , p
soit Pi
2 et,
par suiteP
1=
P2
,..., =Pk
= P.On a donc :
On remarquera que
~’XL
n’est autre que la variance de lafréquence
relativequand
on fait Ntirages
dans une urne à 2catégories
decomposition
p. q. tandis que E(X) =
p. est la valeur moyenne de cette mêmefréquence
relative.X a donc même moyenne et est moins
dispersée que
la valeur que l’ onobtiendrait en tirant au hasard dans une urne
unique
decomposition
p. q.III .
PROBLÈMES
DEJUGEMENT
SURÉCHANTILLONS RELATIFS
A XA)
DETERMINATION D’UN INTERVALLE DE CONFIANCE A UN RISQUERDONNÉ
POUR p..L’intervalle cherché sera certainement inférieur à l’intervalle obtenu en
remplaçant Ov
parcrv
’c’est-à-dire, / X (1-X)
en estimantc’y
" parB/
VX (1 - X~
Nà l’intervalle X ±
tX/2 N où tOC/2 désigne
la limite de l’intervalledeprobabilité
au mêmerisque
oc pour une variable normale réduite.B)
COMPARAISON DE DEUX PROPORTIONS OBSERVEESX1
ETX2
L’hypothèse
à tester est, comme on l’a vu audébut,
celle de l’identité desprobabilités p;
etp;2 (i
=1,2,.... , k).des
urnesU,
etUi. correspondant
res-pectivement
aux deuxproportions
observées.Dans ces conditions, on a, non seulement E
(X1) =
E(X2)
mais aussi.
CTX1
=o’x2
=Qx
et, par suiteX~ X2
doit être distribué comme unevariable normale réduite.
,
C7x- 2
_______
B / 3~ (1 - X)
En y
remplaçant 3~
par0~,
que l’on estimera parsXL
=N
avec-t-
~
L y iBX =
X~ + X2
meilleure estimation de p.; on obtient un testqui correspond
à unrisque
depremière espèce
auplus égal
aurisque
nominal pourlequel
il a étécalculé.
On remarquera que ce test n’est autre que le test
classique
decomparaison
de deux
proportions
que l’onpeut
encore écrire sous la forme :doit être distribué comme
X2
avec 1degré
deliberté.
Ceci n’a rien d’étonnant
puisque
X est l’estimation duX2
minimum de p.avec
Ceci montre que si la
quantité (2)
est distribuée commex2
avec 2degrés
deliberté,
celle que l’on obtient enremplaçant
p. parX ,
soit(1),
est distribuéecomme
X2
avec 1degré
deliberté.
C)
COMPARAISON DE r PROPORTIONS OBSERVEESXI X2
... 1Xr L’hypothèse
à tester est celle de l’identité desprobabilités p; , p~2 ,
, ....Pi..
(i = 1,2 ,
... ,k)
des urnesU, , Ui2
...Uir correspondant respectivement
aux r
proportions observées.
~On a donc encore, non seulement E
(X1 )
= E(X2 ),....
= E(Xr )
maisaussi
a:.X=a’.. i X? = cr X= (7 X
et, par suitesa
doit être distribué comme
k2
avecr-1 degrés
de liberté.E l 2 2
11.
3((l-X)
b .En
remplaçant
P ç7 X
X par P (T2 XL
que q l’on estimerapar N
P N3~) .
on obtient untest
qui correspond à
unrisque
depremière espèce
auplus égal
aurisque
nominalpour
lequel
il a été calculé etqui
n’est autre quele
testclassique
decomparaison
de r
proportions
comme on le voitquand
on l’écrit sous la forme :doit être distribué comme
X2
avec r-1degrés
deliberté.
des résultats de la
catégorie
I.Le fait que l’on retombe sur le test
classique
résulte de ce que X est l’esti- mation du7~
minimum de p. avec~ ~ ~ ~ 9
ce
qui justifie
l’obtention d’unequantité
distribuée commeX 2 avec
r-1degrés
de liberté en
remplaçant
p. parX
EXEMPLE :
Etude de l’influence d’un certain nombre de facteurs sur l’adhérence de la calamine de feuillards d’acier.
L’adhérence de la calamine a été notée de 0 à 5
d’après
l’observation de coupes :0
désignant
une calamine peuadhérente,
et5 une calamine très
adhérente.
Les différents facteurs à étudier ont été combinés
factoriellement,
et iln~y
a pas eu de
répétition.
Ce sont :
(
Tla
qualité
del’acier,
3 niveaux :(
0( M
la
température
delaminage, 2
niveaux(Z ( 1
laplus
élevée(
tête Tla
position
duprélèvement
sur les couronnes( milieu
Mde
feuillards,
3 niveaux :( pied
P(
1l’usine
ayant procédé
aulaminage final, ( II
3 usines :
(
IIIIl n’a en
effet,
été utiliséqu’une
seule coulée dechaque qualité d’acier,
les trois couléesayant
été élaborées et laminées à la suite en demiproduits(brames)
par une même usine afin d’assurer la
plus grande homogénéité possible
aumatériel de base.
Afin d’obtenir un classement des résultats en deux
catégories
seulement,ceux-ci ont été
regroupés
de lafaçon
suivante :Nous avons noté + les résultats de note 4 ou 5 . et - les résultats de note 0, 1, 2 ou 3
de
façon
à avoir desproportions marginales
de +qui
ne soient pastrop
voisines de 0 ou 1 pour quel’approximation
normalepuisse
êtreacceptable malgré
lepetit
nombre des essais.Les
résultats
obtenus pour les 54 combinaisons factorielles sont les suivants :Qualité
de l’acierProportions
de + :Usine 1
14
18 Position duprélèvement :
T12
18Usine II 14
M 10
USine U
18
M18
Usine III sine
5
18P 11
18Les résultats des
comparaisons
desproportions marginales
obtenues pour les différents niveaux de chacundes
facteurs sont rassemblés dans le tableau suivant :....
CONCLUSIONS
1) L’usine,
c’est-à-dire son train de laminoirs a Une influenceprépondérante.
(Les
usines I et II dont les trains sont peudifférents,
ne donnent pas des résultatssignificativement différents,
tandis que l’usine III donne une calamine nettementplus adhérente).
2)
Latempérature
delaminage
aégalement
une influencesignificative,
l’adhérence diminuant
quand
celle-ciaugmente.
(1)
S =significatif
au risque 5 %THS = significatif au risque de 0,1
%
nS = non