R EVUE DE STATISTIQUE APPLIQUÉE
G. G RANCHER
Interprétation statistique des résultats d’une chaîne interlaboratoires d’analyses des composants chimiques du lait
Revue de statistique appliquée, tome 37, n
o1 (1989), p. 27-41
<http://www.numdam.org/item?id=RSA_1989__37_1_27_0>
© Société française de statistique, 1989, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
INTERPRÉTATION STATISTIQUE DES RÉSULTATS
D’UNE CHAÎNE INTERLABORATOIRES D’ANALYSES
DES COMPOSANTS CHIMIQUES DU LAIT
G. GRANCHER
Laboratoire de Calcul des Probabilités et
Statistique
Unité associée au CNRS 759 Université de ROUEN B.P. 118 76134
Mont-Saint-Aignan
cedexRÉSUMÉ
Nous proposons une visualisation des résultats d’une chaîne interlaboratoires
d’analyses.
Chaque
laboratoire estreprésenté
par undisque
dudemi-plan;
le centre dedisque
a pour abscisse la contribution de ce laboratoire à "l’effet laboratoire" et pour ordonnée sa contribution à"l’interaction", le rayon de ce
disque
estproportionnel
àl’écart-type
derépétabilité
du laboratoire.Nous reprenons là les idées de J. FLESSELLES [3]; sous des
hypothèses
raisonnables nousdéterminons une
région
dudemi-plan
oùchaque
laboratoire devrait, avec une forteprobabilité,
être
représenté
en cas d’absence d’effet laboratoires et en cas d’absence d’interaction. Une tellereprésentation graphique
facilitel’interprétation statistique
des résultats, mais elle permet surtout de situerrapidement
chacun des laboratoires par rapport aux autres.Mots-clés : Expériences collectives, comparaison entre laboratoires,
analyse
de la variance, reproductibilité, ajustement,diagramme
cible.1.
Origine
des données et notationsLe Laboratoire
Interprofessionnel
de Haute-Normandie(Labilait)
réalise n laitsde
compositions
différentes. Ilrépartit
ces laits en différents échantillons. Il estenvoyé
à une
vingtaine
de laboratoires un échantillon dechaque
lait. Ces laboratoiresrépartis
dans toute la France sont, soit des laboratoires
interprofessionnels,
soit des laboratoires d’usines de l’industrie laitière. Chacun d’entre euxanalysera
chacun des échantillons reçus etrépétera
chacune desanalyses
k fois. Nouspréciserons
ultérieurement comment s’assurer del’homogénéité
des échantillons.Nous noterons p le nombre de
laboratoires,
q le nombre de
laits,
n le nombre de
répétitions.
(Pour
notre cas, q vaut 4 et n vaut5).
Pour i variant de 1 à p
(i
indice delaboratoire), pour j
variant de 1 à q(j
indice de lait(ou
deniveau)),
pour k variant de 1 à n(k
indice derépétition),
Ce thème a fait
l’objet
d’une communication auxjournées
de l’ASU (Association des Statisticiens Universitaires) àMontpellier
en mai 1984.nous noterons
xijk
le résultat de la k-ièmerépétition
del’analyse
duj-ième
lait par le i-ième laboratoire.Nous nous
plaçons
sous le modèle suivant :où M est une constante,
les
Ai
sont des constantes telles queles
Bj
sont des constantes telles queles
Qj
sont des constantes telles que, pour touti,
et, pour
tout j,
les ~ijk sont des variables aléatoires centrées
indépendantes qui
modélisent l’erreur de mesure.Dans le cas où les
Ai
sont nuls, nous dironsqu’il
y a absenced’effet systématique
interlaboratoires.
Dans le cas où tous les
Cij
sontnuls,
nous dironsqu’il
a absence d’interaction..
Dans le cas où à la fois tous les
Ai
et tous lesC;j
sont nuls nous dironsqu’il
y aabsence
d’effet
total interlaboratoires.Dans toute la
suite,
nous noterons :-
xij.
la moyenne des résultats annoncés par le laboratoire i pour le laitj,
- xi.. la moyenne des résultats annoncés par le laboratoire
i,
-
x.j.
la moyenne des résultats annoncés pour le laitj,
- x... la moyenne de tous les résultats.
Nous avons donc les formules suivantes :
.
Nous noterons
s2ij
l’estimation sans biais de la variance des résultats du laboratoire i pour le laitj.
Nous supposerons que les lois des
fijk
nedépendent
que dei ;
et nous noteronssi 2
l’estimation sans biais de la variance de cette loi. si est
appelé l’écart-type
derépétabilité.
Nous avons donc :
Il est
classique
d’estimer M ,Ai, Bj
etCij
par la méthode des moindrescarrés,
c’est-à-dire que nous choisissons les estimations
M , Ai , B¡ , 6;j qui
minimisent£2
défini par :
Un
simple
calcul montre que nous obtenons :Ai
seraappelé
ledécalage (ou
le défautd’ajustement)
du laboratoirei, Ai
seranul si et seulement si la moyenne des résultats
(tous
laitsconfondus)
du laboratoire i estégale
à la moyenne de tous les résultats de tous les laboratoires.Dans la suite on notera
Q
la moyennequadratique
desê¡j.
Ci
sera nul si et seulement si il existe une constantequi
nedépend
que de i(et qui
est en fait¡)
telle que pourchaque
laitj, le
laboratoire i annonce comme résultat moyen la valeur moyenne donnée par l’ensemble des laboratoires pour ce laitaugmentée
de cette constante, c’est-à-dire
si,
pour toutj,
on a :Ci
sera d’autantplus grand,
que l’écart entre les moyennes des résultats annoncés pour un laitdonné,
par le laboratoire i et les moyennes desrésultats,
tous laboratoires confondus pour ce mêmelait,
variera d’un lait à l’autre.Ci
seraappelé
l’incohérence(ou
défaut decohérence)
du laboratoire i.Nous noterons
Êi, appelé
écart du laboratoirei,
laquantité
définie par :Et
est nul si et seulement si¡
etCi
sont tous deux nuls.Il est aisé de vérifier que :
Nous pouvons
représenter
les résultats de la manière suivante :chaque
laboratoire i estfiguré
par undisque
dudemi-plan
- dont le centre a pour abscisse
Âi,
ledécalage
du laboratoirei,
et pour ordonnéeêi,
l’incohérence du laboratoirei,
- dont le rayon est
proportionnel
à sonécart-type
derépétabilité.
C’est
uniquement
pour des raisons de lisibilité dugraphique
que nous n’avons pas choisi un rayon delongueur égale
à larépétabilité
car alors lesdisques
seraient tropgrands.
Ainsi avec les données du tableau 1
(les
résultats des calculs desdécalages, incohérences,
écarts etrépétabilités figurant
dans le tableau 1bis)
on obtient legraphique
1 où il
apparaît
clairement que :a)
le laboratoire 1présente
uneplus
mauvaiserépétabilité
que les autres labora-toires,
b)
les laboratoires 4 et 5présentent
une incohérence nettementsupérieure
auxautres
laboratoires,
c)
les laboratoires3, 4
et surtout 5présentent
undécalage
nettementplus important
que les autres laboratoires.
Quant
au laboratoire 2 sarépétabilité
n’est pas estimablepuisque
pour chacun des laits il annonce 5 résultatsidentiques.
2.
Détection
des laboratoires aberrantsAfin de déterminer les laboratoires
présentant
des résultatsaberrants,
nous devonspréciser
les loisstatistiques
des indicateurs définis ci-dessus. Pour cela il faut quenous
restreignions
leshypothèses mathématiques
de notre modèle. Nouspréciserons
lesconditions
expérimentales qui
rendent ceshypothèses
fortement crédibles.Hypothèse
Les variables
Cijk
sont toutes des variables aléatoires normalesindépendantes
demême variance
(inconnue)
notéeo- 2
Dans le cas
d’analyses chimiques
du lait(matières
grasses, matièreprotéique,
matière
sèche),
il est bien connu, et aisé de vérifier que l’erreur de mesure peut être assimilée à une variable aléatoire normale. Toutefois il faudra veiller à ce que leserreurs d’arrondis
(dues
aux calculs ou àl’imprécision
de la lecture desrésultats)
soientN
GRAPHIQUE 1
Représentation
graphique des résultats du tableau 1 bis.négligeables
par rapport à03C32,
car sinon il seraitimpossible
d’estimer larépétabilité
des résultats des laboratoires
qui
pour chacun des laits annonceront souvent n résultatsidentiques
comme cela fut le cas pour le laboratoire 2 de notreexemple.
Ainsi pour la matière grasse nous avons insistéauprès
de chacun des laboratoires pour quechaque
résultat soit
exprimé
au dizième de grammeprès.
Pour s’assurer de
l’indépendance
des variables aléatoires03B5ijk
il faudraparti-
culièrement veiller à ce que les différentes
répétitions d’analyses
soient effectuées desorte que chacune d’elles n’ait aucune influence sur les autres. Cela est sans doute
plus
difficilequ’il
yparaît
deprime abord;
eneffet,
comment unopérateur
lisantconsécutivement n niveaux de matière grasse dans n
butyromètres remplis
initialement par un mêmelait, peut-il
ne pas être tenté d’annoncer n résultatsidentiques?
Pour lamatière
sèche,
une solution à cetype
deproblème
peut êtreapportée
en n’effectuant les calculsqui produiront
les résultatsqu’après
avoir réalisé toutes lespesées.
Le fait que
l’écart-type
des mesures nedépende
pas du niveau(de
la valeur dulait)
ne semble paspouvoir
être remise en cause pour desanalyses chimiques
du lait. Cene serait pas le cas pour des
analyses bactériologiques,
mais alors comme il estprécisé
en
[6],
en faisant subir aux résultats une transformationadéquate,
onpourrait
se situerégalement
dans le cadre d’homocédasticité(égalité
desvariances).
On pourra s’assurer que les variances des erreurs de mesure sonthomogènes
d’unlaboratoire
à l’autre en mettant en 0153uvre le test deBartlett, qui
permet de comparer less?.
On notera
s2
l’estimation deu2.
Sous
l’hypothèse
citéeci-dessus,
on sait que3
suitapproximativement
la loi duX2
à(p-1 ) degrés
deliberté,
où03B2
est définie parl’égalité
ci-dessus.On
rejettera donc,
au seuil a,l’hypothèse
d’homocédasticité dès quefi
serasupérieur
à~2p-1, 03B1
fractilesupérieur
d’ordre a de la loi duX2
àp-1 degrés
de liberté.Et dans ce cas, nous éliminerons
le(s) laboratoire(s) responsable(s)
del’hétérogénéité
des variances.
Dans
l’exemple
citéprécédemment,
il estimpossible d’appliquer
le test de Bartlettà l’ensemble des 15
laboratoires,
le laboratoire 2ayant
fourni pour chacun des 4 laits 5 résultatsidentiques;
cela est sans doute dû à des résultatsexprimés
de manièretrop imprécise,
audemi-gramme près.
Le testappliqué
aux quatorze autres laboratoires conduit aurejet
del’hypothèse d’homogénéité
desvariances;
eneffet /?, qui
vaut38.06,
est nettement
supérieur
à~213,0.05, qui
vaut22.36,
le seuil designification
de6
est ici del’ordre de 3%. Par contre si on
applique
le test de Bartlett aux laboratoires numérotés de 3 à15,
on est conduit àaccepter l’hypothèse, puisque 03B2 qui
vaut 9.99 est alorsnettement inférieur à
XI2,O.05 qui
vaut 21.03.Il y a lieu de
rappeler
ici lesprincipes
de test d’absence de l’un ou l’autre oumême des deux effets considérés. Le lecteur trouvera une
justification mathématique
des formules ci-dessous en
[5]
parexemple.
2.1. Test d’absence
d’effet
total interlaboratoiresPour tester l’absence d’effet total
interlaboratoires,
on utilise le fait que si tous lesAt
et tous les(-j
sont nuls alorsÊ2
suit la loi de Fisher decouple
dedegrés
de liberté[q(p-1), (n-1)pq]
oùÊ2
est définie par :Ainsi au seuil a, on
rejette l’hypothèse
d’absence d’effet total interlaboratoires dès queÊ2
seraplus grand
que le fractilesupérieur
d’ordre a de la loi de Fishercorrespondante.
Ainsi dans notre
exemple après
élimination des laboratoires 1 et2, Ê2
vaut56.89,
on
rejetterait
donc cettehypothèse
avec un seuil designification
inférieur à10-95.
2.2. Test d’absence d’interaction
Pour tester l’absence
d’interaction,
on utilise le fait que si tous lesCij
sontnuls,
alors
ê2
suit la loi de Fisher decouple
dedegrés
de liberté[(p-1)(q-1), (n-l)pq]
oùê2
est définie par :Ainsi,
au seuil a, onrejette l’hypothèse
d’absence d’interaction dèsque 2
seraplus grand
que le fractilesupérieur
d’ordre a de la loi de Fishercorrespondante.
Ainsi avec les données
précédentes, 2
vaut40.18,
onrejetterait
doncl’hypothèse
avec un seuil de
signification
inférieur à10-74.
2.3. Test d’absence
d’effet systématique
interlaboratoiresPour tester l’absence d’effet
systématique interlaboratoires,
on utilise le fait que, si tous lesAi
sont nuls alorsÂ2
suit la loi de Fisher decouple
dedegrés
de liberté[(p-1), (n-1)pq]
oùÂ2
est définie par :Remarquons
que si l’on a admis l’absenced’interaction,
ce test revient à testerl’absence d’effet total interlaboratoires.
Ainsi,
avec les donnéesprécédentes Â2
vaut 12.40(quand
on ne retient que les laboratoires 3 et 6 à15,
iln’y
a alorsplus
d’interactionsignificative),
onrejetterait
donccette
hypothèse
avec un seuil designification
inférieur à10-15.
Ces tests ne fournissent d’informations que
globalement
sur l’ensemble deslaboratoires,
enparticulier
dans le cas où l’un des tests ci-dessus conduit aurejet
del’hypothèse testée,
nous ne connaissons pasle(s) laboratoire(s) responsable(s)
de cerejet.
Latechnique
que nous allonsdévelopper
maintenant vise à permettre un traitement laboratoire par laboratoire.2.4. Calcul de la cible
Sous
l’hypothèse
d’absence d’effet totalinterlaboratoires,
on peut montrer que, pour touti,
la variable aléatoirenpq Ê2i (p-1) q s2
suit la loi de Fisher decouple
dedegrés
de liberté
(q, (n-l)pq).
Sous
l’hypothèse
d’absenced’interaction,
onpeut
montrer que, pour touti,
la variable aléatoirenpq 2i (p-1)(q-1) s2
suit la loi de Fisher decouple
dedegrés
de liberté(q-1, (n-l)pq).
Enfin,
sousl’hypothèse
d’absence d’effetsystématique
interlaboratoires onpeut
montrer que, pour tout
i,
la variablealéatoire npq Â2i
suit la loi de Fisher decouple
p -1 s
de
degrés
de liberté(1, (n-1 ) pq).
Soit un seuil a
(a
E[0, 1],
a estproche
de0),
nous noteronsrespectivement Va,
V’03B1
etV"03B1
lesa-quantiles supérieurs
de la loi de Fisher decouples
dedegrés
de libertérespectifs [q, (n-1)pq], [q-1, (n-l)pq]
et[1, (n-l)pq].
On
appellera
cible(de risque a)
l’ensemble despoints
dudemi-plan supérieur,
d’abscisse x et d’ordonnée y tels que :
Alors sous
l’hypothèse
d’absence d’effetsystématique
interlaboratoires et d’absenced’interaction,
il y a une forteprobabilité (légèrement
inférieure à1-a)
pour que le laboratoire i soitreprésenté
dans la cible derisque
a. Ce laboratoire en sera d’autantplus éloigné qu’il
contribuera à ce que ceshypothèses
ne soient pas réalisées.La cible a
toujours
la forme d’unrectangle
"écorné" aux deux coinssupérieurs.
Cela résulte des
inégalités
suivantes :Enfin il faut remarquer que les dimensions de cette zone augmentent
quand
a diminue et sontproportionnelles
à s, l’estimation del’écart-type
de l’erreur de mesuresupposé
commun à tous les laboratoires.Reprenons
les données du tableau 1.Après
avoir éliminé les laboratoires 1 et 2qui
ne satisfont pasl’hypothèse
d’homocédasticité(tableau 2),
nous pouvons visualiser(graphique 2)
les laboratoiresqui
ne satisfont pas auxhypothèses
énoncéesci-dessus;
pour cela nous avons
représenté
les deux cibles pour lesrisques
5% et 1%. Leslaboratoires
3,
4 et 5 sedistinguent
fortement des autres;quoique
minoritaires ilsprovoquent
une modification suffisammentimportante
de la moyenne de résultats pourqu’aucun
laboratoiren’atteigne
la cible. Ces 3 laboratoires étant éliminés(Tableau
3 etgraphique 3)
on constate que tous sontreprésentés
à l’intérieur de lacible,
cequi
esttout-à-fait cohérent avec le fait
qu’aucun
des 3 testsd’analyse
de la variance énoncésplus
haut ne conduit auxrejets
deshypothèses.
Il nous semble
qu’une
tellereprésentation complète agréablement
les méthodesclassiques
d’essais interlaboratoiresproposées
en[1].
GRAPHIQUE 2
Représentation graphique
des résultats du tableau 2. Les laboratoires 3, 4 et 5 sedistinguent
parun fort
décalage
positif. De plus, les laboratoires 4 et 5 sont fortement incohérents. Aucun des 13 laboratoires n’atteint les cibles à 5% et à 1%.GRAPHIQUE
3Représentation graphique
des résultats du tableau 3. Tous les laboratoiresatteignent
la cible à5% (et a
fortiori
la cible à 1 %).3.
Quelques
remarquesNotre méthode se
distingue
de celleprésentée
par Flesselles[3]
sur les deuxpoints
suivants :
a)
nosgraphiques
visualisent larépétabilité
de chacun deslaboratoires, b)
le calcul de la cible est baséuniquement
sur l’estimation del’écart-type
derépétabilité supposé
commun à tous les laboratoires.La
procédure explicitée
ci-dessus doit être utilisée avec une certaineprudence.
Ilfaudra
particulièrement
veiller à ce que les laboratoires soient suffisamment nombreux pour que la moyenne des résultats(qui
va servir de référence pour tester lesdécalages)
soit
fiable;
une douzaine de laboratoires est un minimum pour mettre en oeuvre ces tests.Et même dans ce cas, un laboratoire fortement décalé aura une influence non
négligeable
sur cette moyenne : il "attirera" vers lui la cible. D’autre part, il faut remarquer que lors de l’élimination des laboratoires
"aberrants",
la moyenne des résultats vaévoluer,
la cible va se
déplacer,
mais par contre lesdécalages
relatifs entre les laboratoiresresteront constants. Il n’en est pas de même pour l’incohérence : l’élimination d’un laboratoire incohérent a
généralement (mais
nonsystématiquement)
tendance à faire diminuer l’incohérence des autres laboratoires.Les laboratoires
n’apparaissent pas toujours
aussiproches
de la cible que dansl’exemple
1. Dans tous les casd’analyses
de la matièreprotéique
que nous avons traités les laboratoiresprésentent d’importants décalages
et sont donc trèséloignés
dela cible. Cela est dû au fait que
l’écart-type
dereproductibilité
est nettementsupérieur
à
l’écart-type
derépétabilité (pour l’interprétation
de cesnotions,
voir[4]).
Comme nous l’avons
précisé plus haut,
la taille de la cible estproportionnelle
à l’estimation de
l’écart-type
de l’erreur de mesure. Ce sont donc les laboratoiresparticipant
à la chaîned’analyse qui,
par leursrésultats,
déterminent la taille de cette cible. Il est doncindispensable
que les méthodesd’analyses
soient définies leplus précisément possible.
Dans notre cas, nous nous sommes référés àl’ouvrage
del’AFNOR
[1].
L’application
de cette méthoded’analyse
à des échantillons de lait nécessitequelques précautions.
Il est enparticulier indispensable
de vérifier que lafaçon
dontseront constitués les échantillons assure une
homogénéité
de leurcomposition chimique.
Il est en effet
particulièrement
difficile de réaliser des échantillons de laitprésentant
exactement le même taux de matière
grasse.
Nous nous sommes assurés que le LABILAITproduisait
de tels échantillons en réalisant une chaîned’analyse
fictivement interlaboratoires(toutes
lesanalyses
étant réalisée par le mêmelaboratoire)
où étaientdéterminés le taux de matière grasse et le taux de matière sèche. Il était donc
possible
de calculer pour
chaque
échantillon le taux de matière sèche non-grasse. Comme ce taux varie très peuquelle
que soit la manière de constituer leséchantillons,
d’éventuels écarts nepouvaient
être dusqu’à
unehétérogénéité
de lacomposition chimique
deséchantillons issus d’un même lait.
Nous avons écrit un
logiciel, appelé CIBLE, qui
permet la saisie des résultats de la chaîned’analyse.
Il effectue les calculsstatistiques présentés
ci-dessus. Ilproduit
lesgraphiques
du type de ceux accompagnant ce document. Il fonctionne surcompatible
IBM-PC relié à une table traçante
compatible
HP 7445.La méthode que nous venons de décrire
a l’agréable
avantage deprésenter
lesrésultats sous forme
graphique.
Mais le lecteur de telsgraphiques
devra veiller à ne pasy voir
plus
que cequi
eststatistiquement significatif.
Elle peuts’appliquer
à d’autresdonnées que celles
d’analyses
de lait. Et même elle peut être mise en oeuvre pour toute visualisation des résultats d’uneanalyse
de la variance.Remerciements
Que
soient ici remerciés MessieursLapied
et Honoré du Labillaitqui
sont àl’initiative de ce
problème
et Jean-Pierre Raoultqui
nous aapporté
sescritiques
et sesconseils.
Bibliographie
[1] AFNOR (1970) Fidélité d’une méthode d’essai. Guide pour les essais interlaboratoires NF X 06 041.
[2] AFNOR (1980) Lait et
produits
laitiers : méthodesd’analyses.
[3] J. FLESSELLES (1980) Un mode de
présentation
des résultats d’essaiscomparatifs
entrelaboratoires portant sur l’évaluation de la
qualité
d’une méthode de mesure. Revue deStatistique Appliquée
Vol. XXVIII n° 3.[4] R. GRAPPIN (1976) Guide pour l’évaluation des méthodes
d’analyses
de routine. Le LAIT Tome LVI n° 559-560.[5] H. SCHEFFE (1959) The
Analysis of
Variance. J.Wilhey.
[6] H. PROST; B. HUGUES
(1983)
Conditionsd’application
des testsstatistiques
designifi-
cation aux dénombrements microbiens effectués en milieu solide. Ann. Fals. Exp. Chim. 76 n°