R EVUE DE STATISTIQUE APPLIQUÉE
E. P ARENT G. L ANG P H . G IRARD
Sur l’apport des statistiques bayesiennes au contrôle de la qualité par attribut. Partie 2 : contrôle progressif tronqué
Revue de statistique appliquée, tome 44, n
o1 (1996), p. 37-54
<http://www.numdam.org/item?id=RSA_1996__44_1_37_0>
© Société française de statistique, 1996, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
37
SUR L’APPORT DES STATISTIQUES BAYESIENNES AU CONTRÔLE DE LA QUALITÉ PAR ATTRIBUT,
PARTIE 2 : CONTRÔLE PROGRESSIF TRONQUÉ
E.
Parent,
G.Lang,
Ph. GirardDépartement
desMathématiques Appliquées
ENGREF, 19 Avenue du Maine 75732 - PARIS Cedex 15 - France Rev.
Statistique Appliquée,
1996, XLIVRÉSUMÉ
Les méthodes de
statistiques bayesiennes
peuvent être utilisées pour calculer unplan
de contrôle
statistique progressif
de laqualité
par attribut. Par rapport auxprocédures
trèsstandardisées recommandées par l’AFNOR, cette démarche non
classique présente l’avantage
de construire une
règle
de décisionadaptée
à un critère relié auxenjeux
d’ordreéconomique
dechaque problème particulier.
Deplus,
cesrègles bayesiennes
valorisent toutes les informationsdisponibles
pour résoudre leproblème
décisionnel de contrôle de laqualité
enintégrant
aussi bien les informations issues de
l’échantillonnage
que celles provenant de connaissancessubjectives.
La construction d’unplan progressif tronqué
de contrôle de laqualité
selon lesprincipes
de lastatistique bayesienne
est illustrée par le calcul de larègle séquentielle
d’arrêt etde décision
optimale
pour un modèle béta-binomial avec coût linéaire.L’algorithme
de calcul, fondé sur les concepts de laprogrammation dynamique stochastique,
peut être facilementimplémenté
comme outil d’aide à la décision en situationopérationnelle.
Mots-clés :
Bayes,
Contrôlestatistique
de laqualité, Echantillonnage
binomial,Statistique
décisionnelle,Programmation dynamique stochastique.
ABSTRACT
Bayesian
statisticaltechniques
can be used todesign
asequential
truncatedsampling plan
forquality
control. Ascompared
to the usual methods advocatedby
the french association for normalisation, thisapproach
exhibits theadvantage
to elaborate a decision ruletaking explicitely
into account economic concerns related to thequality
controlproblem
at hand tosolve. In addition,
bayesian
statistics allow toincorporate
informationcoming
fromsequential sampling
andoriginal subjective knowledge.
Thebayesian design
of asequential
truncatedsampling plan by
attribute is illustratedby
the calculation of theoptimal
decision andstopping
rules for a beta-binomial model with linear cost. The
algorithm
derived from thisapproach
isbased on the stochastic
dynamic programming approach.
It can beeasily implemented
as adecision aid tool in an
operational
context.Keywords : Bayes,
Statisticalquality
control, Binomialsampling,
Statistical decisiontheory,
Stochastic
dynamic programming.
38 E. PARENT, G. LANG, Ph. GIRARD Introduction
Les
praticiens
du contrôle de laqualité
utilisent souvent desplans
d’échantillon- nagesséquentiels,
d’ailleurs codifiés par l’AFNOR(1988) :
à efficacitéégale,
lesplans séquentiels permettent
en moyenne une économie sur la taille des échantillons àprélever,
et donc une économie en terme de coût de contrôle. Ils semblent aussiplus
naturels car le contrôleur a la sensation de réaliser une «meilleure utilisation de l’information». L’idéed’optimiser
unplan séquentiel
de contrôle de laqualité
serencontre en
statistique classique.
Parexemple,
Daudin et al.(1990)
ontproposé
desstratégies
d’obtention des meilleursplans d’échantillonnage
double par attribut et par variable. Assezrépandue
dans lesproblèmes d’ingénierie
de l’eau(Duckstein et al., 1987), l’approche statistique bayesienne
offre une alternative intéressante pour lesproblèmes
du contrôle de laqualité
dans les industriesagro-alimentaires (Martz, 1976 ;
Cressie et
Seheult, 1985)
en neséparant
pas lesaspects statistiques
desconséquences économiques
des décisionsqui
en résultent. Parconstruction,
cetteapproche
fournitdirectement une
règle
de décisionqui
minimise un critère derisque
que l’on définira par la suite.On cherche ici à
porter
unjugement
sur laqualité
inconnue d’une fabricationsupposée homogène,
c’est-à-dire stationnaire au cours dutemps,
àpartir d’objets
examinés en
séquence. Après chaque inspection,
le contrôleurpeut
décider le refusou
l’acceptation
du lotfabriqué
ou bien ne pas se prononcer et examiner un échantillonsupplémentaire.
Nous supposerons ici que pour des raisons diverses(nombre
limitéde
contrôleurs, etc...)
lefabriquant
doitporter
unjugement d’acceptation
ou de refussur un lot en
prélevant
au maximum Tobjets (plan d’échantillonnage tronqué).
La démarche
bayesienne
consiste à utiliser le même cadreprobabiliste
pour traiter deux niveaux d’incertitude :- l’incertitude
proprement
dite relative à notre connaissance réduite de laqualité
de la fabrication. Cette incertitudepeut
être levée au moinspartiellement
par
apport
d’informations fournies parexemple
par les résultats del’échantillonnage.
On
emploiera
une variable aléatoire pour décrire l’incertitude relative aux valeurs duparamètre
décrivant laqualité;
onexprimera
ensuite la distribution de cette variable aléatoire conditionnellement aux résultats del’échantillonnage.
- l’aléa « naturel »
qui, lui,
nepeut
être réduit parapport
d’information. Ildésigne
ici le
phénomène
aléatoire d’obtention d’un échantillond’objet
de la fabricationqui
sera modélisé à l’aide de
probabilités quantifiant
la mesure d’événementsphysiques qui peuvent
se réaliser.Dans le
premier
cas, laprobabilité
est ditesubjective
car elle est utiliséepour
quantifier
une connaissancesubjective
à propos d’unparamètre inconnu;
dans le second cas, elle est diteobjective
car reliée directement à lafréquence
limited’observation effective d’un
phénomène.
Les débats et controverses à propos de cette double face de l’utilisation desprobabilités
durentdepuis près
de trois siècles et sontparticulièrement
bien décrits et commentés dans Weber(1973).
Cet article n’entre pas dans cette discussion
épistémologique,
maissouligne
lesgrands
traits del’approche
detype bayesien
pour le contrôle de laqualité
par attribut. Ilen illustre les
potentialités d’application
intéressantes pour unplan d’échantillonnage
progressif tronqué.
CONTRÔLE PROGRESSIF
TRONQUÉ
39La construction d’un
plan bayesien
de contrôleséquentiel
par attribut n’estguère plus
difficile que celle du contrôle à taille d’échantillon fixeprésenté
dansBillion et Parent
(1991)
etdéveloppé
dans Parent et al.(1995).
L’idée maîtresse est de comparer,après chaque inspection
d’un nouvelobjet,
lerisque bayesien
d’unedécision immédiate avec le coût moyen
anticipé
depoursuite d’échantillonnage
que l’on actualisera àchaque étape.
Cet article estorganisé
de lafaçon
suivante : nousprésentons
d’abordquelques rappels
et notationsindispensables
à la modélisation duproblème
del’échantillonnage séquentiel
en contrôleséquentiel
de laqualité, puis
ladémarche d’établissement de la
règle optimale
de décision et d’arrêt estdéveloppée
àpartir
desprincipes
de laprogrammation dynamique;
enfin le modeopérationnel
dela démarche est illustrée par une
application pratique.
Enconclusion,
nous discutons desavantages,
des limites et des extensionspossibles
de cetteapproche.
1. Le modèle
statistique
béta-binomial 1.1. Loi binomialeRappelons
que la loi binomiale deparamètres (n, p)
est la loi deprobabilité
dela variable aléatoire X :
Dans toute la suite du texte, on fera
l’hypothèse
que la loi du nombred’objets
défectueux
parmi
les nobjets
de l’échantillon de contrôle d’un lot de taille N suitune telle
loi,
enappelant
p laproportion
de défectueux dans le lot. Cettehypothèse
est
légitime
si lerapport n/N
est faible et que lestirages
successifs s’effectuent dans des conditionsexpérimentales indépendantes.
1.2. Les
informations
On suppose que l’on réalise un
échantillonnage séquentiel objet
parobjet :
àl’étape
n on aura tiré un échantillon de taille n et le résultat de cetteexpérience
est lenombre
d’objets
défectueux observés dans l’échantillon de taille n, réalisation de lav.a.
Xn.
La loi deXn
sachant p est une binomiale deparamètres
n et p, donnée parl’équation (1).
Al’étape
n+ 1,
on réalise letirage
d’unobjet supplémentaire :
s’il estdéfectueux,
l’accroissement xn+1 - xn vaut1,
sinon il vaut zéro.Nous manions aussi des événements
plus complexes,
à savoir desséquences d’observations,
éventuellementsuspendues
avant leur terme. Pour travailler avec cestrajectoires,
nousappelons
commeBerger (1985)
xn le«passé»
d’une sériejusqu’à
l’instant n ; xn =
(x1, x2,..., 1 un)
est donc latrajectoire
formée de l’ensemble des résultats de mesuresjusqu’à
la date n. Une telletrajectoire
a pour loi deprobabilité fn(xn|p) = pxn(1 - p) n - X n
et onpeut
dénombrerxn ) trajectoires
différentes allant del’origine
à xn(nombre
total de défectueux totalaprès
lenème contrôle)
par accroissements de 0 ou 1. L’information maximale
qu’aura
éventuellement à40 E. PARENT, G. LANG, Ph. GIRARD
disposition
le statisticien sera donc ici le vecteur de taille Tcomposé
d’une suite finie de Ttirages xT = (x1,
x2, ... Xn, ... ,xT).
Parconvention,
onappellera
xo l’état
originel
d’information avantprise d’échantillon,
xosignifiant
«aucuneexpérience
effectuée». Il est commode debaptiser
?ro la loi de p sachant xo, c’est- à-dire l’apriori
de p selon la démarchebayesienne.
Cette distribution regroupe les informationssubjectives
que l’industrielpossède
sur les valeurs de p. Cette connaissancepréalable imprécise provient
parexemple d’expériences
antérieures sur uneproduction identique
ou d’estimationssubjectives
ducomportement
de la chaîne de fabrication sur unproduit analogue.
On trouvera dans Robert(1992)
un résumédes
techniques pratiques
d’estimation de cette loi apriori.
Il est commode de choisir pour
7ro(plxo)
une loi detype béta, conjuguée
naturelle de la binomiale
(Ulmo
etBemier, 1973),
dont les coefficients a et b serontappelés
icihyperparamètres.
Ces deux coefficients confèrent unegrande souplesse
au choix de la distribution a
priori
duparamètre
p.Le cas a - b = 0.5
correspond
à la loi non informative deJeffreys
pourun modèle
d’échantillonnage
binomial. Le cas a = b = 1 donne la loiuniforme,
distribution apriori
maximisantl’entropie
utilisée comme mesurequantitative
de l’incertitude par Tribus
(1969)
etqui
tire sajustification
de considérations de traitement dusignal.
En
appliquant
la formule deBayes (1763),
la loi aposteriori
de p, c’est-à-dire la distribution duparamètre
paprès
avoir eu connaissance du résultat xn des résultats del’échantillonnage jusqu’à l’étape
n, est donnée par :La loi a
posteriori
de p reste dans la même famille detype
bêta que la loi apriori puisque
la loi bêta est«conjuguée
naturelle» de la loi binomiale :l’incorporation
del’information xn se traduit en
pratique
par unsimple décalage
deshyperparamètres :
Cette
propriété
n’est pas essentielle pour mener à bien les calculs formelsdéveloppés
dans les
paragraphes qui
suivent.Néanmoins,
c’est un outilagréable qui permettra
de meneranalytiquement
tous les calculsjusqu’à
leur terme en visualisant defaçon explicite
comment intervient l’information xn collectée àl’étape
n dans la démarchebayesienne.
CONTRÔLE PROGRESSIF TRONOUÉ 41
On
peut
aussi évaluer la loi non conditionnelle de la variable aléatoireX, appelée
aussi loiprédictive.
Elle est donnée par :On reconnaît dans la formule
(5)
un modèle d’ume dePolya (Feller, 1966).
Bemier
(1993)
asouligné
lesproximités conceptuelles
etopérationnelles
entrel’emploi
de la loiprédictive
enstatistique bayesienne
et l’utilisation d’ungénérateur
aléatoire fondé sur des mécanismes de
type «bootstrap»
parsuréchantillonnage
enstatistique classique.
2.
Étude
de la structureséquentielle
des informationsNous allons montrer que la série des
Xn
forme un processus markovien d’ordreun : en
effet, la
loi des accroissementsxn+1 - Xn
est une Bernoulli deparamètre
p pourlequel
xn constitue unestatistique
exhaustive àchaque étape
n. Nous utiliserons ensuite cettepropriété
pour calculer en chaînel’espérance mathématique
d’unefonction de p et xn .
2.1.
Propriété
1 : LesXn forment
un processus Markovien d’ordre un Considérons pour cela :Dans la formule 6 on a noté 7r n la loi de p sachant
xn ;
or,puisque
xn est unestatistique
exhaustive de p, la loi de p sachant xn estidentique
à la loi de p sachant xn . Elle est donnée par la formule(3).
Deplus,
connaissant p et xn =(Xj
1 X21 ...,xn),
la v.a
Xn+l
nepeut prendre
que les valeurs Xn ou Xn+
1. De cesconsidérations,
il vient :- 42 E. PARENT, G. LANG, Ph. GIRARD
Inconditionnellement à p, la série des
Xn
forme donc un processus markovien d’ordre un, dont la loi de transition ~n a pourexpression :
où a et b sont les
hyperparamètres
de la loi apriori 7ro (pl xo)
donnée par la formule 2.2.2.
Propriété
2 :expression
d’uneespérance mathématique
en X npar conditionnements
successifs
Cette
propriété
est uneconséquence
directe de lapropriété précédente.
Considérons
h(xn, p)
une fonctionintégrable
de p et de xn =(X 11
X2, ... ,x,,).
Pourrechercher
EX1...xn,p(h(xn, p),
on utilise le fait que ladécomposition
del’espérance
de cette fonction pour la loi
conjointe
de p et des(Xl,
X2 ... Xn, ...Xr)
sous formede conditionnements successifs
s’écrit,
pour tout n et pour toute fonctionh (xn , p) :
Le caractère Markovien d’ordre un de la série des
Xn
et le caractère exhaustif de x. pour ppermettent
de réduire ces conditionnements à deux pas detemps
successifs seulement sous la forme :3.
Règles
de décision et coûtsOn notera 0
= (T, 6)
unerègle
de décision. 0394 est un doubletcomposé :
- d’une
stratégie
d’arrêt T,- d’une
stratégie
d’action 8.Une
règle
réalise uneapplication
de l’ensemble des informations mises àdispo-
sition du contrôleur de la
qualité
dans l’ensemble des actionsqu’il peut entreprendre.
Ces
règles
seront donc des fonctions des(Xl,
X2 ... Xn, ...XT) uniquement
et non duniveau de
qualité p.
Contrairement au cas du contrôle de laqualité
à taille d’échantillonfixé, l’aspect séquentiel
rend leur structure un peuplus compliquée
en introduisant deux niveaux pourrépondre
auxquestions
suivantes.CONTRÔLE PROGRESSIF
TRONQUÉ
433.1.
Quand
doit-on s’arrêter ? Larègle
d’arrêt TUne
stratégie
d’arrêt est une variable aléatoire :qui indique
pour unetrajectoire xT
deXT,
l’instantauquel
on cesse d’échantillonner.La décision d’arrêter
l’échantillonnage
à l’instant n estprise
en fonction dupassé
observé xn . Cette
propriété implique
que T est untemps
d’arrêt(Dacunha-Castel
et
Duflo, 1983),
c’est-à-dire que les événements detype {r
=n}
sont mesurablessuivant la filtration
engendrée
par la suite Xn =Xl, X 2 , ... X n
constituée des v.a.d’informations jusqu’à l’étape
nuniquement.
Le fait de construire la
stratégie
d’arrêt comme une fonction des réalisationsxT
deXT implique
que les événements{03C4
=n}
pour n~ {1,2
...T}
forment unepartition
de l’ensemble destrajectoires.
Cettepartition
nedépend
pas de la valeur de p. Ceci nesignifie
pas que la variable T estindépendante
de p, mais que l’événement{03C4
=n}
conditionnellement à Xn estindépendant
de p, considérée comme une v.a.selon
l’approche bayesienne.
3.2.
Lorsqu’on s’arrête, que faire ?
Lastratégie
d’actions 03B4 Unestratégie
d’actions est définie par :8 est une
application qui
affecte à toutes lestrajectoires
xn suivies entrel’origine
etl’étape n ~ T,
un élément de l’ensemble{d1, d2} indiquant
un choix entre l’une desdeux
actions,
si l’on arrêtaitl’inspection
àl’étape
n :dol
«livrer»ou
d2 :
«mettre au rebut»Quand
la valeur d’arrêt T est connue, lastratégie
d’action 6indique
en fonctionde la
trajectoire
xT suivie entrel’origine
etl’étape
T la décisionopérationnelle après
arrêt de
l’échantillonnage, 8(xT).
3.3. Fonction de coût
La fonction de coût W associe à
chaque
action et àchaque
état de la nature une évaluationnumérique
despertes
occasionnées par l’action. Nous utiliserons ici la fonction de coûtsimple,
définie dans Ulmo et Bemier(1973),
soit :Si l’on choisit de livrer
(décision dl ), parmi
les Nobjets
dulot,
on admet quepN produits
défectueux seront retournés à l’industriel. La valeurpCN représente
alors une évaluation des frais de retour et de
perte d’image
de marque : c’est le coût44 E. PARENT, G. LANG, Ph. GIRARD
de la
« non-qualité » ;
si l’onexprime
C dans la même unité de coût que celle duprix
de fabrication d’un
objet,
Cprend
des valeurssupérieures
à 1. Onajoute
un coûtd’échantillonnage
unitaire :k, exprimé
dans la même unité de coût que celle duprix
de fabrication d’un
objet, représente
un coût d’examen et de contrôle parobjet.
Lecoût de la mise au rebut est dans ce cas
simplement
estimé à une unité monétaire pour chacun des Nobjets
de la fabrication contrôlée.3.4. Contrôle
statistique classique
Remarquons
que le contrôlestatistique classique
de laqualité procède
par familles derègles
«standard»Aci,c2
indicée par deux fonctions seuil n ~c1(n)
etn ~
C2 (n)
avecc1(n) ~ C2 (n)
etc1(T)
=C2 (T)
telles que :Notons que, du
point
de vueopérationnel,
lastratégie
d’action ne nous intéresseque
quand T(Xn)
= n. Alors03B4(xn)
=d2
siT ~ xn
>c2 (n), 8(xn)
=dl
si0 ~
XnCI (n).
Enpratique, n’importe quelle
valeur de larègle
d’actionpeut
être affectée auxpoints
Xn~]c1 (n),
C2(n) [.
4.
Risque bayesien
etrègles
de décisionbayesienne
4.1.
Risque bayesien séquentiel
Quel
critèrepeut-on adopter
pourexprimer
le coûtglobal
encouru par larègle séquentielle A lorsqu’on
réalise des séries d’observations(XI,
X2 ... Xn, ...XT)
sous l’état de
non-qualité p?
Ondéfinit,
dans le contexteséquentiel,
lerisque
parl’expression suivante,
moyenne des coûts(terminaux) possibles
évaluée sur tous lesaléas de l’échantillon obtenu à
l’étape n :
Puis on calcule le
risque bayesien
enintégrant
sur toutes les valeurpossibles
de p avec la distribution a
priori
?To :CONTRÔLE PROGRESSIF TRONQUÉ
45En d’autres termes,
l’équation (17)
évalue un coût moyen calculé sur toutes lestrajectoires depuis
ledémarrage
del’échantillonnage jusqu’à
la décision d’arrêten considérant à la fois tous les aléas des
tirages possibles
del’échantillonnage
etl’incertitude de l’état de
qualité
de la fabrication. C’est cecritère, prenant
encompte
à la fois des considérations derisque
de variabilité dutirage
et de sensibilité auxincertitudes, qui
estadopté
parl’approche bayesienne.
4.2.
Éléments d’analyse
durisque bayesien
En
s’appuyant
sur’équation (17)
devient :En utilisant
l’équation (10) (seconde propriété
due au caractère markovien d’ordre un desxn) pour h(xn, p)
=1{03C4=n}Wn(03B4(xn), p) l’équation (18) peut
encores’écrire :
Dans
l’équation (19)
la v.a.1{03C4=n}
nedépend
que des Xn mais pas de p, une fois connus les Xn, de sorte que l’onpeut
l’extraire du termed’espérance
sur p et écrire :Pour mener à bien les calculs successifs
d’espérance
conditionnelle del’équation 20,
on utilisera la loi de transition du processus donnée à la formule 8.5. Construction d’une
règle bayesienne
Nous allons
schématiquement indiquer
leprocédé
de construction d’unerègle
A* minimisant le
risque bayesien séquentiel grâce
à unetechnique
de récurrence surles valeurs du
temps
d’arrêt.46 E. PARENT, G. LANG, Ph. GIRARD
5.1. Recherche de la
stratégie
d’actionoptimale
Il
apparaît
defaçon
claire surl’équation (20)
que lastratégie
d’actionoptimale
doit être
composée
detactiques 8 (xn)
minimisantl’espérance
aposteriori
des fonctions de coûtsEp|xn(Wn(03B4(xn),p)).
A cause de la formeparticulière
de lafonction de coût
(qui
nedépend
pas de toute latrajectoire
mais du dernierpoint atteint)
et en raison du caractère exhaustif de Xn pour p
quand
on considère un échantillon de taille n, latactique optimale
8* et le coûtoptimal a posteriori
associé ne sontfonctions que de l’observation Xn à
l’étape n
et non de toute latrajectoire jusqu’à
n.Par abus de
notation,
on écrira alors dans la suite du texte03B4* (xn)
=03B4*(Xn).03B4*
esttelle que :
Dans les
espérances
dites aposteriori
de la formule(22),
la loi deprobabilité
de la variable aléatoire p conditionnellement à xn , notée
03C0n(p|xn)
est,d’après (3),
la loi bêta de
paramètres
a + Xnet b + n -
Xn.Avec cette forme
particulière
des lois deprobabilités
aposteriori
données parl’équation (3)
et des coûts donnés par leséquations ( 13)
et( 14),
il est facile de montrerque, sachant que la décision de livrer ou de
rejeter
doit êtreprise
àl’étape
n, latactique
6* (Xn)
est caractérisée par un niveaud’acceptation égal
à c =C
,comme dans Parent et al.
(1995),
c’est-à-dire que siXn
c on livre le lot(décision dl)
sinon on le met au rebut(décision d2).
Nous noterons désormais dans la suite de l’article :
Ayant
résolu leproblème
de lastratégie d’action,
ils’agit
maintenant de rechercher lastratégie
d’arrêtoptimale
telle que :5.2. Recherche de la
stratégie
d’arrêtoptimale
La difficulté
principale
réside dans la détermination de T. Nous allons utiliser leprincipe
de Massé(1946)-Bellman (1957)
pour évaluer en chaîne lestemps
d’arrêt. Ceprincipe
énonce quelorsqu’on
connaît une«politique» optimale (au
sens de«règle»
telle que définie
ci-dessus),
toutesous-politique (au
sens morceau constitué d’une série detactiques)
est elle mêmeoptimale
à conditiond’imposer
auxtrajectoires
deCONTRÔLE PROGRESSIF TRONQUÉ
47la sous
politique
considérée les conditions initiales et finales définie par lapolitique optimale originelle.
Au
préalable,
illustrons l’idéegénérale
de construction de la récurrence surles
trajectoires atteignant
lesétapes
T et T -1,
c’est-à-dire celles àtemps
d’arrêt{03C4 ~ T - 1} :
cettepréoccupation
estlégitime
carl’expression (23)
étant une sommede termes
positifs,
le minimum sera réalisé si chacun des termes de la somme est minimum. D’autrepart, compte-tenu
des conditions terminales(T
borné parT),
nouspouvons, avec un calcul
simple d’espérance mathématique
détaillé dans Parent et al.(1995),
évaluer les coûts aposteriori
en T et T - 1 :En individualisant les
trajectoires
pourlesquelles
lestemps
d’arrêt valent{T
= T -1}
et{03C4
=T}, l’expression
23 deR7rO (A)
devient :Sous cette
forme,
on voit que sur unetrajectoire
seprolongeant jusqu’à
T - 1au moins et
passant
par l’observationXT-1
= xT-1, ils’agit
de rendre minimum laquantité :
On compare donc
W*T-1(xT-1)
àExT|xT-1W*T(XT).
Latactique
d’arrêtoptimale
sur lestrajectoires appartenant
à l’événement{r
=T - 1}
est donc fonctionuniquement
de XT-1 et non de toute latrajectoire xT-1 jusqu’en
XT-1. En d’autrestermes, la seule v. a.
XT-1 (et
non toute la tribuengendrée
par la série des suffitXT-1!)
suffit pour déterminer la valeur dutemps
d’arrêtoptimal {T
= T -1}.
5.3.
Programmation dynamique
pour la recherche de lastratégie
d’arrêtoptimale Supposons
que T est untemps
d’arrêtoptimal.
Nous avons vu que les événements{r
=k}
constituent unepartition
destrajectoires
et que lerisque baye-
sien
peut
être écrit comme une somme de termespositifs
indicés par les valeurs de k. Leparagraphe précédent
montre commentpartitionner
àl’étape
T - 1 l’ensemble destrajectoires
telles que{03C4 ~
T -1}
en un sous-ensemble{r
= T -1
et soncomplémentaire {r
=T}.
Cettepartition
de{T ~
T -1}
nedépend
que de xT-1,48 E. PARENT, G. LANG, Ph. GIRARD
valeur de
XT-1
àl’étape
T - 1 et non de toute latrajectoire passée
pour atteindrece
point.
Nous allonsgénéraliser
unepropriété analogue
àchaque
pas detemps
par récurrencerétrograde.
Considérons la valeur k = n,
d’après (23)
lapart
durisque bayesien
concernantles
trajectoires
telles que T > n estégale
à :où :
Cette
quantité permet d’exprimer
lerisque
minimal pour untemps
d’arrêtoptimal,
conditionnellement au fait que l’on a décidé que cetemps
d’arrêt étaitsupérieur
ouégal
à n + 1. C’est uneespérance
conditionnelle sur des fonctions dexn+l et de (X1, X2,... XT )
par l’intermédiaire de T, de sortequ’en premier
examenelle ne
dépende
que destrajectoires possibles jusqu’à
l’instant n + 1engendrées
parla v.a. X n .
L’ hypothèse
de récurrence consiste à supposer que :a)
pour tout k > n, letemps
d’arrêtoptimal {r
=k}
est une fonction de la seule v.a.Xn
et non des valeurspossibles
xn de latrajectoire passée
aboutissanten Xn
= Xn.b) compte
tenu de cespropriétés,
la valeur de lapart
derisque
concernant lestrajectoires
de l’événement{03C4 ~
n +1}
nedépend
que de la valeur Xn+l et non de tout lepassé jusqu’au temps
n + 1 :U*n+1(X1, X2,... Xn, Xn+1) = Un+
1(X n
+1 ) ;
on sait d’ailleursexpliciter
les valeurs dutemps
d’arrêtoptimal
pour les
trajectoires
dont letemps
d’arrêt estsupérieur
à n et calculer par la formule(27)
lerisque
minimalcorrespondant
à ce groupe detrajectoires.
Les
propriétés a)
etb)
sont vraies àl’étape
T et T -1,
comme le montreimmédiatement la formule 26. Le calcul par
programmation dynamique
consiste àsupposer ces
propriétés
de n + 1 à T et à démontrerqu’elles
sont vraies aussi àl’étape
n.
En
séparant
l’arrêt immédiat àl’étape
n des autres, la formule(27)
devient :CONTRÔLE PROGRESSIF
TRONQUÉ
49 La formule 28 montre que l’onpeut
écrire :L’équation
29 démontre clairement queU*n(xn)
=U*n(xn),
et que le choix de s’arrêter en n nedépend
que de Xn. Les conditionsa)
etb)
sont donc transférées àl’étape
n.On
peut
alors utiliser leprincipe
de Massé-Bellman pour calculer deproche
en
proche
et defaçon rétrograde
les valeurs successivesU*n(xn)
et construire lapartition
destrajectoires
entre les événements{T = k}, k
= 1... Tjusque R03C00(0394*) = U*0(x0).
La
figure
1 schématise cetteprocédure
de calculrétrograde
parprogrammation dynamique.
Notons que le doubletstratégie
d’arrêt etstratégie
d’actionspermet
de construire unerègle séquentielle optimale,
valable non seulement avant touteprise d’échantillon,
mais aussidepuis n’importe quelle étape
en cours del’échantillonnage :
en
effet,
laquantité U*n(xn) s’interprète
comme lerisque bayesien
sous la condition de démarrerl’échantillonnage
enplaçant l’origine
en n avec une information initiale Xn et un apriori 03C0n(p|xn)
pour ladescription
de la connaissance sur p.FIGURE 1 :
Principe
de calculrécursif de
larègle optimale
pour unéchantillonnage séquentiel tronqué
6.
Applications
La
programmation
del’algorithme
donné par leséquations
28 et 29peut
être effectué facilement sur un tableur. A titred’exemple,
uneprogrammation
sous Excela
permis
de réaliserrapidement
lediagramme
de contrôle de lafigure
2 :- les colonnes
représentent
l’ensemble des réalisations aléatoires deXn (par exemple,
pour la colonneH15,
le nombre cumuléd’objets
défectueux varie de 0 à15),
50 E. PARENT, G. LANG, Ph. GIRARD
- le
type
de hachures dechaque
case(cf. légende
de lafigure 2) indique
larègle
de décision
optimale compte
tenu du nombred’objets
défectueux observésjusqu’à
l’horizon concerné.
FIGURE 2 :
Exemple
dediagramme
de contrôle : la loi apriori
a pourparamètres
a = 1 et b =
10, la fonction de cot est telle que Wn(d1,p)
=n+5pN; Wn(d2,p) =
n +
N; T
= 20.Sur la
figure 2,
à titre d’illustration de l’utilisation de telsdiagrammes,
un cheminement
possible
du nombre cumuléd’objets
défectueux observés et des décisions depoursuite
ou d’arrêt a été matérialisé par des flèches :ici,
le processusséquentiel
de contrôle s’arrêteaprès
avoirprélevé
16objets
dont deux sont défectueux.On trouvera dans Girard
(1994)
d’autresdiagrammes
de contrôleséquentiel
de laqualité
par attribut et uneanalyse
de sensibilité des divers coefficients de la fonction de coût et deshyperparamètres
de la distribution apriori
duparamètre
p.7. Discussion et conclusions
Le contrôle
statistique séquentiel
illustre leparadigme
del’ingénierie
sousincertitudes
(Krzysztofowicz, 1994) :
ils’agit
d’établir uncompromis
entre troiscompétitions temporelles
concomitantes :51 CONTRÔLE PROGRESSIF
TRONQUÉ
2022 retarder une
prise
de décisionpermet d’acquérir plus d’informations;
l’incer-titude sur le
phénomène
étudiédiminue,
cequi permet
de réduire le caractère aléatoire dupari engagé
par le choix d’une alternative de décision. Cetapprentissage
sur lesvaleurs inconnues du
paramètre
p au fur et à mesure del’acquisition
d’informations nouvelles est effectué ici par l’utilisation de la formule deBayes.
2022 l’utilité
globale
del’adéquation
d’une décision donnée à un étatpossible
duphénomène
inconnu diminue au cours dutemps
au fur et à mesure que cette décision estretardée,
ne serait-cequ’à
cause des coûtsd’acquisition
d’informations. Dans notreexemple,
pour un état de connaissance fixé sur p, on a bienWn (dl, p) Wn+1 (dl, p) et Wn(d2,p) Wn+1(d2,p).
2022
plus
letemps
passe etplus
la taille du domaine réalisable des alternativestechniques
diminue : il y aperte
de flexibilité. Cette évolution ne se manifeste que très peu dansl’exemple
du contrôlestatistique
de laqualité
sauf àl’étape
ultime oùl’ensemble des
tactiques possibles
est contraint à se restreindre.En
adoptant
lepoint
de vueprécédent,
la décision d’arrêt d’un proces-sus
séquentiel
doit êtreprise lorsque
la valeurescomptée
d’une informationsupplémentaire
ne surpasseplus
les coûtsmarginaux,
directs etindirects, qui
sontengagés
pour obtenir cette information.Le modèle
développé
dans cepapier
a étésimplement
obtenu àpartir
d’unschéma de Bemouilli sur
lequel
ont étéemployées
des fonctions de coûts élémentaires et un ensemble volontairement restreint d’actions trèsschématiques.
De nombreusesaméliorations
peuvent
êtreenvisagées
pour ce modèle.Tout
d’abord,
onpeut
modifier leshypothèses
dutirage
et considérer parexemple
untirage
sans remise dans un lot dequalité homogène
mais de taille faible(type
fabrication deluxe).
Dans ce cas, l’action du contrôle limitera le nombred’objets disponibles fabriqués
et aura une influenceéconomique
directe sur laproduction.
L’approche bayesienne peut apporter
uneprocédure
efficace dans ce cas, même si l’on suppose inconnue la taille de la fabrication(estimation
par contrôle destructif de laqualité
d’une ressourceinconnue).
De la mêmefaçon,
onpourrait
enrichir le nombre d’actionspermises
enpermettant
parexemple
de vendre le lotfabriqué
moinscher en fonction de la classe de
qualité
estimée par le contrôlestatistique.
Ensuite,
un obstacleimportant
à la démarche concerne la fonction de coût : l’obtention de sa forme et de ses divers coefficientsauprès
des industrielspeut
ne pas être aisée(malgré
la norme AFNOR NFX 50-126qui explicite
les méthodes d’évaluation des coûts denon-qualité !),
car c’est unproblème qui
demande lacollaboration entre
plusieurs
services(Études
etDéveloppements, Marketing, Qualité
et Contrôle de
production
pour lemoins).
Plus
généralement,
comme l’avait fait remarquer Wetherill(1966),
onpeut
s’étonner de cette démarchebayesienne
de contrôle de laqualité qui
vise à fournirun
optimum économique
et non à encourager directement leproducteur
à fournir laqualité
désirée... notons que l’onpourrait
introduire par un formalismeanalogue
lespréoccupations
du « client» dans la fonction de coût. Cela semble d’ailleurs unefaçon
séduisante
d’analyser
lesarbitrages
entre client etproducteur :
le fabricant choisit unevaleur de T tandis que le consommateur fixe les
enjeux.
52 E. PARENT, G. LANG, Ph. GIRARD
D’autre
part,
le cas limitethéorique
difficile et intéressant duplan séquentiel
non
tronqué (T ~ +~)
n’est pas traité dans cet article. Le lecteur intéressé trouvera dans Wald(1947)
et dansBerger (1985)
lesdéveloppements théoriques
utilespour
compléter
le traitementstatistique complet
etbayesien
de toutes les situations rencontrées en contrôlestatistique
par attribut.Enfin,
onpeut développer
un contrôlestatistique
de laqualité
par variable monoou multidimensionnelle
(Albright
etCollins, 1977)
en suivant une démarche tout àfait
analogue
àl’approche bayesienne
décrite ici pour le contrôle par attribut : on trouvera dansKrzysztofowicz (1987)
les fondements d’un modèle normal avec lois apriori
bétanormales. Ce modèle est directement utilisable pour la construction d’un contrôlestatistique bayesien
de laqualité
par variable et il neprésente
pasplus
dedifficultés
conceptuelles
que cellesexposées
dans ce document.Seul l’espace
desétats du processus de Markov
généré
par les informations est différent(il s’agit
alorsde
R2 et
il faut dans ce cas, àchaque étape,
suivre l’évolution de deuxgrandeurs
continues : la moyenne et la variance
empiriques, statistiques
exhaustives pour le modèlenormal).
Pour
conclure,
d’unpoint
de vueconceptuel,
la démarchebayesienne
comblele fossé
qui
existait entre les connaissancessubjectives,
les donnéesexpérimentales
et les critères
économiques qu’elle intègre
dans une même démarche décisionnelle pour trouver unerègle
de décisionoptimale.
Deplus,
cetteoptique
nous sembleplus
intuitive etplus simple
à exposerqu’une
démarche à base de testsclassiques d’hypothèses,
que leresponsable qualité
enentreprise perçoit hélas,
encoretrop
souvent, comme des «recettes de cuisinestatistiques».
Remerciements : Les auteurs ont bénéficié des
critiques
etsuggestions
de A.Chaouche et J. Bernier. Cet article
s’appuie
sur unrapport scientifique
de fin d’études(Girard, 1994)
réaliséconjointement
àl’École
Nationale du Génie Rural des Eaux et des Forêts et à l’Institut NationalAgronomique Paris-Grignon.
Références
bibliographiques
AFNOR
Statistiques
Tome 2. Paris. La Défense :AFNOR,
1988.ALBRIGHT
S.C.,
COLLINS R.S. Abayesian approach
to theoptimal
control ofcontinuous industrial processes. Int. J. Product. Res.
15(1).
1977.BAYES Th. An essay towards
solving
aproblem
in the doctrine of chances. Phil.Trans; Roy.
Soc.53, 1763.
BELLMAN,
R.E.Dynamic programming.
PrincetonUniversity Press, Princeton, N.J., USA,
1957.BERGER J. O. Statistical Decision
Theory
andBayesian Analysis. 2nd
Ed. New York :Springer Verlag,
1985.BERNIER J.