R EVUE DE STATISTIQUE APPLIQUÉE
J. U LMO
B. P FLUGFELDER
Méthode d’exploration de la « surface de réponse » pour l’optimisation d’une variable dépendante dans le cas de facteurs contrôlés quantitatifs
Revue de statistique appliquée, tome 27, n
o4 (1979), p. 23-36
<http://www.numdam.org/item?id=RSA_1979__27_4_23_0>
© Société française de statistique, 1979, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
23
MÉTHODE D’EXPLORATION DE LA "SURFACE DE RÉPONSE"
POUR L’OPTIMISATION D’UNE VARIABLE DÉPENDANTE
DANS LE CAS DE FACTEURS CONTROLÉS QUANTITATIFS
J.
ULMO*
et B.PFLUGFELDER**
1. - INTRODUCTION
Il
s’agit
de trouver parapproximations
successives les meilleures conditionsopératoires
pour maximiser unecaractéristique
Y telle que le rendement ou lapureté
d’unproduit,
ou minimiser un coût.On suppose que les variables Xi, X2, .... , xk définissant ces conditions
opératoires
sontquantitatives
et que la fonction derégression 03A6
de Y sur les xiqui
est inconnue estcontinue,
c’est-à-direqu’on
a :03A6 est la "fonction de
réponse"
de Y aux xi.On suppose
également
que larégion
del’espace Rk engendré
par les xiqui représente
de l’intérêt est relativement étendue parrapport
aux variationsqu’on peut
leur donner.Une
première étape
del’expérimentation
a donc pour but de localiser larégion
où Tl est maximum. Elle consiste à réaliser unepremière
séried’expériences
autour du
point
deRk qu’on
suppose devoir donner les meilleurs résultats.Cette
expérience
doitpermettre
dereprésenter
localement la fonction deréponse
par une fonction linéaire ouquadratique
des xi, et d’en déduire unerégion
dans
laquelle
onpeut espérer
une meilleureréponse. Après
avoirprécisé
cetterégion
par deux ou trois
expériences,
on y réalise une nouvelle séried’expériences qui
aura cette fois pour but
l’exploration
locale de larégion
afin de définir defaçon précise
les conditionsoptimales
ousuboptimales.
Nous pensons que le meilleur moyen de faire
comprendre
l’essentiel de la méthode est del’exposer
sur unexemple qui
a été réalisé par l’un de nous(B.P.).
L’exposé
de cetexemple
est suivi d’unparagraphe
de commentaires consacré surtout à des indications sur lesplans d’expérience
bienadaptés
à la méthode.(*) Maître-Assistante à l’Université Paris IX Dauphine.
(* *)
Ingénieur
à la S.N.E.A. (P) - Centre de Recherches de Lacq.Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
Mots-clés : Surface de
réponse, optimisation.
Plansd’expérience. Régression
linéaireet
quadratique. Analyse
de la variance.24
2. - EXPOSE DE LA METHODE SUR UN EXEMPLE
Il
s’agit
de déterminer lespourcentages respectifs
z 1, z2 , z3 de troisoxydes métalliques (molybdène,
tellure etfer)
constituant laphase
active d’uncatalyseur, qui
maximisent le rendement moyen 17 duproduit
desynthèse qu’on
veutformer, (Métha crylonitrile
formé parammonoxydation
del’isobutène)
toutes les autresconditions
opératoires
étant fixées. Enparticulier
laphase
activereprésente
tou-jours
50 /o dupoids
ducatalyseur,
le reste étant constitué par de la silicequi
sertde
support.
Choix des variables
indépendantes
à fairefigurer
dans la fonction deréponse
Les 3 variables z 1, z2 , z3 étant liées par la relation fonctionnelle
on se ramène à deux variables
indépendantes
Xiet
x2 enposant :
Si on
représente
Z 1, z2, z3 par des coordonnéestriangulaires,
conformément à lafigure 1,
cechangement
de variables revient àprendre
pourorigine
le centrede
gravité
dutriangle
et pour axes :OXI :
laparallèle
à la baseFe03(zi = 100), Te03 (z2 = 100) Ox2 :
la médiatrice relative à cette base(cf. figure 1 ).
On voit en effet aisément que :
l’origine
est donc le centre degravité
dutriangle.
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
25
Figure
1Première série d’essais ou série de
dégrossissage
N’ayant
aucune indication sur laposition probable
del’optimum,
lepremier plan d’expérience
a été construit autour du centre degravité
dudiagramme triangu-
laire. Le
point
central 1 serarépété
4 fois afin d’avoir une estimation de la variance 02 de l’erreurexpérimentale
e,qu’on
suppose normalementdistribuée,
et de va-riance constante
pendant
toutel’expérience.
Les autres
points expérimentaux
constituent un carré centré sur 1 et à côtésparallèles
aux axes(cf. figure 2).
Us constituent donc unplan
factoriel22
par rap-port
à xi et x2. Le tableau 1 donne les coordonnées de cespoints.
Les valeurs observées pour le rendement y sont les suivantes :
Revue de Statistique Appliquée, 1979, vol XXVII, n° 4
26
A
première
vue(cf. figure 2)
ces résultatsexpérimentaux justifient l’ajuste-
ment d’un modèle de
régression polynomiale
dupremier degré
enxi
etx2
c’est-à-dire
l’approximation
de la surface deréponse
par unplan,
dans larégion
considérée.L’application
de la méthode des moindres carrés conduit àl’équation
Le tableau 2 donne les valeurs observées et calculées de y aux
points expéri-
mentaux
(valeur
moyenne pour lepoint 1)
ainsi que le tableaud’analyse
de la va-riance
correspondant
aux tests suivants faits sousl’hypothèse
de normalité de l’erreurexpérimentale :
1)
Validité del’ajustement
d’une fonction dupremier degré,
que l’on teste parcomparaison
du carré moyen résiduel autour de larégression,
à la variance derépétition.
2) Signification
de l’influence linéaire de l’ensemble des variablesxi
etx2’
qu’on
a testé parcomparaison
du carré moyen dû à larégression
à la variance derépétition.
Figure
2Position des
points expérimentaux (entre parenthèses
valeurs du rendementy)
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
27 TABLEAU 1
TABLEAU II
1ère
grille d’essaisMoyenne des 4 résultats obtenus.
Tableau d’Analyse de Variance
obtenu quand on remplace les 4 résultats du point 1 par leur moyenne
Equation du modèle
(1) Par comparaison avec la variance expérimentale basée sur 3 d.d.l.
Revue de Statistique Appliquée, 1979, vol. XXVII, no 4
28
Si on trouvait que dans le domaine de variation considéré
x 1
et x2 n’avaient pasd’influence,
il faudrait en effet leur donner des variationsplus importantes.
On notera
qu’un
tel résultat n’est pasimpossible puisque
si on s’estplacé
d’embléeau
voisinage
del’optimum,
lesplans tangents
à la surface deréponse
y sont hori- zontaux.On notera que la contribution des résultats
yj=l,2,3,4
obtenus aupoint
1 à la somme des carrés résiduellepeut
s’écrire :avec
YI
moyenne desy1j
Ceci
justifie
la détermination des coefficients derégression
et de la sommedes cacrrés
résiduelle, amputée
de celle due auxrépétitions
enremplaçant
lesylj
par leur moyenne
YI
comme on l’a fait au tableau 2.Expression
descoefficients
derégression
d’un modèle dupremier degré
dans unplan
factoriel2
avec centre(k > 2).
On suppose que le centre est
pris
pourorigine
des coordonnées.Ce modèle est
orthogonal
par rapport à la constante et aux variablesxi’
cequi permet
de calculer les coefficientsbi
comme desrégressions
totales.On a donc
bo
=y
moyennegénérale
des observationsyj, j
=1, 2,...,
n,pour i ~ 0 peut se calculer en omettant les résultats correspon-
dant au centre
puisqu’alors
xi = 0.Compte
tenu de ce que tous lesx.
non nuls ont même valeur absoluexi+
désignent respectivement
les1 T
moyennes des
yj correspondant
Quant
à la somme des carrés due à larégression
c’est :Le
plan
factoriel2k (ou
fractional factorial2k-p
si k estgrand)
avec centrereprésente
donc une solutionparticulièrement
commode et peu coûteuse pourl’ajustement
d’un modèle du1 er degré
et pour tester la validité de ce modèle enprocédant
à un certain nombre derépétitions
au centre.Revue de Statistique Appliquée, 1979, vol. XXV II, n° 4
29
Les valeurs observées au centre n’interviennent
(par
leurmoyenne)
que dans le calcul du terme constantb 0
et de la somme des carrés résiduelle à comparer à la variance derépétition.
Par ailleurs en l’absenced’expérience
au centre, la somme de carrés résiduellereprésente
la contribution des seules interactions entre les facteurset par suite des seuls termes
rectangles biQ xi XQ’
i =1= Q si le modèle derégression
étaitdu
2e degré
au lieu d’être du1er degré.
L’introductiond’expériences
au centre per- met de faire intervenir l’effet de la sommebii
des coefficients des termes enx2i.
Utilisation de la
représentation
dupremier degré
pour améliorer lerendement ; 2e grille
d’essaisDans cette
représentation
les isorendements sont des droitesparallèles d’équa-
tion
0,2594
Xi 20130,3659
x2 = constante. C’est par suite en sedéplaçant perpendi-
culairement à cette
direction,
c’est-à-direparallèlement
au vecteur decomposantes 0,26
et -0,36 (plus généralement parallèlement
au vecteur decomposantes b 1 et b2,
oub 1, b2, ... , bk
s’ily a k
variablescontrôlées) que q
a des chancesd’augmen-
ter le
plus.
Lepoint (x1, x2, y*)
sedéplacera
alors en effet sur uneligne
deplus grande
pente duplan représentatif
de la surface deréponse.
Un tel
déplacement
àpartir
del’origine
conduirait auvoisinage
dupoint
3qui
est celui
qui
a donné laplus grande
valeur observée de y. Cepoint
estdéjà
suffisam-ment loin de
l’origine
etproche
de la base dutriangle
pourqu’on
ait envied’explo-
rer ses abords. Dans un souci
d’économie,
on a décidé de faire une nouvelleexpé-
rience avec des
points expérimentaux réparties
au sommet d’un carré centré sur lepoint
3 dont le résultat sera utilisé dans ledépouillement
de cetteexpérience,
maisdont le côté est moitié du
précédent.
Lespoints expérimentaux 6, 7, 8,
9 et les résultats obtenus sontreprésentés
sur lafigure
2. Leurs coordonnéesfigurent
autableau 2 et les valeurs obtenues pour y sont les suivantes :
Il
apparaît
immédiatementqu’un
modèle dupremier degré,
donc additifpar
rapport
aux effets de xl et x2 nepeut
pasreprésenter
les résultats obtenuspuisque
la différence y9 - y8 devrait être sensiblementégale
à y6 - y7 étantdonné que toutes deux
correspondent
à une même variation dexl
seule.Ceci est confirmé par les résultats du tableau 3 où
l’analyse
de la variancedonne un carré moyen très
significativement supérieur
à la varianceexpérimen-
tale estimée dans la
première
série d’essais.Les résultats obtenus montrent
qu’on
atteint unerégion
où la surface de ré- ponse nepeut plus
êtrereprésentée
par unplan
et où onpeut
par suiteespérer
quese trouve un maximum. Pour
pouvoir ajuster
unpolynome
dedegré
deuxqui comporte
6coefficients,
il fautprocéder
à des essaissupplémentaires.
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
30 TABLEAU III
2ème
grille d’essaisEssai d’ajustement d’un modèle du premier degré
Tableau d’Analyse de Variance
(1) Par comparaison avec la variance expérimentale de la lère grille d’essais soit 2,47 basée sur 3 d.d.l.
TABLEAU IV
3ème
grille d’essaisAjustement d’un polynôme du deuxième degré
Tableau d’Analyse de Variance
( 1 ) Par comparaison avec la variance de l’erreur
expérimentale
de la1ère
grille d’essais soit 2,47 basée sur 3degrés
de liberté.Equation du modèle
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
31
Ceux-ci seront
organisés
en tenantcompte
de ce que la2e
série d’essais montre nettement que le rendement estplus
élevé en 6qu’en
3 et en7,
alors que laprojection
de laligne
deplus grande pente
duplan ajusté
à lapremière
série d’essaispassant
par lepoint 3,
passeplus près
de 7 que de 6.Troisième
grille
d’essais :Cette 3e série d’essais doit
permettre d’explorer
levoisinage
dupoint
6 et dereprésenter
la surface deréponse
par unpolynome
dedegré
2.Chaque
variable doit doncprendre
au moins 3 niveaux. On tiendracompte
pour la définir des contraintes suivantes :- utilisation au maximum des résultats
précédents (essais
3 et6) ;
- inclusion de
points
se trouvant sur la limite du domainepossible
c’est-à-diresur la base
Fe03 - Te03
dutriangle (catalyseur
sansmolybdène : z3
=0).
Le désir d’avoir des calculs
simples
conduit àadopter
unplan
factoriel32
à modalitéséquidistantes
pourxl
d’une part et pourx2
de l’autre.On sait que les coefficients de
régression
et les sommes de carrés correspon- dantespeuvent
être déterminéssimplement
en introduisant despolynômes
ortho-gonaux par
rapport
aux variablesx Pl
etxP2 correspondant
à x1 et x2
mais centréessur le centre du
plan.
La troisième
grille
d’essaiscorrespond
ainsi auxpoints 10, 11, 12, 13, 14, 15, 16, 17, 3
de lafigure
2qui
constituent les sommets d’unrectangle,
les milieux des côtés et le centre durectangle.
Le centre 14 de ce
rectangle
estpris
commeorigine
des axesx et
plx ,
2 et les demi côtés durectangle
sontpris
comme unités delongueur
cequi simplifie
encore les
expressions
des coefficients derégression.
On obtient ainsi le tableau de données et de résultats suivant :Les valeurs
correspondantes
dexj, X2’ Z1, z2, z3
sont donnés au tableau 1.Le modèle du second
degré ajusté
est :Revue de Statistique Appliquée, 1979, vol. XXV 11, n" 4
32
Le tableau 4 montre
qu’il représente
les résultats obtenus defaçon
satisfai-sante
puisque
le carré moyen résiduel n’est passignificativement supérieur
à la va-riance
expérimentale
estimée dans lapremière grille
d’essais.On voit aussi que la
différence ly
obs - ycalc |
nedépasse
pas2,40
alors quel’écart-type
résiduel 0 est de l’ordre de1,6.
Elle est très inférieure à 2 (JB/2qui
représente
l’erreur à 95 % sur cette différence.Sur ce modèle du second
degré,
l’extremum est défini par :soit
dont la solution est
avec
y* = 46,57.
Les valeurs de
xl , x2
ety*
sont trèsproches
de celles de l’essai 14[9,5 - 23,59, 46,9] qu’on peut
donc retenir commereprésentant
la formule cata-lytique optimale.
Lafigure
3reproduit
un tracé de courbes isorendements dans lesystème (Xp 1 , xp2 )
déterminées àpartir
del’ajustement
du seconddegré (ce
sontdes
ellipses homothétiques).
Cette méthode de tracé des isorésultantes au
voisinage
del’optimum
est lameilleure dans le cas de deux variables pour avoir une idée de la forme de la surface de
réponse
dans cevoisinage, quand
ondispose
d’un traceur de courbes.Dans le cas de
plus
de deux variables ilpeut
être intéressant de mettre la formequadratique
du2e
membre sous sa formecanonique
pour étudier la forme de la surface deréponse.
On trouvera dans(1)
unexemple
dans le cas de 2 variables et dans[(2)
p.362]
une discussiongénérale
dans le cas de 3 variables.En conclusion la formule
catalytique proposée
a été :1
ces
pourcentages
étant ceux de laphase
activequi représente
50%
dupoids
ducatalyseur.
3. - COMMENTAIRES SUR LA METHODE 1.
Etapes
dedégrossissage
1.1. Comme on l’a
déjà dit,
il est nécessaire de tester non seulement la validité d’unajustement
dupremier
ordre mais aussi lasignification
de l’ensemble des coef- ficients03B2i ,
i ~ 0. Si leplan représentatif
de la surface peut être considéré commehorizontal,
la direction de laligne
deplus grande pente
estimée n’a en effetplus
Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
33 Figure 3
Les Numéros entre
parenthèses
sont ceux desexpériences.
A côté figurent les rendements obtenusd’intérêt. Si l’ensemble des
bi
est nonsignificatif
il faut selon les cas augmenter le pas de variation desxi,
ou passer àl’approximation
par unpolynôme
d’ordre deuxqui
donnera unereprésentation plus
exacte de la surface deréponse.
1.2. Dans
l’exemple précédent
lepoint
3 était assezéloigné
de 1 et assezproche
d’une limite du domained’expérimentation
pourqu’on
nepoursuive
pasplus
loinl’exploration
lelong
de laprojection
de laligne
deplus grande
pente dé- terminée par lespremiers
essais. Dans bien des cas, on réalise 2 ou 3 essais succes-sifs dans cette direction et ce n’est que
quand
on a obtenu une diminution de y montrant que larégion
del’optimum
estdépassée qu’on
s’arrête pourorganiser
une deuxième série d’essais autour du meilleur
point
retenu.2.
Etapes d’exploration
2.1. Là encore il est nécessaire de tester la validité de
l’ajustement
dudeuxième ordre trouvé et, si elle n’est pas évidente la
signification
de ses termesdu
2e degré.
Par ailleurs si la
position
déterminée pourl’optimum
se trouve en dehorsde la
région explorée,
il est néessaire deprocéder
àquelques expériences
danscette
région
pour s’assurerqu’on
a effectivement des résultats au moins meilleurs que ceux obtenus dans larégion explorée,
car il ne faut pas oublier que la for-Revue de Statistique Appliquée, 1979, vol. XXVII, n° 4
34
mule
polynomiale
trouvée seprête
engénéral
très mal àl’extrapolation. (Elle
nedonne
qu’une représentation
locale de la surface deréponse).
Le mieux est doncde recommencer une série
d’expériences
suffisante pour permettre à nouveaul’ajustement
d’unpolynôme
du deuxièmedegré
et la détermination de laposition
del’optimum.
2.2. Plan
d’expérience
pourajuster
un modèle du2e
ordreLes
plans
factoriels3k
seprêtent
très bien àl’ajustement
de tels modèles surtoutquand
les 3 niveaux sont codés -1,
0 et1,
mais dès que k estsupérieur
ou
égal
à 3 cela faitbeaucoup
d’essais pour le nombre de coefficients à déterminer(10
pour k =3,
15 pour k =4),
bienqu’on puisse
réduire ce nombre en utilisantdes
plans
fractional fractorial. Par ailleurs Box et Wilson ont montré que les coeffi- cients des termes carrésoit
étaient estimés avec uneprécision
assez faible.Ces auteurs ont
proposé
de nouveauxplans spécialement adaptés
àl’ajus-
tement de modèles du
2e
ordre. Leurspremiers plans appelés "composite designs"
sont
construits enajoutant d’autres points
à ceuxcorrespondant
à unplan
factoriel2k.
Si dans leplan
factoriel2k,
les niveaux dechaque
variablesxi
sont codés - 1et r 1 les nouveaux
plans
sont les suivants :"Central
composite designs" :
Onajoute
les(2k
-t1 )
combinaisons :ce
qui
conduit à(2k
+ 2 k +1)
combinaisons. Pour k =2, 3, 4
cela donne9,15
et 24 essais au lieu de
9,
27 et 81 dans lesplans 3k .
La valeur de a peut être choisie pour rendre les coefficients de
régression orthogonaux,
ou pour donner auplan
lapropriété
d’être"rotatable",
cf. définitionplus
loin.Le
plan
peut être réalisé defaçon séquentielle,
lapremière séquence
étantla réalisation du
plan
factoriel2k
etl’ajustement
d’uneréponse
du 1 er ordre.Si cet
ajustement
n’est pas satisfaisant et si il semble que le centre del’expé-
rience soit
proche
del’optimum
onajoutera
les 2k + 1 essais nécessaires pour créer le centralcomposite design.
Ceci supposequ’il n’y
ait pas d’influence du tempsqui
modifie le niveau de y entre la1 ère
et la2ème expérience.
Si on craintune telle modification on réalisera une
expérience
en blocs(cf.
références 1 et2).
Le résultat du
plan 2k
peutsuggérer
quel’optimum
estplus proche
d’unedes combinaisons que du centre. Dans ce cas on pourra utiliser un "non central
composite design". (cf.
référence2).
Plans rotatables
(cf. 2) :
Le critère de rotatabilité a étéproposé
par Box et Hunter.Supposons
quel’origine
soit le centre de larégion explorée
et soitRevue de Statistique Appliquée, 1979, vol. XXV II , n° 4
35
la valeur estimée de 11 au
point (x,u,
i =1, 2, ... , k).
Onpeut exprimer 02(y u)
en fonction de
a 2 variance expérimentale
des xiu et des coordonnées despoints expérimentaux.
""’-
Dans un
plan rotatable, a 2 (yu)
est le même pour tous lespoints {xlu } qui
k
sont à la même distance
p2 = 03A3 x2iu
du centre.i=1
Cette
propriété d’isotropie
de laprévision
de yparaît
raisonnable.Avec deux variables on obtient des
plans rotatables,
enrépartissant
les essaisen n2
points régulièrement espacés
sur un cercle centré surl’origine
et enprocé-
dant à ni essais au centre.
Comme il y a 6 coefficients à
déterminer,
leplus petit plan correspond
àn2 = 5, n1 = 1.
Les
répétitions
d’essais au centre ont deux buts : elles donnent(ni - 1) degrés
de liberté pour estimer l’erreurexpérimentale
et définissent laprécision
de y au centre et dans son
voisinage.
S’il y a
plusieurs répétitions
au centre,o(y)
y est faible maisaugmente rapi-
dement
quand
on s’en écarte. Au contraire avec un ou deux essais au centreo(y)
peut
êtreplus grand
au centrequ’en
despoints
tels que(1, 0)
ou(0, 1) -
Box etHunter
suggèrent
que le nombre desrépétitions
au centre soit choisi defaçon
àce que
o(y)
soit sensiblement le même au centre et sur le cercle de rayon 1. Dansce cas
o(y)
reste sensiblement constant en tous lespoints
à l’intérieur de ce cercle.Les
plans
rotatables lesplus
usuels sont aussi des centralcomposite désigns.
Avec k = 2 on obtient le
plan
ci-dessous avec n2 =8,
n 1 = 5.Il peut être
décomposé
en 3parties.
1)
Les 4points (-l, 1), (1, - 1), (- 1 ; - 1), (1, 1)
d’unplan
factoriel22 ; 2)
Les 4points (-V2, 0), (VI, 0), (0,-VI), (0,2)
nécessaires pour former avec le centre un centralcomposite design.
Ici a =
B/T ;
3)
5points
au centrequi
donnent sensiblement la même valeur pouro(ÿ)
dans tout le cercle de rayon 1.
Revue de Statistique Appliquée, 1979, vol. XXVII, ri 4
36
Pour k >
2,
onpeut
construire des centralcomposite designs
rotatables sui- vant le mêmeprincipe.
On doitprendre
a = 2k/4 pour que leplan
soit rotatable.On trouvera dans
(2) l’analyse statistique
duplan
ci-dessus pour k = 2 et dans(1) l’analyse
du mêmeplan
avec ni = 4répétitions
au centre au lieu de 5puis
ladescription
de centralcomposite designs
rotatables etorganisés
en blocspour k
=3, 4, 5.
QUELQUES
REFERENCESRevue de Statistique Appliquée, 1979, vol. XXVII, n° 4
[1] HUNTER (J.S.). -
Someapplications
of statistics toexperimentation,
Chemicalengineering
progressSymposium series,
vol.56, n° 31, p. 10-26 (1960 ?).
Un