R EVUE DE STATISTIQUE APPLIQUÉE
J. R AGOT M. A UBRUN
Application de la régression orthogonale sous contrainte linéaire à un problème d’équilibrage de bilan-matière
Revue de statistique appliquée, tome 30, n
o2 (1982), p. 45-56
<http://www.numdam.org/item?id=RSA_1982__30_2_45_0>
© Société française de statistique, 1982, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
APPLICATION
DELA REGRESSION ORTHOGONALE SOUS CONTRAINTE LINEAIRE A UN PROBLEME
D’EQUILIBRAGE DE BILAN-MATIERE
J. RAGOT et M. AUBRUN
RESUME
Après
avoirrappelé
leproblème
de l’estimation desparamètres
à partir de mesures bruitées, on traite le cas particulier des modèles linéaires avec et sans contraintes sur les para- mètres.On applique cet estimateur à la résolution d’un
problème d’équilibrage
de bilan-matière pour un système industriel.La
plupart
dessystèmes physiques
sont caractérisés par un certain nombre de variablesmesurables;
chercher un modèlequi représente
ce processus consiste à déterminer une relation entre :- une variable à
expliquer
Y*(ou
variabledépendante),
- n variables
explicatives Xr (ou
variablesindépendantes).
De
façon globale Y*, X*1, ... X*n
sont des vecteurs colonnes dont les compo- santes sont les valeursprises
par les variablescorrespondantes
lors d’observations effectuées sur lesystème.
Lorsque
lesystème
est considéré commelinéaire,
le modèle est mis sous la forme :avec:
et où:
Pratiquement,
lesgrandeurs
X* et Y* sont inaccessibles: on nedispose
en effet que de mesures X et Y de cesgrandeurs,
telles que :ey
et e , matrices de dimensionsrespectives ;
N. 1 et N. nqui représentent
leserreurs
de
mesure. La relation(1)
se traduit par:où Xa traduit la liaison fonctionnelle introduite par le modèle et e =
~y - fxa
les"fluctuations" dues aux erreurs de mesure.
-
Comment alors estimer les
paramètres
a ?La méthode la
plus simple
consiste à rendre la norme du vecteur e minimale : cettefaçon
deprocéder
revient àreporter
sur la variable àexpliquer
y toutes leserreurs de mesure, ce
qui
revient à chercher la loi conditionnelle de lavariable,
àexpliquer
connaissant les variablesexplicatives.
Une méthode
plus générale
consiste à tenircompte
simultanément des erreurs sur les variablesXi
et Y : cette solution estprésentée
ici etporte
le nom d’estima-tion des moindres carrés étendus.
1. L’ESTIMATION DES MOINDRES CARRES ETENDUS
(REGRESSION ORTHOGONALE)
1.1. Formulation
algébrique
de l’estimationComme les erreurs de mesure affectent simultanément toutes les
variables,
on ne fait pas de distinction de notation entre la variable à
expliquer
et les variablesexplicatives.
Soit:
W* la matrice
(N,
n +1)
desgrandeurs
réellesW la matrice
(N,
n +1)
desgrandeurs
mesuréesoù on a
placé
les vecteursY*,
Y et Y(estimation
deY)
en dernière colonne.Le
système physique
est décrit par la relation linéaire :W* A* = 0
(3)
où le vecteur A* des
paramètres
est de dimension(n + 1).
Le
problème qu:on
se propose de résoudre consiste donc à déterminer les esti- mateursÂ
de A* etW
de W*qui
minimisent la somme des carrés des écarts entre l’estimation et la mesure : -sous la contrainte :
Il correspond
en fait à la méthode usuelle connue sous le nom derégression orthogonale (cf. paragraphe 1.4) ;
onpeut
le résoudre en recherchant l’extrémum duLagrangien :
où 03BB est le
paramètre
deLagrange
tel que À ERN.
La solution est la suivante :
-
Â
est le vecteur propre deWT
W associé à saplus petite
valeur propre(qu’on
désigne
pars) :
- La matrice des estimations des
grandeurs
réelles est :- Le critère résiduel est
égal
à :1.2. Cas du modèle
explicite
Il
peut
être intéressant de différencier les variablesexplicatives
de la variable àexpliquer
en utilisant lespartitions
suivantes :avec:
L’équation
aux valeurs propres(WT W - sI) À = 0
sedécompose
sous laforme:
où:
Quelques
transformations élémentaires de ces relations donnent enparticulier:
Ces formes sont à comparer à celles que l’on obtient en effectuant la
régres-
sion usuelle de la variable y par
rapport
aux variables X :1.3.
Propriétés
des écarts- Les écarts E = W -
W s’expriment
avec la définition(8)
des estimations sous la forme :- Les écarts E sont
orthogonaux
aux estimés :- Somme des carrés des écarts
(SCE).
Compte
tenu de(9),on
a :En notant par :
SCM la somme des carrés des mesures = Tr
(WT W)
SCR la somme des carrés des estimées = Tr
(WT W)
on a: SCM = SCR + SCE
(19)
Comme dans le cas de la
régression
de y parrapport
à X onpeut,
pour cet estimateurétendu,
définir un "indice dequalité"
du modèle par R tel que :1.4. Formulation
géométrique
On
représente
dansl’espace
des variables les observationsPi (i = 1,
...N).
L’hypothèse
du modèle linéaire se traduit par l’existence d’unplan
H devecteur normal unitaire u
représentatif
du nuage depoints
constitué par les obser- vationsP..
1L’équation
duplan qui représente
le nuage est donnée par les cosinus direc- teurs de u, que l’onpeut
parexemple
obtenir en minimisant la somme des carrés des distances des mesuresP.
à ceplan (ce qui correspond
à larégression orthogonale,
larégréssion
usuellerevenant
à minimiser la somme des carrés des écartsparallèlement
à l’axe Wn+1).
Si
W est
laième ligne
de la matrice des mesuresW,
donc formée par les com-posantes
dupoint Pi, W. u
est la distance de cepoint
auplan (P. H.).
Pour l’ensemble despoints,
la somme des carrés des distances auplan
H est :cp =
IIWul12
Le vecteur unitaire u
qui
minimise 03A6 est le vecteur propre deWT
W associé àsa
plus petite
valeur propre, la valeur de 4) étantégale
à cette valeur propre.2. CAS AVEC CONTRAINTE SUR LES PARAMETRES
Dans certains
problèmes,
lesparamètres
des modèles sont liés par des relationsparfaitement
connues ; on examine ce cas en le limitant aux contraintes detype éga-
lité mise sous la forme :T.A = O où
dim. de T = p(n + 1) (21)
avec:
p n +
1rang T = p
Soit P le
projecteur
dansRn+ 1
sur le sous-espaced’équation
TA = 0P = 1 - TT (TTT)-l T
Si l’on pose W* = W
P, on
est ramené auproblème précédent.
AinsiA
est vecteur propre de la matriceW*T
W* associé à saplus petite
valeur propre.Il faut remarquer la nature
singulière
de la matrice Pqui
est de dimension(n
+1) (n
+1),
mais de rang p; pour cetteraison,
la matriceWT W*
estégale-
ment
singulière
et ses p dernières valeurs propres sont nulles.Pour éviter cette
singularité, il
suffit de réduire la dimension duproblème
initial en ne
prenant
encompte
dans le vecteur A que lescomposantes indépen-
dantes. A cet
effet,on
utilise lespartitionnements :
La contrainte sur les
paramètres s’explicite
alors :et le modèle :
Le
Lagrangien (6)
s’écrit alors :Il est extrémal
quand :
En
posant :
on obtient :
Avec la
décomposition :
et les
changements :
l’équation (30) prend
la forme :Ainsi
B
1 est vecteur propre de la matriceWT W
et comme le montre l’examen ducritère,il
est associé à laplus petite
valeur propre de cette matrice.3. APPLICATION A UN PROBLEME DE BILAN-MATIERE
Le
problème
del’équilibrage
des bilans-matière estlonguement exposé
dansla littérature
spécialisée.
On ne
rappelle
ici quequelques
définitions élémentaires àpartir
d’unexemple
très
simple
décrit par lafigure
1.Les
Qei représentent
des flux d’entrée d’unproduit
ou d’uneénergie,
lesQsi
les flux de sortie.L’équation
de ces bilans s’écrit :FIG. 1. - Bilan
massique
d’unsystème simple
D’une
façon générale,
un bilantraduit,
pour unsystème
enéquilibre,
desconservations de masse, de
débit, d’énergie.
Ainsi pour lesystème
de lafigure 1, supposé
enéquilibre,
on a écritl’égalité
de la somme des débits entrants et celle des débits sortants; enréalité,
laprésence
d’erreurs de mesuredéséquilibre
cetteéquation
de bilan.Equilibrer
un bilan consiste donc à détecter au mieux ces erreurs et à endéduire une estimation des
grandeurs
vraiesqui, elles,
vérifient leséquations
debilan.
Dans la suite on ne considère que le cas d’erreurs de mesures considérées
comme des réalisations de variables
aléatoires, centrées,
non corrélées entre elleset de fonction de
répartition gaussienne.
Pour le
type
desystème
schématisé à lafigure 1,
on est trèsfréquemment
confronté au
problème
suivant :chaque
flux de matière estcaractérisé,
enplus
de son débitQi,
par les con-centrations C.. en différents constituants
(j
=1, ... c) (où
c est le nombre de cons-tituants
considérés).
En
régime d’équilibre,on
doit avoir pour lesgrandeurs
vraies :qui expriment
la conservation des débits totaux et des débits par constituants(les
débits entrants sont
comptés positivement
et les débits sortants,négativement).
En
général,
sur de telssystèmes,
ondispose
des mesures en concentrationCij (obtenues
paranalyse chimique
sur deséchantillons,
ou enligne,
par desanaly-
seurs à fluorescence fonctionnant de
façon quasi instantanée); par
contre, il est trèsrare de
disposer
de toutes les mesures de débitQi
pour des raisonstechnologiques (produits trop visqueux
outrop chargés
enair).
On seplace
dans cetteconfigura-
tion où la matrice des observations W est constituée par les mesures
Cij
et où levecteur A des
paramètres
est constitué par les variables débits.Les
équations (33)
et(34)
se reformulent :Le
problème d’équilibrage
de bilan-matière se formule ainsi :déterminer
l’esti-mateur
(W, Â)
de(W*, A*) qui
minimise la somme des carrés des écarts :sous les contraintes :
La solution de ce
problème
a été donnée auparagraphe
2.Compte
tenu de laforme
particulière
de la contrainte(33),
on a ici :qui
separtitionne, compte
tenu des notations duparagraphe 2,
en :On évalue P
(équation 29) :
(où T
est un vecteurligne
de dimensionn), puis
sa factorisation(équation 31)
enposant :
(où
h est un vecteurligne),
d’où:
Comme
hhT
est unscalaire,on
obtient :qui
montre que h etT1
sontcoplanaires.
Dans
(43),si
l’on pose h =aT1
on a:d’où:
La matrice H est donc entièrement définie par
(43), (44)
et(45).
Pour
expliciter (31 ), il
faut calculerH-1 ;
un calculclassique
montre que si:alors:
En
définitive,
àpartir
de la matrice d’observation W =(W1 W2),
laprocédure
de calcul est la suivante :
- Recherche du vecteur propre
B de W 1
W associé à saplus petite
valeur propre(32)
- Calcul de
A,
=H-1B
1(équation 31)
Calcul de
A2 - - T2 1 Ti Al (équation 25) Exemple : Equilibrage
de bilans-matière sur unséparateur.
Dans les circuits de traitement de
minerais,le séparateur
classe lesparticules
en deux
catégories :
celles suffisammentpetites
pour être utilisées par lesétages
depurification
ou d’enrichissement et cellesqui
doivent subir un retraitement méca-nique (broyage).
Un telséparateur
est schématisé à lafigure 2 ;
on ydistingue
lavoie d’entrée ou alimentation et les voies de sortie
désignées
par surverse(fines
par-ticules)
et sousverse(grosses particules).
Pour
repérer
la taille desgrains
dans unéchantillon,
on définitgo le
pourcen-tage
en masse desgrains
dont la taille t estcomprise
entre t. ettj+1 (les
valeurs dest. sont standardisées);
les débitsmassiques
de solides sontdésignés
par la lettreQ.
En
régime d’équilibre,
lesgrandeurs
vraies doivent vérifier leséquations
debilan-matière:
où
représente
le nombre de "tranchesgranulométriques".
Fig.
2. -Séparateur
Dans la
pratique,
on définit souvent le coefficient departage
du débit ouencore le rendement
poids :
Compte
tenu de la relation de conservation desdébits,
on a :l’équation
de conservation des débits par tranchegranulométrique
s’écrit :Ainsi,
le rendementpoids
r*peut
s’évaluer par :On se
place
dans le cas où seules les mesures degranulométrie
sont acces-sibles. La relation
(51), appliquée
à des mesuresgij,
donne engénéral
des estima- tions aberrantes(par exemple supérieures
à 1 oude signes variables).
Le tableau 1est relatif à des mesures effectuées sur un
hydrocyclone
Krebs de 4 pouces; les troispremières
colonnes donnent lagranulométrie
mesurée àl’alimentation,
laTABLEAU 1 Mesures et rendement poids
calculé par la formule
(51).
Le tableau 2 donne les estimationsgranulométriques
obtenues
après "équilibrage"
des bilans-matière enappliquant l’algorithme
desmoindres carrés
étendus ;
comme pour le tableau des donnéesmesurées,
le qua- trième colonneindique
le rendementpoids
dont les différentes estimations sont maintenantparfaitement
cohérentes.TABLEAU 2 Mesures et rendement poids
CONCLUSION
L’estimateur des moindres carrés étendus est fondé sur
l’hypothèse
demesures toutes affectées
d’erreurs,
sansdistinguer
la variable àexpliquer
des varia-Outre
l’approche plus
réalistequant
à larépartition
des erreurs, sa mise enoeuvre est
simple puisque
les calculs ne fontappel qu’à
un programme standard de recherche de valeur et vecteur propres.Enfin,
laportée
de cet estimateur a été étendue au traitement de cas où l’on doitprendre
encompte
des contraintes linéaires sur lesparamètres.
BIBLIOGRAPHIE
[1]
J. BRENOT(1977). 2014
Contribution à lapratique
du modèle linéaire :qualité, protection
et estimation biaisée. Thèse de3e Cycle, Paris,
88 pages.[2]
H.J. BRITT and R.H. LUECKE(1973). -
The estimation ofparameters
in non-linearimplicit
models.Technometrics,
vol.15, n° 2,
p. 233-247.[3]
D.MARQUARDT (1970). -
Generalizedinverse, ridge regression,
biasedlinear estimation and non linear estimation.
Technometrics,
vol.12, n° 3,
p. 591- 612.[4]
D.R. POWELL and J.R. MacDONALD(1972). 2014
Arapidly convergent
itera- tive method for the solution of thegeneralized
non-linearleast-squares
pro-blem,
TheComputer Journal,
vol.15,
p. 148-155.[5]
W.H. SOUTHWELL(1969). - Fitting experimental
data. J.of Comp. Phys.,
vol.
4,
p. 465-474.[6]
W.H. SOUTHWELL(1976). - Fitting
data to non-linear functions with uncer-tainties in all measurement variables. The
Computer Journal,
vol. 19.n° 1,
p. 69-73.
[7]
W.J. WHITEN(1977). - Multiple
curvefitting.
Internationalreport n°
84.Julius Kruttschnitt Mineral Research Centre.