R EVUE DE STATISTIQUE APPLIQUÉE
P. C AZÈS P. Y. T URPIN
Régression sous contraintes : application à l’estimation de la courbe granulométrique d’un aérosol
Revue de statistique appliquée, tome 19, n
o4 (1971), p. 23-44
<
http://www.numdam.org/item?id=RSA_1971__19_4_23_0>
© Société française de statistique, 1971, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
RÉGRESSION SOUS CONTRAINTES APPLICATION A L’ESTIMATION
DE LA COURBE GRANULOMÉTRIQUE D’UN AÉROSOL
P. CAZES
(1) etP. Y. TURPIN
(2)Pages
I - INTRODUCTION 25
II - FORMALISATION
MATHEMATIQUE
DU PROBLEME. INTER-PRETATION
GEOMETRIQUE ...
251 - Formalisation ... 25
2 - Etude
géométrique...
262.1 -
Interprétation géométrique ...
262.2 -Application...
262. 3 - Cas
particulier
d’une seule contrainte : les coef- ficients derégression
doivent êtrepositifs
Coefficient de corrélationmultiple
sous contrainte 27 2. 4 - C asgénéral
28 III - ETUDEALGORITHMIQUE
... 291 - Méthode de Wolf e ... 30
2 - Méthode de
d’Esopo
... 313 - Cas où la somme des coefficients de
régression
vaut un 31 IV - EXEMPLES D’UTILISATION DE LA REGRESSION SOUS CON- TRAINTES... 321 - Problèmes de
régression
où la variable àexpliquer
estpositive
32 2 - Problèmes derégression
entre variablespositives ...
33(1) Laboratoire de Statistique mathématique, ISUP, Université de Paris 6 (2) Laboratoire de Physique des Aérosols, Université de Paris 6
Pages
V - ESTIMATION DE LA COURBE
GRANULOMETRIQUE
D’UNAEROSOL ... 33
1 -
Montage expérimental
34 2 - Détection... 343 -
Interprétation
des mesures ... 354 - Résultats... 36
VI - CONCLUSION ... 44
I - INTRODUCTION
Dans un certain nombre de
problèmes économiques, physiques, géolo- giques, statistiques,
etc... , on nepeut toujours appliquer
directement la méthode des moindres carrés pourexpliquer
une variable y en fonction d’au- tres variables xi, X2’...xp.
C’est le cas si les coefficients derégression b i, b2, ... bp,
-ou les valeursapprochées
des observations de y- doivent êtrecomprises
entre des bornes données pour avoir un sens,compte
tenu duproblème
traité. On a alors affaire à desproblèmes
derégression
souscontraintes,
c’est-à-dire desproblèmes
deprogrammation quadratique.
Après
la formulationmathématique
duproblème
que l’on vient d’ex- poser, nous,en
donnons uneinterprétation géométrique,
avant derappeler
les
techniques classiques
deprogrammation quadratique,
de donner unalgo-
rithme dans le cas où les coefficients de
régression
doivent êtrepositifs ,
tet dans le cas où on estime une loi de
probabilité.
Nous citerons
quelques exemples
où cestechniques
derégression
souscontraintes
s’appliquent,
avantd’exposer plus
en détail les résultats obtenus lors de l’estimation de la courbegranulométrique
d’un aérosol.II - FORMALISATION
MATHEMATIQUE
DU PROBLEME ET INTERPRETA- TIONGEOMETRIQUE
1 - Formalisation
Soient y, xl, X2, xp, p + 1 variables
(aléatoires
ounon)
dont on pos- sède un n-échantillon :{ y~, x 1, ... x~ 1 j =
1,n} :
on se propose"d’expli- quer"
y en fonction des x ; au sens des moindrescarrés,
i. e. on recherche la combinaisonlinéaire E { bi Xi 1
i =1, p }
telle quesoit
minimum,
sous les contraintessupposées compatibles :
Ces contraintes
peuvent
ne pas êtreindépendantes,
c’est enparticulier
le cas si l’on a affaire à des variables
positives,
et si l’onimpose
aux coef- ficients derégression
d’êtrepositifs (ai =
a = 0 ;pi
=pi
= +0153 ; x~ ~ 0),
lescontraintes
(2) (b)
étant alorssatisfaites,
dès que le sont les contraintes(2) (a).
De
façon plus générale,
la donnée d’un n échantillon de p + 1 variables.. n -,, -,> -,> ~
y.
Xi, X2,xp
conduit à considérer p + 1 vecteurs deR
y,Xi,
X2 xp(y ayant
pourcomposantes : {yj j
=1, n},
et~i : {~ 1 j = 1, n} ) . Ayant
muni
e
de lamétrique(1)
N, et défini unvecteur z
tel que(1) i. e. une forme bilinéaire symétrique définie positive.
on désire minimiser la norme de ou son carré
sous les contraintes
(2).
2 - Etude
géométrique
2.1 -
Interprétation géométrique
D’après
II1, z
est donc laprojection (au
sens deN)
dey
sur le con-vexe fermé C défini par :
Cette
projection
estunique
et existetoujours, puisque
les contraintes(2)
n’étant pasincompatibles,
C n’est pas vide.Si les vecteurs
{xi 1
i =1, p }
sont linéairementindépendants,
ce que nous supposerons, ils forment une base du sous espace vectoriel Hqu’ils engendrent : z, qui appartient
à Hpuisque
C est contenu dansH,
a pour coordonnées parrapport
à cette base les "Coefficients derégression"
Ifqui
sont donc
uniques.
1Dans certains
problèmes,
enparticulier
dans l’estimation d’une me- sure deprobabilité discrète,
les coefficientsb’ ne
sont pasindépendants ,
et sont soumis à la contrainte :
ce
qui
revient àprojeter ÿ
sur le convexeCI (supposé
nonvide)
contenudans C et tel que
(4)
soit satisfaite. Nousdésignerons par z
1 cetteprojec-
tion.
2.2 -
Application
Figure 1
-+ -+
Soit
t la projection
de y sur le sous espace vectoriel Hengendré
par les{3~ ~ 1
i =1, p } : si 11 v11 [ désigne
la norme d’un vecteur deR°
Rendre
minimum
. ,""" """ 1 11
-+
pour v
parcourant C,
revient donc à rendreminimum H
t -v ~ ~ [
pour vparcourant C ;
ce minimumqui
est atteint pourl’égalité n’ayant
lieu que siappartient
à C.Par
ailleurs, si t n’appartient
pas à l’intérieurC
deC,
zappartient
à la frontière ÔC de
C,
car si ce n’était pas lecas, z appartiendrait
àC ,
et la droite
joignant 1 à z couperait ÔC
en unpoint ~’ plus proche de t (donc
de
~, d’après (5»
quez.
Les résultats
précédents peuvent
se traduire par le théorème suivant:a)
Laprojection z y
sur C n’est autre que laprojection
det
sur Cb) t
est unpoint plus proche
de Cque ÿ
c) Si î
EC, ~ = ~
etréciproquement
d)
Sit C,
alorsz
EÔC,
etréciproquement.
On a bien sdr des résultats
analogues
si onprojette
sur Ci.2.3 - Cas
particulier
d’une seule contrainte : les coefficients de ré-gression
doivent êtrepositifs.
Coefficient de corrélation multi-ple
sous contrainteDans ce cas, le convexe C se réduit au cône
positif
de H.Désignons
par H’ le sous espace vectoriel
engendré
par les vecteursXi
dont les coef- ficients derégression
sous contrainte sont strictementpositifs,
et par C’ le cônepositif associé : z qui appartient
àC,
etqui
est lepoint
leplus proche
de ÿ
dans C’(car
si ce n’était pas le cas, il existerait unpoint
deC’,
donc de Cplus proche
dey
quez)
est doncd’après
II 2. 2 confondu avec la pro-jection t, de ÿ
surH’,
d’où l’on déduit :Le théorème de
Pythagore
est donc encore valable.On posera :
On a donc :
Figure 2
Si les moyennes
empiriques
de y et des xi sontnulles,
ou si l’on aintroduit
parmi
les variables xi, la variable certaine etégale
à un, alorsR2
n’est autre que le carré du coefficient de corrélation
multiple empirique
clas-sique(l)
de la variable y parrapport
à celles des variables xiauxquelles
sont associés des "coefficients de
régression
sous contrainte"b
1 stricte- mentpositifs.
On
peut
dire que R est le coefficient de corrélationmultiple
sous con-traintes de y par
rapport
aux variables{Xi i
=1, p },
et il est bien sQr in-férieur au coefficient de corrélation
multiple classique Ro (2) (Ro = Il t Il /
Il Y Il)
de y parrapport
aux{Xi 1
i =1, p } , puisque
2.4 - Cas
général
Dans le cas où le convexe C est
quelconque,
on définittoujours R2 et S2 (R 2et S~,
si onprojette
surCI)
par les relations(7),
mais les relations(6)
et(8)
ne sont pas engénéral
vérifiées : RZ et mêmeS2,
si C ne contientpas
l’origine, peuvent
êtresupérieurs
à 1.En
pratique,
si le modèlecorrespond
à la réalitéphysique, S2 (ou S:)
est
toujours
inférieur à1 ;
R2(ou R 1 2) peut
êtresupérieur
à 1 du fait des fluctuationsd’échantillonnage.
Cela arrivequand
on a une bonneapproxima-
tion de y comme combinaison linéaire
(à
coefficientspositifs)
des xi.---
(1) En prenant bien sQr pour norme N la norme classique.
(2) Dans le cas de variables non centrées, ou d’une norme quelconque,
... _
sera appelé "qualité de l’approximation"
de ÿ
par les vecteursXi
pour la régres-sion sans contrainte.
III - ETUDE
ALGORITHMIQUE
La résolution du
problème
formulé au II 1, se ramène à celle d’un programme dont la fonction de coût à minimiser estquadratique
et convexe.Plusieurs
types
deprocédures
sontpossibles
pour trouver la solution.La
première
résulte de l’étudegéométrique
et revient àprojeter
le vecteury en t
surl’espace
Hengendré
par les vecteurs{~1 1
i =1, p }, puis
si t n’appartient
pas au convexe C(ou Ci
1 suivant lecas),
àproj eter ÿ (ou ti
suivant uneprocédure
itérative(cf.
réf.4)
sur les différentes faces de C,(puisque z projection
de3~
sur Cappartient
à la frontière deC).
Un autre
algorithme
estexposé
dans(5)
dans le cas où onexige
uni-quement
que les valeurs reconstituées soientpositives /
i. e.Nous allons
rappeler
brièvement lesprocédures
itérativesclassiques ,
en
particulier
celle dugradient
réduit de Wolfe et ses variantes,lorsqu’il n’y
a pas de contraintes sur les valeurs reconstituées(contraintes (2) (b),
ou s’il y en a
lorsque
ces contraintes sontvérifiées,
dès que le sont les contraintes(2) (a)).
Dans un
premier temps,
nous supposerons les coefficientsbi indépen- dants,
c’est-à-dire non soumis à la contrainte(4) ;
nous verrons comment modifier lesalgorithmes
dans le cas contraire.On cherche donc le vecteur
b
decomposantes {b 1
i =1, p},
minimi-sant la fonction
quadratique
convexede ~ :
sous les contraintes
Les
vecteurs X
étantsupposés
linéairementindépendants,
il y a commeon l’a vu une solution
unique.
La
procédure
itérative s’écrit à l’itération t + 1 :où
-
db
est le vecteur decomposantes {de 1 i =1, p },
caractérisant la direction dedéplacement,
et dontl’expression dépend
de la méthode utilisée.- 0 est déterminé de telle sorte que dans la direction considérée il minimise
Q
tout enrespectant
les contraintes(10)
pourbt+ 1 ;
lepoint
de
départ bi
est choisi defaçon
à ce que les contraintes soient vé- rifiées.Posons :
(p(0) qui
se met sous la forme :est un trinôme du second
degré ;
le coefficient de est strictement
positif :
passe donc par un minimum pour la valeur
....
Par
ailleurs,
en écrivant quebt+1
satisfait les contraintes(10),
on ob-tient pour e un
système d’inégalités
linéairestoujours compatibles, puisqu’il
est vérifié pour 0 = 0
(bt
satisfai sait les contraintes(10)~ ;
cesystème
dé-finit pour 8 un
intervalle (a,, 02) avec 0 1
082.
Figure 3
Si donc
eo
est à l’intérieur de cetintervalle,
on choisira e =80, sinon ,
si
60
estplus petit
que81, (p(9)
étant croissante dans l’intervalle(80, 82),
on
prendra 0=0~
et sieo
estplus grand que 02, (p(9)
étant décroissante dans l’intervalle(61, 0.),
onprendra 9 - 8 2 (cf. fig. 3).
1 - Méthode de Wolfe
Dans la méthode de
Wolfe,
on choisit comme direction dedéplacement :
ou
sinon
On a alors :
où A est un coefficient
positif.
Au
voisinage
de0 =0, m (6)
estdécroissante, eo
est doncpositif,
etsupérieur
à81 ;
on a donc :°
~ ~
Par
ailleurs,
si80 = 0,
i. e sidb (ou dz)
estnul,
on a atteint lepoint optimum, puisque
si l’on sedéplace
dans H surn’importe quelle
directionparallèle
auxXi,
on nepeut
pas diminuerQ,
saufpeut-être
en sortant de C .La suite
Q(bt)
étant strictementdécroissante,
et bornée par0,
con- verge ;l’algorithme
est doncconvergent.
2 - Méthode de
d’Esopo
~
Dans cette
méthode,
la direction dedéplacement
dz estprise
successi-vement suivant
chaque
vecteurXi ;
onprendra
donc si on pose :ce
qui
revient àprendre
1 on a alors :l’intervalle n’étant autre que l’intervalle
Quand
on a fait p itérations àpartir de z
1(une boucle)
siËp+
est diffé-rent
de 11,
on recommence le processus, avec comme nouveaupoint
de dé-part " z’*
1= 1p+l .
.si zp. 1
=z
1(i.e. ~p~i= b., , ~1
il est facile de voird’après (18) )
et
l’expression
de l’intervalle(e~, 9~),
que l’on a atteintl’optimum, i.e. que
l’on se trouve dans le cas oùVi, 1 i
p, les conditions(15) (a)
de la méthode de Wolfe sont vérifiées.Si l’on
désigne
parQi
la valeur deQ
à la suite de la i èlD eboucle,
lasuite
Qi
étant strictement décroissante et bornée par 0 estconvergente ; l’algorithme
est doncconvergent.
3 - Etude du cas où la somme des
bi
vaut1
Si on
impose
la contrainte Ebi
=1,
les coefficientsbi
ne sontplus
"indépendants".
On les divisera en deuxparties :
---
(1) On fait bien sQr
l’hypothèse
que les contraintes (10) sont compatibles avec la con-trainte1: {bi
1 i = 1, p } = 1.d’une
part,
etbp
d’autrepart, bp
étant donné par :bp
étant la variablebasique (ou dépendante), bl,... bp’ les
variables hors base(ou indépendantes) ;
on supposeratoujours
quebp
est différent deocp
ou
~p ;
si ce n’était pas le cas, on intervertirait9
avec une variable nonbasique bi,
telle quebi
soit différent de ai ouj3~.
On raisonne alors comme
précédemment
sur les variables nonbasiques ,
et les
composantes
de la direction dedéplacement db
sont calculées pour1~ i p - 1,
àpartir
des formules(12), (15)
ou(18) (où Q
a étéexprimé uniquement
en fonction des variables horsbase)
suivant que l’onemploie
laméthode de Wolfe ou de
d’Esopo ;
on a alors :et 0 est déterminé à
partir
de la relation(14)
de telle sorte que les con- traintes(10)
soient vérifiées(i. e. 0~ 8 ~ O~).
Si bP atteint une de ses bor-nes, on intervertit
bp
avec un coefficientb appartenant
àl’intervalle
ouvertJ cxi, Pif (pivotage
des variables i etp).
Lepoint
dedépart e, de
laprocé-
dure doit être tel que
Les
algorithmes précédents
ont étéprogrammés
dans les cas suivants :a)
Méthode deWolfe,
avec les contraintesbi >
0de
d’Esopo
Quoiqu’exigeant
un nombre d’itérationsplus grand,
la méthode ded’Esopo,
dont les calculs sontplus simples,
s’est révéléeplus rapide
que la méthode de Wolfe.C’est pour cette raison que nous avons
programmé
cette méthode dans le cas ouIV - EXEMPLES D’UTILISATION DE LA REGRESSION SOUS CONTRAINTES 1 - Problèmes de
régression
où la variable àexpliquer
estpositive
On a alors des contraintes du
type :
C’est le cas rencontré en
particulier
enhydrologie (cf.
réf.5),
dansles
problèmes
de corrélationshydro pluviométriques quand
on veutexpliquer
l’écoulement en fonction de p variables aléatoires telles que la
précipitation ,
le nombre de
séquences pluvieuses
durantl’année,
etc...2 - Problèmes de
régression
entre variablespositives
Il est assez
fréquent
que les variables y, x~.. xp soientpositives ;
si les coefficients de
régression
doivent êtrepositifs,
pour avoir un sens alors les valeurs reconstituées sontautomatiquement positives (i.
e. les con-traintes
(2) (b)
où a =0, p =
+ oo :L’intérêt de ce modèle
explicatif
réside dans l’additivité des effets per- mettantd’approcher
la variable àexpliquer
y par des contributions toutes de même sens, cequi protège
larégression
contre les erreurspouvant
sur-venir
quand, ayant
des contributions de sensopposés,
de fortes valeurs se soustraient entre elles pour fournir uneexplication
de yqui peut
être fortuite(cf.
réf.2).
Citons trois
exemples
où ces méthodes ont étéappliquées :
- le
premier
est relatif à lagéologie (cf.
réf.3) ;
On veut
expliquer
le taux d’unoligo-élément
dans divers échantillons de roches par lesapports
de différents minérauxmajeurs.
- le deuxième est relatif à une
enquête
alimentaire où l’on a re-levé le
poids
d’unproduit (de
la viande parexemple)
consommé dans n fa-milles,
et où l’on désire"expliquer"
cepoids
en fonction des effectifs des famillesrépartis
en différentes classesd’âges,
cequi
revient à estimer la ration moyenne de ceproduit
consommé par un individu d’une classed’âge
donnée.
- le troisième est relatif à certains processus
physiques régis
par une
équation intégrale
de la forme :où
N,
f et g sont essentiellementpositifs,
N étant connu, et f déterminéexpérimentalement.
L’estimation de g se ramène à unproblème
dutype pré- cédent,
comme on le verra auparagraphe
suivant où est traité en détail lecas où f et g sont des densités de
probabilité.
V - ESTIMATION DE LA COURBE
GRANULOMETRIQUE
D’UN AEROSOL(cf.
réf.6)
On se propose de rechercher la courbe
granulométrique,
g(x) = 2013
d’un nuage de
particules
ensuspension
dans un gazquelconque,
à l’aide d’une méthodephotoélectrique.
Celle-ci consiste à mesurer le flux lumineux dif- fusé parchaque particule
lors de son passage dans lechamp
uniformément éclairé d’unphotomètre (fig. 4) :
l’information ainsi recueillie estreliable ,
parapplication
des lois de ladiffusion,
à la dimension de chacune des par- ticules.1 -
Montage expérimental
L D F
(filtre)
Figure 4
Un condenseur C fait
l’image
i d’undiaphragme
D uniformément éclairé(par
la sourceS)
dans lechamp
d’unobjectif
m demicroscope
dont l’axe est à 90° de celui du condenseur. Lechamp
de mesure estégalement
défini parl’image
à travers m d’undiaphragme d,
et une lentille l’conjugue
lapupille
d’entrée du
photomètre
avec unphotomultiplicateur
PM. Lesparticules
à ob-server
qui
sont ensuspension
dansl’air, passent
en iperpendiculairement
au
plan
de lafigure.
Cedispositif permet
d’unepart
d’éviter lespertes
deflux,
d’autrepart
d’éclairer de la mêmefaçon
lephotodétecteur, quelle
que soit laposition
de laparticule
dans le volume de mesure.On voit que le
champ
a la forme d’unparallélépipède
éclairé uniformé- ment : pour que lagranulométrie
ait un sens, son volume est choisi de telle sorte que laprobabilité d’y
trouverplus
d’uneparticule
soit très inférieure à celle d’en avoir une seule. Cetteprobabilité
est donnée par la loi :où N est la concentration des
particules
en nombre par unité de volume et V le volume duchamp
de mesure.Si on
prend
NV =0, 1
; on aura :2 - Détection
Cette méthode de mesure
granulométrique
desaérosols,
maintenant bien connue, estemployée
couramment pour classer desparticules
de diamètresupérieur
à0,5~.
Dans ce cas, le flux diffusé par chacune d’elles etcapté
dans l’ouverture du
photomètre
donnelieu,
à l’anode duphotodétecteur,
à uneimpulsion
de tension dont la durée estégale
autemps
de passage de la par- ticule dans lechamp,
et dontl’amplitude
estapproximativement proportion-
nelle au carré de son diamètre.
Actuellement,
la sélectiond’amplitude
nepose
plus
aucunproblème.
Par contre dans le domaine
submicronique (d 0, 3 ~)
le fluxcapté
par lephotomètre
est suffisamment faible pour quechaque photon
diffusépuisse
être détecté individuellement(à
condition bien sQrd’employer
uneélectronique
suffisammentrapide).
Le nombre de
photons
diffusé par unité detemps
par uneparticule
estaléatoire et suit une loi de Poisson dont le
paramètre
est fonction du dia- mètre de laparticule.
Le rendementquantique
très f aible(quelques %)
duphotodétecteur
conserve la distributiontemporelle poissonnienne
des inter- valles detemps
lors de la conversionphoton-électron.
L’information asso-ciée à
chaque particule
lors de son passage dans lechamp
de mesure estalors constituée par une suite discontinue
d’impulsions
detension,
chacune étant obtenue àpartir
d’un seulphotoélectron
audépart
de laphotocathode
du détecteur : nous sommes dans le domaine de "la
spectrométrie
àphotoé-
lectron
unique".
Toutes les méthodes de sélectiond’amplitude
sontinopéran-
tes : elles doivent être
remplacées
par des méthodesdigitales
consistant àcompter
des nombresd’impulsions
par unité detemps.
Dans
l’appareil
décritprécédemment,
letemps
de passage d’une par- ticule estcompris
entre 70 et 120 4s. Dèsqu’une particule pénètre
dans lechamp,
elle est détectée et undispositif
decomptage
donne le nombre dephotons
émispendant
50 ~s, valeurprise
comme unité detemps.
Ledispo-
sitif est ensuite
bloqué pendant 70 ils
pour éviter de déclencher à nouveauune mesure sur la même
particule.
On obtient ainsil’histogramme
du nom-bre de
photons
émis par unité detemps
par l’ensemble desparticules
d’unnuage.
3 -
Interprétation
des mesuresL’histogramme précédent
est l’estimation de la loi deprobabilité
dunombre de
photons
détectés pour un échantillon departicules
du nuage ; nousdésignerons
parf(m)
cette loi deprobabilité,
i. e. laprobabilité
d’obtenirm
photons
àpartir
de cet échantillon. Comme on l’a vu, le nombre depho-
tons émis par une
particule
de diamètre x estaléatoire,
et suit une loi de Poisson deparamètre a (x).
Les calculs effectués àpartir
des lois de la dif- fusion et vérifiés par ailleursexpérimentalement permettent
d’obtenir la courbed’étalonnage
donnanta(x)
en fonction de x.Si
g(x)
dxdésigne
laproportion
departicules
du nuageayant
un dia-mètre
compris
entre x et x +dx,
laprobabilité
d’obtenir mphotons
à par- tir d’uneparticule
de cette clas se est,la
probabilité
d’obtenir mphotons
àpartir
du nuage étantOn divise
l’histogramme précédent
en n cl:La
probabilité
de se trouver dans lajeme
classe est donc :Par
ailleurs,
si ondécoupe
l’intervalled’intégration
en p classesce
qui s’écrit,
enappliquant
la formule de la moyenne et endésignant
parbi
laproportion
desparticules
du nuageayant
un diamètrecompris
entreXi-l
1 et ~ :avec :
appartenant
à l’intervalle(Xi ..1, xi).
est estimée par
kj/k,
oùkj
est le nombre departicules appartenant
à la classe del’histogramme,
et k le nombre total departicules.
On a donc le modèle
suivant,
si on poseCeci
implique
que lesbi
soient inférieursà 1,
et que les valeurs re-constituées soient
positives.
Ondésire, après
avoir choisi une norme dans Rn, estimer les bt de telle sorte que le vecteuré
decomposante {ej 1 j = 1, n}
ait une norme
minimale,
cequi
revient àprojeter
sur le convexeCI
1 con-tenu dans le cône
positif
C del’espace
vectoriel H, défini par leséquations (3) (où ai = ex = 0 ;
iPi = j3 =
+ao)
et(4) (cf.
II2).
4 - Résultats
Nous exposons ici à titre
d’exemple
le traitement des résultats observés lors d’uneexpérience particulière.
Le nuage departicules
est obtenu parpulvérisation pneumatique
d’une solution desphérules
de latexmonodisper- sées,
de diamètre0, 23
~, diluée dans de l’eau bidistillée. La dilution est calculée de telle sorte que laprobabilité
de trouver desagglomérats
de deuxou
plusieurs particules
soit très faible. Dans les conditions de nosexpérien-
ces, on
obtient,
outre desparticules
delatex,
différents résidusd’évapora-
tion de la solution
provenant
enparticulier
de l’émulsifiant de la solution mère dessphérules
ensuspension :
lors de lapulvérisation,
l’émulsifiant forme des noyauxhygroscopiques
fixant l’eau bidistillée et donnant ainsi desgouttelettes
assez stables nes’évaporant
pascomplètement malgré
toutes lesprécautions expérimentales.
Nous avons
découpé
l’intervalle de variation du diamètre desparticules (de 0,08~
à0, 40 ~)
en huitclasses,
et ceci dequatre
manièresdifférentes ,
de
façon
àpouvoir vérifier,
en considérant les sommes cumulées des pour-centages,
que les résultats restent cohérents d’undécoupage
à l’autre. ·En d’autres termes, la
juxtaposition
desquatre
courbes cumulées(crois-
santes parconstruction)
relatives aux différentsdécoupages, qui
donne la courbe despourcentages
cumulés estimée pour les diamètres0,08, 0,09, 0,1,... 0, 34, 0, 35, 0,40~
doitégalement
être croissante.On
dispose
par ailleurs de la courbed’étalonnage
donnant a(x)
en fonc-tion de x
(fig. 5) .
Enfin,
pour calculerx~
dans la la formule(23),
on aapproximé cx(x* )
parxli
J étant le diamètre associé à l’intervalle(x i _ ~ , xi).
On a utilisé deux
métriques :
- la
première
est lamétrique
usuelle- la seconde tient
compte
de ladispersion
desrésultats,
en in-troduisant des coefficients de
pondération
inversementproportionnels
àdans la formule de distance :
Le tableau 1 montre
l’histogramme
du nombred’impulsions
mesuré par unité detemps :
il est divisé en seize classes. Danschacune, k j représente
le nombre de
particules
"tombant" dansla j ème
classe.-
kl
est le nombre departicules ayant
donné lieu aucomptage
de deuximpulsions.
-
kj, pour j ~ 1,
est le nombre departicules ayant
donné lieu à2j -
1 ou2j impulsions.
Les
cinq
dernières classes étant d’effectifsfaibles,
on les a regrou-pées,
obtenant ainsi un secondhistogramme
à douzeclasses,
les onze pre- mières étantidentiques
à celles del’histogramme précédent.
Sur ces deux
histogrammes,
on a effectuéquatre régressions
corres-pondant
successivement auxquatre découpages
et avec chacune des deux nor- mes définiesprécédemment.
Figure 5 - Courbe
d’étalonnage
Tableau 1Dans tous les cas, on a effectué la
régression classique (projection
sur
l’espace
vectoriel Hengendré
par les vecteursXi (cf.
II2.1), puis
enimposant
des coefficients derégression positifs {b~ 1
i =1, p } (projection
sur le cône
positif
C deH),
et enfin enimposant
deplus,
que la somme desbi
soitégale
à 1(projection
surCI).
La
régression classique
atoujours
donné des résultatsaberrants,
cer-tains
bi
étantnégatifs,
ouayant
des valeurs absoluessupérieures
à un etpouvant
atteindrequelques
centaines et mêmequelques
milliers. Laqualité
de
l’approximation R 2 0 de ÿ
par lesvecteurs Xi (cf.
II2. 3)
était très bonnecar
toujours supérieure
à0, 97 : y
est doncpratiquement
dansl’espace
vecto-riel H.
Le seul fait
d’imposer
des coefficients derégression positifs
aégale-
ment eu pour résultat que tous ces coefficients sont devenus inférieurs à un , leur somme étant voisine de un
(comprise
entre0, 93
et 1, 05 dans le cas de la normeusuelle,
et entre 0, 75 et0, 91
dans le cas de la secondenorme) ;
laqualité
del’approximation R 2
dey
par les vecteursXi
était bien sQrplus
faible que
précédemment,
mais restaitbonne, supérieure
dans tous les casà 0,73.
On retrouve
expérimentalement
le faitdéjà évoqué (cf. IV. 2) qu’en
im-posant
aux contributions d’êtreadditives,
on"protège"
larégression
alorsque l’on obtient des résultats aberrants sans cette
protection,
et ceci sans améliorerpratiquement l’explication (R 2
voisin deR~.
En outre, la somme des
bi
étant voisine de1,
laprojection
sur le con-vexe C est voisine de celle sur
CI.
Les résultats obtenus en
imposant
en outre la contrainte(4) (projec-
tion sur
CI)
sont résumés sur les tableaux 2 à 5.Les tableaux 2 et 3 sont relatifs au
premier histogramme (16 classes) ,
On y a fait
figurer :
- les estimations des
pourcentages F(z)
departicules
de diamè-tre inférieur ou
égal
à z (avec z = x, x + 0, 01, x + 0, 02, x + 0, 03 selon le mode departition),
i. e.la somme cumulée des coefficients derégression
pourchaque découpage.
- Rô
= 1 -S ô : qualité
del’approximation
dans le cas de la ré-gression classique (projection
surH).
-
R2 =
1 -S 2 : qualité
del’approximation
dans le cas ou l’onimpose
aux coefficients derégression
d’êtrepositifs (projection
surC).
- E
b i :
somme des coefficients derégression quand
onprojette
sur C.
-
R 21 : qualité
del’approximation quand
onprojette
surCi
1(coef-
ficients de
régression positifs
et de somme1).
-
S 1 : résidu, quand
onprojette
surCI.
Le tableau 2 est obtenu en
adoptant
la normeusuelle,
le tableau 3 enadoptant
la norme définie par(26).
Les tableaux 4 et 5 sont
respectivement
leshomologues
des tableaux 2 et 3, mais sont relatifs au secondhistogramme (12 classes).
Pour chacun de ces
tableaux,
àpart
de faiblesanomalies,
intervenantsur les tableaux 2, 4, 5 pour les diamètres de 0,18 et 0, 19 [1, les résul- tats obtenus entre les
quatre découpages
sont cohérents.En ce
qui
concerneRi
etS~, @ R2 1 pouvant prendre
des valeurssupérieures
à
1,
c’estS 1 qui permet
dejuger
de l’efficacité del’ajustement, qui
sera d’autant meilleur queS ~
serafaible, Prêtant
donné à titreindicatif,
pour le comparer à R2 etR§.
On
peut
remarquer :- que
S~
est voisin deS 2,
tout en lui étant bien sûrsupérieur ,
et reste
toujours
inférieur à 0, 36.- que
R2r qui
varie suivant les cas entre 0, 75 et1,31
estsupé-
rieur
à R2, chaque
fois que la somme des bi(quand
onprojette
surC)
est in- férieure à1,
etqu’il
lui estinférieur,
si cette somme estplus grande
que1 ,
ces résultats
s’expliquant aisément,
comme le montre lafigure
n° 6 où l’ona
supposé
la somme desbi plus petite
que 1.Figure 6
- que
lorsque S ~
estpratiquement égal
àS 2 (cas
de la norme usuelle où Ebi
=1),
il n’en est pas de même deR et
deR 2,
cequi
traduit le faitqu’au voisinage
de son minimum(sur C),
la somme des moindres carrés varie peu.On
pouvait
s’attendre aux résultatsprécédents qui
sont bons : ils tra- duisentsimplement,
comme on l’asignalé plus
haut que laprojection
sur lecône
positif
C est très voisine de laprojection
surCI,
les résultats obtenusen
projetant
sur C étant très bons.Pour comparer les différentes estimations de la courbe
granulométri-
que de
l’aérosol,
nous avonsreporté
sur lafigure
7 les valeursindiquées
dans les tableaux 2 et 4
(norme usuelle) :
les deux courbes obtenues sont bien concordantes. On remarqueracependant
sur les tableaux 3 et 5 que dans le cas de la norme(26)
les résultats sont un peu moins satisfaisants.Les résultats obtenus
pourraient
être encore améliorés parl’emploi
d’un
appareillage (sélecteur
multicanaux) permettant d’analyser
des densités d’informationbeaucoup plus grandes,
et de mieux définir les classes extrê- mes deshistogrammes,
dans la mesure où l’on pourra alorscompter plu-
sieurs centaines
d’impulsions
élémentaires pourchaque particule.
Q)
s a C’d
F
bo Mcq S
:s ~
Cd r.4
Q) ...~ ~
E-4 cdQ)
::::Q) 3
m :s o
S
0
:Z!
CD CD CD CD b0 u b~4 u Cd td 0 0 c~ 0. 0.. ~ z z
8
::s0 0 0 C) C) ci C) l’a) IQ) ~U IQ) Ptj "0 Ptj Ptj Q] CD CD
~
e El El
U ,(1) d(L) 1(1)
~ C~7 M ~
N
4t
cli
b0
~0 ::s 0 t-t
::s
Q)
l~4
i
,,a) D~ la)
S
1.3
=~ 2 a) .~
~
S
M
00
(D’3
’°CJ C)
l~4 S Cu 10
0..
,a)
ae
D 0
&
c
o.. ~
/n 00
~ o P4 x
1 1
o
s
Cd s
f..Io
bnl-
M
~ ;a
~:~
cu f..I
Q) Q)
:c
liclu
E-4 -..
"
co
~
Q)
Ê
o
z
cu cu cu cu
b4 b4 b4 b~p CL, CL, cu CL,
~ ~ ~ ~
~ ~ ~ ~
O O O O
B(1) B(1)
0000B(1) B(1)’t;7 ’"CS ’"CS ’"CS
(1) CU CU
~,~,~!
U /D /o ~
1""’4 C11 C’~ ch
N
4t
M
~
~ 0 l~4
~ D
~)
~1
o?
~ S ~ c!
~ S
CD .0
10
i
Ul
~ -ë
V:1 0
£ C),Z
0. ~10a)5
V
e
10 s
&
r.
..
-
~ ru .S, D 94 x
t )
0
s
~ S’ M
m le
2
:1 ’.0
Ct 0 D C~
e Cd l~
E-4 ..
~ ~
=9
~ U
S ë
~
0000 b0 b0 bO bO cd cd cd cd 0. 0. 0. 0.
5 5 5 5
0 0 0 C,)
,Q) ~8 ~8 Q)
10 ’t:7 "t:S ’t:7 000
~
a a a
IQ) a) 10 4D
1--i C’1 CO le
D
.
S
N S
~
~
~d
b0
~
bO
~
0b~4 U5
~
’D
Ir.> ta~
~
:a
~
ce
’o~
~0
s-.
~
0~ a!
D CÙ
’~ E-t D
’D CO
s
DD
S
b
s-.I(D 0
S.
z~ ta
0""
Ô"tj 0 D
Co)
"tj 0""
ta
S
D D
’3
"tj.~ D
1::
S
cù
I(D0.. ::::
D =
-ë §
~
=
°°
~ - ta
N D
~ !~
1 1
0 0 0 0
b0 b0 b0 e CCi as Cd Cd
0.
0 0 08 8 8 8
0000
’(1) ’(1) ’Q) ’Q)
10 ~8 ~8 ~8
~
(1) (1) 0
~
El S a
0 iQ) IQ) IQ)
1’-4 M M -.1-
N
4t
~ bO ,(I)
=9 0 9.4
:s
.¡::
~0
3
Q)
2 la)
e
9
;a ~
Q)
CJ
10
CQS
Q) CL) Q)
~ Ptj
8
Q)1-4 S ~ S
0. ~
la)
or-
~ Q
~
53
..
~ - 00
~ Q) P4 x
1 1
Figure 7 - Courbe granulométrique des pourcentages cumulés estimés de l’aérosol (norme usuelle).
VI - CONCLUSION
L’emploi
de larégression
sous contraintespermet
d’obtenir des mo-dèles
d’explication
satisfaisants dans de nombreuxproblèmes
où larégression classique s’applique mal ;
dans certains cas, ilpermet
deprotéger
la ré-gression
contre uneexplication
fortuite de la variable àexpliquer (contribu-
tions toutes de même
sens).
Ces
problèmes
derégression
sous contraintes rentrent dans le cadre de laprogrammation quadratique,
et leurcompréhension
est facilitée par une étudegéométrique,
où au lieu deprojeter
sur un espacevectoriel,
commedans la
régression classique,
onprojette
sur un convexe contenu dans cetespace.
Les résultats obtenus lors de l’estimation de la courbe
granulométrique
d’un
aérosol,
etqui
ont pu être contrôlés par la méthode même decalcul,
sont très bons et
pourront
être encore améliorés parl’emploi
d’undisposi-
tif de mesure
plus perfectionné.
BIBLIOGRAPHIE
[1]
J. ABADIE -Mathématique
des programmeséconomiques.
Courspoly- copié,
ISUP.[2]
J. P. BENZECRI - Larégression.
Publicationmultigraphiée
du labora- toire deStatistique Mathématique (Faculté
des Sciences deParis).
[3]
P. CAZES -Application
del’analyse
des données au traitement de pro- blèmesgéologiques.
Thèse 3èmecycle,
Faculté des Sciences deParis ,
1970.[4]
S. KHAN - Laprogrammation mathématique
en théorie dessondages
multivariates. Thèse dedoctorat,
1968, Paris.[5]
M. ROSENBERG -Problèmes
de corrélationsmultiples
avec contraintesen
hydrologie.
Bulletin of the International Association of ScientificHydrology, XV,
39/1970.
[6]
P. Y. TURPIN - Thèse de DocteurIngénieur,
Revued’Optique théorique
et