• Aucun résultat trouvé

C11, Optimisation avec contrainte

N/A
N/A
Protected

Academic year: 2021

Partager "C11, Optimisation avec contrainte"

Copied!
21
0
0

Texte intégral

(1)

C11, Optimisation avec contrainte

Objectif :

f ∈ C (R

n,R),

K un sous ensemble ferm´ e de

Rn

. On s’int´ eresse aux 3 questions suivantes :

1.

Existence de x ¯ ∈ K tel que f (¯ x ) ≤ f (x) pour tout x ∈ K . (On dit alors que x ∈

argminK

f .)

2.

Unicit´ e de x ¯ ∈ K tel que f (¯ x) ≤ f (x) pour tout x ∈ K . (Si il y a existence et unicit´ e, on dit alors que x =

argminK

f .)

3.

Comment calculer ce point x ¯ de K minimisant f sur K . C’est un probl` eme de minimisation avec contrainte car la variable est contrainte ` a ˆ etre dans K , sous ensemble de

Rn

.

On peut remplacer

f ∈C

(

Rn,R

) par

f ∈C

(K

,R

)

(2)

Existence de x ¯

Th´ eor` eme f ∈ C (

Rn,R

).

1.

L’ensemble K est ferm´ e, born´ e, non vide.

Alors, il existe x ¯ ∈ K tel que f (¯ x ) ≤ f (x) pour tout x ∈ K .

2.

L’ensemble K est ferm´ e non vide et f (x) → +∞ quand

kxk → +∞.

Alors, il existe x ¯ ∈ K tel que f (¯ x ) ≤ f (x) pour tout x ∈ K .

(3)

Existence de x, d´ ¯ emonstration, premier cas

f ∈ C (

Rn,R

). L’ensemble

K

est ferm´ e, born´ e, non vide.

Dans ce cas, l’ensemble K est compact et, comme f est continue,

f est born´ ee sur K et atteint ses bornes. Donc, il existe x ¯ ∈ K tel

que f (¯ x) ≤ f (x) pour tout x ∈ K .

(4)

Existence de x, d´ ¯ emonstration, deuxi` eme cas

L’ensemble

K

est ferm´ e non vide et

f

(x)

+∞ quand

kxk →

+∞.

Soit x

0

∈ K . Il existe R

>

0 tel que

kxk

>

R = ⇒ f (x)

>

f (x

0

).

On pose B

R

= {x ∈

Rn,

kxk ≤ R}.

Noter que x0 ∈BR ∩K.

Comme B

R

∩ K est compact et f est continue, il existe

¯

x ∈ B

R

∩ K tel que f (¯ x ) ≤ f (x) pour tout x ∈ B

R

∩ K . En particulier, f (¯ x) ≤ f (x

0

) et donc

f (¯ x) ≤ f (x)

pour tout

x ∈ K

.

On a bien trouv´ e x ¯ ∈ K tel que f (¯ x) ≤ f (x) pour tout x ∈ K .

(5)

Unicit´ e de x ¯

D´ efinition

L’ensemble K est convexe si

x, y ∈ K

,

t ∈ [0, 1] = ⇒ tx + (1 − t)y ∈ K

.

Th´ eor` eme

f ∈ C (

Rn,R

). On suppose f strictement convexe et K convexe.

Alors, il existe au plus un point x ¯ ∈ K tel que f (¯ x) ≤ f (x) pour tout x ∈ K .

D´emonstration : Soientx¯∈K etx¯¯∈K tels quef(¯x)≤f(x)pour tout x∈K etf(¯¯x))≤f(x)pour tout x∈K.

On a doncf(¯x) =f(¯x). Si¯ x¯6= ¯¯x, par strict convexit´e def,

f(x¯+ ¯x¯ 2 )< 1

2(f(¯x) +f(¯x¯)) =f(¯x),

et, par convexit´e deK, ¯x+¯2x¯∈K, ce qui est impossible. Doncx¯= ¯x¯.

(6)

Existence et unicit´ e de x ¯

On regroupe le th´ eor` eme d’existence et le th´ eor` eme d’unicit´ e : Th´ eor` eme

f ∈ C (

Rn,R

). On suppose f strictement convexe et K convexe ferm´ e non vide. On suppose K born´ e ou f (x) → +∞ quand kxk → +∞.

Alors, il existe un unique x ¯ ∈ K tel que f (¯ x) ≤ f (x) pour tout

x ∈ K .

(7)

Condition n´ ecessaire d’optimalit´ e

On suppose que f ∈ C

1

(

Rn,R

).

Proposition

Soit x ¯ ∈ K tel. que f (¯ x) ≤ f (x ) pour tout x ∈ K

1.

Si x ¯ ∈ K ˚ , alors ∇f (¯ x) = 0.

2.

Si K convexe, ∇f (¯ x) · (x − x) ¯ ≥ 0 pour tout x ∈ K . .

D´emonstration du premier cas Six¯∈K˚, il existeε >0 tel que k¯x−zk ≤ε =⇒ z ∈K.

Soity ∈Rn, y6= 0, on ax¯+ty∈K si −kykε ≤t ≤ kykε et donc, en posantϕ(t) =f(¯x+ty),

ϕ(0) =f(¯x)≤ϕ(t)si − ε

kyk ≤t ≤ ε kyk. On en d´eduitϕ0(0) = 0, c’est-`a-dire

ϕ0(0) =∇f(¯x)·y = 0pour tout y∈Rn et donc∇f(¯x) = 0.

(8)

Condition n´ ecessaire d’optimalit´ e, deuxi` eme cas

f ∈C1(Rn,R),K convexe, ¯x∈K tel. quef(¯x)≤f(x) pour toutx∈K

Soitx ∈K. par convexit´e deK,x¯+t(x−x)¯ ∈K sit ∈]0,1[. Donc, f(¯x+t(x−x))¯ −f(¯x)

t ≥0 pour tout0<t <1.

quandt→0 ceci donne

∇f(¯x)·(x−x)¯ ≥0.

(9)

K d´ efini par de contraintes “´ egalit´ es”

f ∈ C

1

(

Rn,R

), n ≥ 1

g

i

∈ C

1

(

Rn,R

), i ∈ {1, . . . , p} (p ≥ 1).

K = {x ∈

Rn

; g

i

(x) = 0, i = 1, . . . , p}.

g

=

 g1

.. .

gp

∈C1

(R

n,Rp

)

K ={x∈Rn; g(x) = 0}.

(10)

Multiplicateurs de lagrange

Th´ eor` eme

Soit f ∈ C

1

(R

n,R),

g ∈ C

1

(R

n,Rp

).

K ={x∈Rn; g(x) = 0}.

¯

x ∈ K , f (¯ x) ≤ f (x) pour tout x ∈ K .

On suppose que rang(Jg(¯x)) =p (et donc p≤n)

Alors, il existe

λ1, . . . , λp

dans

R

tels que

∇f (¯ x) +

p

X

i=1

λi

∇g

i

(¯ x) = 0.

Rappel :

Jg

(x)

∈ Mp,n

et

Li

(J

g

(x)) = (∇g

i

(x))

t

Le casp =n est facile car{∇g1(¯x), . . . ,∇gn(¯x)}est alors une base deRn

(11)

Courbes de niveau d’une fonction, n = 2

h∈C1(R2,R),c∈R,Γh,c ={x ∈R2;h(x) =c}.

Param´etrisation locale de Γh,c

x∈C1(]−1,1[,R2),{x(t);t∈]−1,1[} ⊂Γh,c. Alors h(x(t)) =c pour tout t∈]−1,1[, et donc∇h(x(t))·x0(t) = 0pour tout t∈]−1,1[.

Le vecteur∇h(x(0)) est orthogonal `a la courbe Γh,c au pointx(0).

Figure:Courbe de niveau de h en rouge,∇h(x(0))en bleu

(12)

Multiplicateur de Lagrange, n = 2, p = 1

Dans cette figures les courbes de niveau def sont en rouge. L’epaisseur de la courbe est li´ee `a la valeur de f.

La courbe de niveau deg, c’est-`a-direΓg,0, est en vert.

Lorsque que l’on parcourt la courbe de niveau deg, la fonction f atteint son minimum (enx) lorsque les courbes de niveau de¯ f etg sont tangentes, c’est-`a-dire lorsque leurs vecteurs normaux∇g(¯x)ou∇f(¯x) sont colin´eaires, et il existe doncλtel que∇f(¯x) =−λ∇g(¯x)(si

∇g(¯x)6= 0).

RappelK = Γg,0. On cherche l’argmin def surK

(13)

Multiplicateur de Lagrange, n = 2, p = 1, autre m´ ethode

On peut aussi param´etriserΓg,0au voisinage de x¯

Soitx ∈C1(]−1,1[,R2),{x(t);t ∈]−1,1[} ⊂Γg,0etx(0) = ¯x.

La fonctiont 7→f(x(t))est minimale ent = 0. Sa d´eriv´ee est nulle en0:

∇f(¯x)·x0(0) = 0.

Mais on sait aussi que∇g(x(0))·x0(0) = 0.

Ce qui prouve encore, six0(0)6= 0, que∇g(¯x)et∇f(¯x)sont colin´eaires,

(14)

Multiplicateur de Lagrange, d´ emonstration (1)

Hypoth`eses : f ∈C1(Rn,R), g ∈C1(Rn,Rp). K ={x ∈Rn; g(x) = 0}.

¯

x∈K,f(¯x)≤f(x)pour toutx∈K. rang(Jg(¯x)) =p<n.

Etape 1 : Il existeG s.e.v deRn tel queRn=G⊕ker(Jg(¯x))etJg(¯x) bijection deG surIm(Jg(¯x))(exercice 1 du td1, d´emonstration du th´eor`eme du rang).

Commerang(Jg(¯x)) =p,Im(Jg(¯x)) =Rp. Donc Jg(¯x)est une bijection deG surRp.

on poseF= ker(Jg(¯x)).

Pour(y,z)∈G×F, on pose f¯(y,z) =f(y+z)etg¯(y,z) =g(y+z)

¯

x= ¯y+ ¯z.

Int´erˆet : D1g¯(y,z)(h) =Dg(y+z)(h) =Jg(y+z)hpour touth∈G et doncD1g¯(¯y,z¯) est inversible deG dansRp.

(15)

Multiplicateur de Lagrange, d´ emonstration (2)

Etape 2 :

K¯ ={(y,z)∈G×F; y+z ∈K}={(y,z)∈G×F; ¯g(y,z) = 0}.

(¯y,z¯)∈K¯,D1g¯(¯y,z¯)est inversible. Le th´eor`eme des fonctions implicites donne alors qu’il existeε >0,δ >0tels que

∀z ∈B(¯z, ε), ∃!y ∈B(¯y, δ)tel queg¯(y,z) = 0.

On noteφ(z)cette valeur dey. Le th´eor`eme donne aussiφ∈C1(F,G).

B(¯z, ε) est la boule ouverte (deF) de centre ¯z et de rayonε.

B(¯y, δ) est la boule ouverte (deG) de centre ¯y et de rayonδ.

Commeg¯(φ(z),z) = 0:

D1g¯(¯y,z¯)◦Dφ(¯z) +D2g¯(¯y,z¯) = 0 c’est-`a-direDφ(¯z) =−(D1g¯(¯y,z¯))−1◦D2g¯(¯y,z¯).

NoterD2g¯(¯y,z¯)∈ L(F,Rp) etD1g¯(¯y,z)¯ ∈ L(G,Rp)

(16)

Multiplicateur de Lagrange, d´ emonstration (3)

f¯(φ(¯z),z¯)≤f¯(φ(z),z)pour toutz ∈B(¯z, ε)

carφ(z) +z ∈K etφ(¯z) + ¯z = ¯y+ ¯z = ¯x. Donc (min. sans contrainte) D1f¯(¯y,z¯)◦Dφ(¯z) +D2f¯(¯y,z) = 0,¯

et donc, commeDφ(¯z) =−(D1g¯(¯y,z¯))−1◦D2g¯(¯y,z¯), D2f¯(¯y,z¯) =D1f¯(¯y,z¯)◦(D1g¯(¯y,z¯))−1◦D2g¯(¯y,z¯).

Mais on a aussi

D1f¯(¯y,z¯) =D1f¯(¯y,z¯)◦(D1g¯(¯y,z¯))−1◦D1g¯(¯y,z¯).

Ceci donne

Df(¯x) =−Λ◦Dg(¯x),

avecΛ =−D1f¯(¯y,z¯)◦(D1g¯(¯y,z¯))−1∈ L(Rp,R),Dg(¯x)∈ L(Rn,Rp).

Ccei donne bien∇f(¯x) +Pp

i=1λi∇gi(¯x) = 0, o`u lesλi sont les composantes de la matrice repr´esentant Λ.

(17)

Rappel de calcul diff´ erentiel

Df(¯x) =−Λ◦Dg(¯x), Df(¯x)∈ L(Rn,R),Λ∈ L(Rp,R),Dg(¯x)∈ L(Rn,Rp).

Soith∈Rn,u=Dg(¯x)(h) =Jg(¯x)h∈Rp.

pouri∈ {1, . . . ,p}, on noteui la i-eme composante deu ui=Li(Jg(¯x))t·h=∇gi(¯x)·h.

Λ◦Dg(¯x)(h) = Λ(u) =

p

X

i=1

λiui = (

p

X

i=1

λi∇gi(¯x))·h.

Df(¯x)(h) =∇f(¯x)·h.

Df(¯x) =−Λ◦Dg(¯x)signifie

∇f(¯x) +Pp

i=1λi∇gi(¯x) = 0.

(18)

Utilisation pratique des multiplicateurs de Lagrange

f ∈C1(Rn,R),g ∈C1(Rn,Rp). K ={x∈Rn; g(x) = 0}.

On cherche `a calculer x¯tel que

¯

x∈K,f(¯x)≤f(x)pour toutx∈K.

Une possibilit´e est donc de r´esoudre le syst`eme de(n+p)´equations `a (n+p)inconnues (¯x dansRnetλ1, . . . , λp):

∇f(x) +

p

X

i=1

λi∇gi(x) = 0 (n ´equations), g(x) = 0 (p ´equations).

Il reste alors deux difficult´es :

1. x solution de ce syst`eme n’est pas forc´ement un point o`uf r´ealise son minimum surK.

2. Si, pour le point recherch´e,rang(Jg(¯x))<p, le pointx¯ peut ne pas ˆ

etre solution de ce syst`eme.

Toutefois, cette m´ethode est souvent tr`es performante.

(19)

K d´ efini par de contraintes “in´ egalit´ es”

f ∈ C

1

(

Rn,R

), n ≥ 1

g

i

∈ C

1

(

Rn,R

), i ∈ {1, . . . , p} (p ≥ 1).

K = {x ∈

Rn

; g

i

(x) ≤ 0, i = 1, . . . , p}.

g

=

 g1

.. .

gp

∈C1

(R

n,Rp

)

K ={x∈Rn; g(x)≤0}.

(20)

Th´ eor` eme de Kuhn-Tucker

Th´ eor` eme

Soitf ∈C1(Rn,R), g ∈C1(Rn,Rp).

K ={x∈Rn; g(x)≤0}.

¯

x∈K,f(¯x)≤f(x)pour toutx∈K.

On noteI(¯x) ={i∈ {1, . . . ,p};gi(¯x) = 0} et on suppose que {∇gi(¯x), i ∈I(¯x)}est une famille libre.

Alors, il existe{λi,i∈I(¯x)} inclus dansR+telle que

∇f(¯x) + X

i∈I(¯x)

λi∇gi(¯x) = 0.

Remarque : SiI(¯x) =∅, c’est-`a-dire gi(¯x)<0 pour touti∈ {1, . . . ,p}, on est alors ramen´e `a un probl`eme de minimisation sans contrainte et donc∇f(¯x) = 0.

(21)

Utilisation pratique du th´ eor` eme de Kuhn-Tucker

f ∈C1(Rn,R),g ∈C1(Rn,Rp),K ={x∈Rn; g(x)≤0}.

On cherche `a calculer x¯tel que

¯

x∈K,f(¯x)≤f(x)pour toutx∈K.

Une possibilit´e est de r´esoudre le syst`eme de(n+p)´equations `a(n+p) inconnues (¯x dans Rnetλ1, . . . , λp)avec2pin´egalit´es :

∇f(x) +

p

X

i=1

λi∇gi(x) = 0 (n ´equations), λigi(x) = 0, i∈ {1, . . . ,p}(p ´equations), gi(x)≤0, i∈ {1, . . . ,p},

λi ≥0, i∈ {1, . . . ,p}.

Ici encore, cette m´ethode est souvent tr`es performante.

Références

Documents relatifs

In this paper, it becomes necessary to show the Nash triviality theorem for a family of pairs of compact Nash manifolds with boundary and compact Nash submanifolds with

Dans ce travail, nous étudions l'effet de la &#34;dissymétrie&#34; du poids a; sur l'apparition et la disparition des sous-espaces biinvariants générés par des fonctions

Comme f est continue sur [0, 1] (compact) elle est born´ee et atteint

Résoudre une équation f (x) = k, où k est un réel, c’est trouver les variables (abscisses sur la courbe) x dont l’image vaut k, c’est donc chercher les antécédents de k..

La dérivation et la substitution de 0 à X sont des opérations linéaires, l'application ϕ proposée par l'énoncé est donc bien une forme linéaire.. Par dénition,

En eet, un tel espace doit contenir des polynômes de degré arbitrairement grand (sinon il serait de dimension nie) et tous leurs polynômes

[r]

Premi` ere