Optimisation TD 4 - correction
lanquetuit.cyril@gmail.com, Université de Cergy Pontoise
Optimiser une fonction, c’est minimiser ou maximiser, en ses optima sa dérivée s’annule et leur nature (min ou max) dépend de la concavité ou convexité de celle-ci
1 Composition et convexité
f :C⊂R→Rest convexe
∀(x, y)∈C2,∀λ∈]0,1[, f(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y) etg:R→Rest croissante donc
∀(x, y)∈C2,∀λ∈]0,1[, gof(λx+ (1−λ)y)≤g(λf(x) + (1−λ)f(y))≤gof(x) + (1−λ)gof(y) puisque g est convexe
Donc gof est convexe.
2 Sous ensemble convexe
Sα={x∈C/f(x)≤α}est convexe dansRn⇔∀(x, y)∈Sα,∀λ∈]0,1[, λx+ (1−λ)y∈Sα
c’est à dire si et seulement si∀(x, y)∈C2tels quef(x)≤αetf(y)≤α, f(λx+ (1−λy)≤α or f est convexe doncf(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y)≤λα+ (1−λ)α=α
DoncSαest convexe.
3 Convexité en 3D
f(x, y, z) =x2+ 2y2+ 3z2−xy+ 2yz+xz sera convexe si et seulement si sa matrice hessienne est définie positive⇔Spec(Hf)⊂R+∗
Bf
Bx= 2x−y+ 2,B2f
Bx2 = 2, B2f
BxBy =
−1,
Bf
By = 4y−x+ 2z,B2f
By2 = 4, B2f
ByBz = 2,
Bf
Bz = 6z+2y+x,B2f
Bz2 = 6, B2f
BzBx= 1
Hf =⎡⎢
⎢⎢⎢⎢
⎣
2 −1 1
−1 4 2
1 2 6
⎡⎢⎢⎢
⎢⎢⎣ det(Hf−XI3) =
⎡⎢⎢⎢
⎢⎢⎣
2−X −1 1
−1 4−X 2
1 2 6−X
⎡⎢⎢⎢
⎢⎢⎣
χHf(X) = (2−X)((4−X)(6−X)−4) + 1((X−6)−2) + 1(−2 +X−4) =−X3+ 12X2−42X+ 30 χ′Hf(X) =−3X2+ 24X−42<0siX≤0
∆ = 576−504 = 72
x1=−24−−6√72>0, x2=−24+−6√72>0
donc surR−χHf est décroissante etχHf(0) = 30 DoncSpec(Hf)⊂R+∗et f est convexe.
1
4 Convexité paramétrée
f(x1, x2) =xα1xβ2
Bf
Bx1 =αxα1−1xβ2
Bf
Bx2 =βxα1xβ2−1
B2f
Bx21 =α(α−1)xα1−2xβ2
B2f
Bx22 =β(β−1)xα1xβ2−2
B2f
Bx1Bx2 =αβxα1−1xβ2−1
Hf =f⎡⎢
⎢⎢⎢⎣
α(α−1) x21
αβ x1x2 αβ
x1x2
β(β−1) x22
⎡⎢⎢⎢
⎢⎣
Siα+β= 1 Hf =f⎡⎢
⎢⎢⎢⎣
−αβ x21
αβ x1x2
αβ x1x2
−αβ x22
⎡⎢⎢⎢
⎢⎣, T r(Hf)<0etdet(Hf)≥0⇒Spec(Hf)⊂R−∪0
Siα+β <1 Hf est définie négative si et seulement si tout les mineurs principaux d’ordre impaire sont négatif et ceux d’ordre paire sont positifs or
−αβ x21 <0 det(Hf) = (xf
1x2)2(α(α−1)β(β−1)−(αβ)2) = (xf
1x2)2(αβ(1−(α+β)))>0 Hf définie négative donc f est stritement concave.
5 Le retour de la convexité paramétré
f(x1, x2) =xα1 +µxβ2, µ>0
Bf
Bx1 =αxα1−1
Bf
Bx2 =µβxβ2−1
B2f
Bx21 =α(α−1)xα1−2
B2f
Bx22 =µβ(β−1)xβ2−2
B2f Bx1Bx2 = 0
Hf =f[α(α−1)xα1−2 0 0 µβ(β−1)xβ2−2[
Si0<α<1,0<β<1 T r(Hf)<0, det(Hf)>0⇒f strictement concave Siα>1, β>1 T r(Hf)>0, det(Hf)>0⇒f strictement convexe
6 Homogénéité et concavité
fC2homogène de degré 1=k⇔∑ixiBf
Bxi =kfdoncxBf
Bx+yBf
By =f xBf
Bx+xB2f
Bx2 +y B2f
BxBy =Bf
Bx
DoncxB2f
Bx2 =−yxBxByB2f =f
xB2f
ByBx+Bf
By+yB2f
By2 =Bf
By
DoncxB2f
By2 =−xyByBxB2f =f
Hf = B2f
BxBy[−yx 1 1 −xy[
det(Hf) = 0donc f concave⇔−xyBxByB2f ≤0⇔ BxByB2f ≥0 2
Optimisation TD 5 - correction
lanquetuit.cyril@gmail.com, Université de Cergy Pontoise
—– Recherche des extrema d’une fonction —–
f(X+h) =f(X) +hf′(X) +h22f”(X) +o(h2)formule de Taylor à l’ordre 2 (***)
extremum⇒f’ s’annule, f”>0⇒f concave, maximum, f”<0⇒f convexe, minimum.
—– Méthode —–
1/ Déterminer les points critiques solutions du système∀1≤i≤n,BxBf
i = 0
2/ Etude globale, la matrice hessienne Hf peut être :
• d.p.(Spec(Hf)⊂R+∗)⇒f strictement convexe, minimum global strict
• d.n.(Spec(Hf)⊂R−)⇒f strictement concave, maximum global strict
• s.d.p.(Spec(Hf)⊂R+)⇒f convexe, minimum global
• s.d.n.(Spec(Hf)⊂R−∪{0})⇒f concave, maximum global
• Dans le dernier cas l’étude locale en chaque point critique est nécessaire 3/ Etude locale, pour chaque point critique X, Hf(X) peut être :
• définie positive⇒minimum local strict
• définie négative⇒maximum local strict
• semi définie positive⇒on ne peut conclure (signe deo(h2)inconnu (***))
• semi définie négative⇒on ne peut conclure
• Hf comporte des valeurs propres positives, d’autres négatives, selon la direction dans laquelle on choisi la variation h, f(X+h) sera donc supérieur ou inférieur à f(X)⇒le point critique considéré est singulier (ni min, ni max)
1
1 x
2+ y
2+ z
2− xy − x − 2z
0 = BfBx = 2x−y−1,0 = BfBy = 2y−x,0 = BfBz =
2z−2, X= (23,13,1)point critique
B2f
Bx2 = 2,BBy2f2 = 2,BBz2f2 = 2, BxByB2f =−1,BxBzB2f = 0,ByBzB2f = 0, Hf =⎡⎢
⎢⎢⎢⎢
⎣
2 −1 0
−1 2 0
0 0 2
⎡⎢⎢⎢
⎢⎢⎣ mineurs principaux : 2, 3, 6⇒Hf d.p. donc X minimum global strict.
2 x
3+ y
3− (x + y)
20 =Bf
Bx = 3x2−2(x+y),0 =Bf
By = 3y2−2(x+y), X1= (43,43)etX2= (0,0)points critiques
Hf = [6x−2 −2
−2 6y−2[,Hf(X1) =[ 6 −2
−2 6[,Hf(X2) =[−2 −2
−2 −2[
T r(Hf(X1) = 12, det(Hf(X1) = 32 ⇒ valeurs propres : 4 et 8 ⇒ Hf(X1) d.p.
doncX1 minimum local strict.
T r(Hf(X2) =−4, det(Hf(X2) = 0⇒valeurs propres : -4 et 0⇒Hf(X2)s.d.n.
on ne peut conclure.
3 x
3z + y
3− 3x
2y − 2z
20 = BfBx = 3x2z−6xy,0 = BfBy = 3y2−3x2,0 = BfBz =x3−4z X1,2,3= (0,0,0),(2,2,2),(−2,2,−2)points critiques, Hf =⎡⎢
⎢⎢⎢⎢
⎣
6xz−6y −6x 3x2
−6x 6y 0 3x2 0 −4
⎡⎢⎢⎢
⎢⎢⎣ Hf(X1) =⎡⎢
⎢⎢⎢⎢
⎣
0 0 0 0 0 0 0 0 −4
⎡⎢⎢⎢
⎢⎢⎣
,Hf(X2) =⎡⎢
⎢⎢⎢⎢
⎣
12 −12 12
−12 12 0 12 0 −4
⎡⎢⎢⎢
⎢⎢⎣
,Hf(X3) =⎡⎢
⎢⎢⎢⎢
⎣
12 12 12 12 12 0 12 0 −4
⎡⎢⎢⎢
⎢⎢⎣ PourX1 : Hessienne s.d.n.⇒on ne peut conclure.
Pour X2, X3 : T r = 20 > 0, det = −123 < 0 ⇒ 2 valeurs propres positives, une négative⇒points singuliers.
4 x
3+ 3xy
2− 15x − 12y
0 = BfBx = 3x2+ 3y2−15,0 = BfBy = 6xy−12
X0,1,2,3= (2,1),(−2,−1),(1,−2),(−1,−2)points critiques, Hf = 6[x y y x[ PourX0 : det > 0, Tr > 0⇒Hf(X0)d.p.⇒minimum local strict.
1 ⇒ 1 ⇒
PourX2,3 : det < 0⇒2 valeurs propres de signe opposé⇒points singuliers.
5 (x
2+ y
2)e
x2−y20 = BfBx = 2x(1 +x2+y2)ex2−y2,0 = BfBy = 2y(1−x2−y2)eX2−y2 X1,2,3= (0,0),(0,−1),(0,1)points critiques
B2f
Bx2 = (6x2+ 2 + 2y2+ 4x2(1 +x2+y2))ex2−y2,
B2f
By2 = (−6y2−2x2+ 2−4y2(1−x2−y2))ex2−y2,
B2f
BxBy = (−4xy+ 4xy(1−x2−y2))ex2−y2 Hf(X1) =[2 0
0 2[ d.p.⇒X1 minimum local strict.
Hf(X1) =Hf(X2) =[4e 0
0 −e4[ 2 valeurs propre opposées⇒X2, X3 singuliers.
6 ln(x − 2) + ln(y − 3) − x − 2y
0 = BfBx = x−12 −1,0 = BfBy = y−13−2, X = (3,72)point critique Hf =[ −
1
(x−2)2 0
0 (y−−13)2[d.n.⇒X maximum global strict.
7 x
2− 2xy + 2y
2+ 2y + z
2− 4z + 6
0 = BfBx = 2x−2y,0 = BfBy =−2x+ 4y+ 2,0 = BfBz = 2z−4, X = (−1,−1,2)point critique, Hf =⎡⎢
⎢⎢⎢⎢
⎣
2 −2 0
−2 4 0
0 0 2
⎡⎢⎢⎢
⎢⎢⎣
mineurs principaux 2,4,8 poistifs ⇒Hf d.p.⇒X minimum global strict.
8 xln(y) + zln(x) − y
0 = BfBx =lny+2x,0 = BfBy =xy −1,0 = BfBz =lnx, X = (1,1,0)point critique
Hf = ⎡⎢
⎢⎢⎢⎢
⎣
−z x2
1 y
1 1 x
y −x y2 0
1
x 0 0
⎡⎢⎢⎢
⎢⎢⎣
,Hf(X) =⎡⎢
⎢⎢⎢⎢
⎣
0 1 1 1 −1 0 1 0 0
⎡⎢⎢⎢
⎢⎢⎣
det > 0, Tr < 0⇒2 valeurs propres négatives, une positive ⇒X point singulier.
Optimisation TD 6 - correction
lanquetuit.cyril@gmail.com, Université de Cergy Pontoise
Extrema de f(X) sous la contrainte g(X)=0 1/ Points critiques solutions du système∀1≤i≤n, BL
Bxi = 0, g(X) = 0oùL=f+λg 2/ Convexité du Lagrangien dépendant de la matrice hessienneHL
1 x
2− xy + 4y
2/1 − 3x − 4y = 0
L=f+λg
0 = BLBx = 2x−y−3λ,0 =BLBy = 8y−x−4λ,0 =g(x, y) = 1−3x−4y
⎡⎢⎢⎢
⎢⎢⎣
2 −1 −3
−1 8 −4
−3 −4 0
⎡⎢⎢⎢
⎢⎢⎣
⎡⎢⎢⎢
⎢⎢⎣ x y λ
⎡⎢⎢⎢
⎢⎢⎣
=⎡⎢
⎢⎢⎢⎢
⎣ 0 0
−1
⎡⎢⎢⎢
⎢⎢⎣ x=12828, y=12811, λ=12815 HL=Hf =[2 −1
−1 8[,T r(HL) = 10>0, det(HL) = 15>0⇒HLd.p.⇒Lconvexe⇒(327,12811) minimum global strict
2 3x
2− xy + y
2/1 − 2x − 3y = 0
L=f+λg0 =BL
Bx = 3x−y−2λ,0 =BL
By =−x+ 2y−3λ,0 =g(x, y) = 1−2x−3y
⎡⎢⎢⎢
⎢⎢⎣
3 −1 −2
−1 2 −3
−2 −3 0
⎡⎢⎢⎢
⎢⎢⎣
⎡⎢⎢⎢
⎢⎢⎣ x y λ
⎡⎢⎢⎢
⎢⎢⎣
=⎡⎢
⎢⎢⎢⎢
⎣ 0 0
−1
⎡⎢⎢⎢
⎢⎢⎣
x = 747, y = 2074, λ = 1174, HL = Hf = [6 −1
−1 2[, T r(HL) = 12 > 0, det(HL) = 11 > 0 ⇒ HLd.p.⇒Lconvexe⇒(747,1037)minimum global strict
3 xy/2 − x
2− y
2= 0
L=f+λg0 =BL
Bx =y−2xλ,0 =BL
By =x−2yλ,0 =g(x, y) = 1−x2−y2
(x, y, λ) = (1,1,12),(−1,−1,12),(1,−1,−12),(−1,1,12)points critiquesHLf =[−2λ 1 1 −2λ[ Pourλ=12 : det = 0, Tr = -2⇒Lconcave⇒maximum global.
Pourλ=−12 : det = 0, Tr = 2⇒Lconvexe⇒minimum global.
4 x + 2y/1 − x − y = 0
L=f+λg 0 = BL
Bx = 1−2xλ,0 =BL
By = 2−2yλ,0 =g(x, y) = 1−x2−y2 (x, y, λ) = (√1
5,√2
5,√25),(−√15,−√25,−√25)points critiques,HLf=[−2λ 0 0 −2λ[ Pourλ=√25 : det = 0, Tr < 0⇒Lconcave⇒(√1
5,√2
5)maximum global.
Pourλ=−√25 : det = 0, Tr > 0⇒Lconvexe⇒(−√15,−√25)minimum global.
5 z/1 − x − y − z = 0 = 1 − x
2− y
2− z
2L=f+λg+µh 0 = BL
Bx =−λ−2xµ=BL
By =−λ−2yµ=BL
Bz = 1−λ−2zµ=BL
Bλ = 1−x−y−z=BL
Bµ = 1−x2−y2−z2 (1−3λ)2=λ2+λ2+ (1−λ)2,6λ2= 4λ
(x, y, z, λ, µ) = (0,0,1,0,12)ou(23,23,−13,23,−12), HLf=−2µI3
Pourµ=√21 : définie négative⇒Lconcave⇒z= 1maximum global.
Pourµ=−√21 : définie positive⇒Lconvexe⇒z=−13 minimum global.
6 2x + y + z/4 − x − 2y − z = 1 = x
2+ y
2L=f+λg+µh
0 = BLBx = 2−λ−2xµ,0 = BLBy = 1−2λ−2yµ,0 =BLBz = 1−λ,0 =BLBλ = 3−x−2y−z,0 = BLBµ = 1−x2−y2
(x, y, z, λ, µ) = (√1 2,√−1
2,3+√1 2,1,√1
2)ou(√−1 2,√1
2,3−√12,1,−√12), HL=
⎡⎢⎢⎢
⎢⎢⎣
−2µ 0 0 0 −2µ 0
0 0 0
⎡⎢⎢⎢
⎢⎢⎣ µ>0: L concave sur tout plan contenant pas de droite verticale,3 +√
2maximum global strict.
µ<0: L convexe sur tout plan contenant pas de droite verticale,3−√
2minimum global strict.