MT242, Cours no 13, Lundi 20 Mars 2000.
Exercice trait´e. Exprimer la matrice jacobienne de ϕ :v → kf(v)−w0k22, o`u f est une application de classe C1 d’un ouvert U ⊂ Rn dans Rn et w0 un point fix´e de Rn. On trouve
∀v ∈U, (Jϕ)v = 2t(F(v)−W0) (Jf)v
o`u W0 est la matrice colonne des coordonn´ees de w0 et F(v) la matrice colonne des coordonn´ees du vecteur f(v)∈Rn.
Rappel. Th´eor`eme des accroissements finis. Si on a k(df)ckL(E,F) ≤ M en tout point c du segment [a, b], alors kf(b)−f(a)kF ≤Mkb−akE.
La norme d’application lin´eaire est en g´en´eral difficile `a calculer exactement. On a quand mˆeme facilement kIdk= 1. Si E = (Rn,k.k2) et si ` est un endomorphisme de E, de matrice L dans la base canonique, on a la majoration
(∗) k`kL(E)≤ kLk2.
3.3. Inversion locale et fonctions implicites
Lemme 3.3.1. Si ` ∈ L(Rn) est inversible, il existe une constante c > 0 telle que k`(v)k2 ≥ckvk2 pour tout vecteur v ∈Rn.
D´emonstration. Puisque `−1 existe, il existe une constante C >0 (la norme de`−1 si on veut) telle que
∀w∈Rn, k`−1(w)k2 ≤Ckwk2.
Puisque ` est bijective, tout vecteur v ∈ Rn peut s’´ecrire v = `−1(w) pour un w ∈ Rn unique, et la relation pr´ec´edente s’´ecrit k`(v)k2 ≥ C−1kvk2, ce qui donne le r´esultat voulu avec c= C−1.
Un exemple d’application de R2 dans R2.
f(x, y) = (sin(x) +y2,sin(y) +x2)∈R2
Calcul de la matrice jacobienne au point (0,0) : c’est la matrice identit´e, qui est inversible.
Peut-on dire quef va suivre de si pr`es son approximation v→f(0,0) + (df)(0,0)(v) = (df)(0,0)(v)
qui est une application lin´eaire inversible, que f elle mˆeme sera injective ? Ca n’est pas vrai si on ne reste pas assez pr`es du point (0,0) : les points (π, π) et (−π,−π) ont la mˆeme image parf. Le r´esultat th´eorique qui suit est int´eressant car il serait en g´en´eral tr`es difficile de v´erifier “`a la main” que f est injective sur une petite boule autour du point (0,0).
Proposition 3.3.1. Soient U un ouvert de Rn, a ∈ U et f : U → Rn une fonction de classeC1 sur U; si la matrice jacobienne(Jf)a est inversible (ce qui ´equivaut `a dire que l’application lin´eaire (df)a est inversible), il existe r >0 et δ >0 tels que
kf(v)−f(v0)k ≥δkv−v0k
pour tous vecteurs v, v0 ∈ B(a, r). En particulier f est injective sur B(a, r). De plus, (Jf)v est inversible pour tout v∈B(a, r).
D´emonstration. Puisque (df)a est inversible, il existe γ > 0 tel que (df)a(h) ≥ γkhk pour tout h∈Rn. On va choisir r >0 assez petit pour que
|Dif(v)−Dif(a)|< γ 4n
pour tout i = 1, . . . , n et tout v ∈ B(a, r). Il en r´esulte que k(Jf)v −(Jf)ak2 < γ/4 ce qui implique
(∗∗) k(df)v −(df)akL(E) < γ/4
d’apr`es (∗), donc k(df)v(h)−(df)a(h)k2 <(γ/4)khk2, donc k(df)v(h)k2 ≥(3γ/4)khk2 par l’in´egalit´e triangulaire, pour tout v∈B(a, r). On fixev1, v2 dans cette boule B(a, r) ; le segment [v1, v2] est contenu dans la boule. On applique ensuite le th´eor`eme des ac- croissements finis sur le segment [v1, v2] `a l’applicationg: U →Rn d´efinie par
g(v) =f(v)−f(v1)−(df)v1(v−v1).
La diff´erentielle (dg)v est ´egale `a (df)v−(df)v1 qui est major´ee en norme par γ/2 pour tout pointv du segment d’apr`es (∗∗). Alors les relations
kf(v2)−f(v1)−(df)v1(v2−v1)k=kg(v2)−g(v1)k ≤ γ
2kv2−v1k
etk(df)v1(v2−v1)k ≥(3γ/4)kv2−v1kdonnent le r´esultatkf(v2)−f(v1)k ≥δkv2−v1k par l’in´egalit´e triangulaire, avec δ =γ/4.
Th´eor`eme 3.3.1. Th´eor`eme d’inversion locale. Soient U un ouvert de Rn, a ∈ U et g: U→Rn une fonction de classeC1 surU; si la matrice jacobienne(Jg)a est inversible, il existe un ouvertU0 contenu dansU et contenant le point aet un ouvert U00 contenant g(a) tels que la restriction de g`a U0 soit une bijection deU0 sur U00, et tels que de plus, sibgd´esigne la restriction deg`aU0, l’application r´eciproquebg−1 : U00 →U0 soit de classe C1 sur U00.
Esquisse de d´emonstration. On peut d´ej`a trouver r >0 et δ >0 tels que g soit injective sur B(a, r), et (Jg)v inversible pour tout v ∈ B(a, r). Posons b = f(a). On va montrer que tout point w0 ∈B(b, δr/2) est dans l’image de B(a, r). On posera r0 =δr/2 et
U0 ={v∈B(a, r) :g(v)∈B(b, r0)}
et on aura bien que g est une bijection de U0 sur son image U00 = B(b, r0). Une fa¸con de montrer que tout w0 ∈ B(b, r0) est dans l’image de g est de minimiser la fonction ϕ(v) = kg(v)−w0k2 sur le compact B(a, r) (la boule ferm´ee de centre a et de rayon r). Le minimum existe par compacit´e. On va montrer que le minimum ne peut pas ˆetre atteint sur la sph`ere S(r) de centre a et de rayon r. En effet, pour tout point v0 ∈ S(r) on akg(v0)−g(a)k ≥δr = 2r0, alors que kg(a)−w0k< r0, donc kg(v0)−w0k ≥r0. Ceci montre que le point v=a donne un meilleur r´esultat que n’importe quelv0 ∈S(r) pour la minimisation de ϕ. Le minimum de ϕ sur le compact B(a, r) est donc atteint en un pointv0 ∈B(a, r) (la boule ouverte). Il en r´esulte que le jacobien deϕs’annule au point v0. On a calcul´e ce jacobien dans le premier exercice de cette s´eance. On a donc
(Jϕ)v0 = 2t(G(v0)−W0) (Jg)v0 = 0.
Mais puisque (Jg)v0 est inversible, on a G(v0)−W0 = 0, c’est `a dire g(v0) = w0. On a ainsi montr´e que tout point w0 ∈B(b, r0) est dans l’image deg.
Cours no 14, Mercredi 22 Mars 2000.
Soit maintenant U un ouvert de R3, a = (x0, y0, z0)∈U et f : U→R de classe C1 telle que f(a) = 0. On s’int´eresse `a l’ensemble
(1) S ={v= (x, y, z)∈U :f(v) = 0}.
Dans les bons cas, cette ´equation repr´esente une surface ou un morceau de surface. On dit que S est d´efinie par une´equation implicite.
Exemple. L’´equation
(2) x2+y2+z2−1 = 0
d´efinit la sph`ere unit´e de R3.
On aimerait expliciter l’´equation (1), en trouvant si possible une repr´esentation de la formez =ϕ(x, y) pour les points de S. Pour l’´equation (2) par exemple, sia = (x0, y0, z0) est sur la sph`ere unit´e et si z0 <0, on peut repr´esenter les points de la sph`ere voisins de a par l’´equation “explicite”
z =−p
1−x2−y2 =ϕ(x, y)
o`u ϕ est d´efinie dans le voisinage V de ea = (x0, y0) d´efini par V = {ev = (x, y) : x2+y2 <1}. Mais cette repr´esentation ne nous donnera que la moiti´e de la sph`ere, celle qui correspond `az <0. De plus, siz0 = 0, par exemple a= (1,0,0) cette repr´esentation peut donner le pointalui-mˆeme en prenantev= (1,0), mais elle ne d´ecrira pas les points de la sph`ere voisins de (1,0,0) qui sont par exemple de la forme (cosθ,0,sinθ) avec θ > 0 petit. Pour le point (1,0,0), on cherchera plutˆot `a repr´esenter un morceau de sph`ere contenant (1,0,0) avec l’´equation
x=p
1−y2−z2.
Pour tout v= (x, y, z)∈R3, on notera ev= (x, y)∈R2.
Th´eor`eme 3.3.2. Th´eor`eme des fonctions implicites. Soient U un ouvert de R3, a ∈U et f : U →Rune fonction de classe C1 sur U telle que f(a) = 0.
Si D3f(a) = ∂f∂z(a) 6= 0, il existe ε > 0, δ > 0 et une fonction ϕ : B(ea, δ) → ]z0−ε, z0+ε[ tels que
1. pour tout ev∈B(ea, δ), le point (ev, ϕ(ev)) est dansS (et il est en plus dans l’ouvert U1 = B(ea, δ)×]z0−ε, z0+ε[)
2. pour tout v= (ev, z) dans U1, si v∈S alors z =ϕ(ev).
Esquisse de preuve. On applique le th´eor`eme d’inversion locale `a l’applicationg: U→R3 d´efinie par g(x, y, z) = (x, y, f(x, y, z)). En ´ecrivant la matrice jacobienne de g au point a, on voit facilement que son d´eterminant vaut D3f(a) 6= 0, donc (Jg)a est inversible.
On peut alors trouver U0 sur lequel g est bijective, et on peut toujours supposer que U0 = B(ea, ε)×]z0−ε, z0+ε[
pour un certain ε > 0. L’image U00 de U0 par g est un voisinage de g(a) = (ea,0). Il existe donc δ > 0 tel que B(f(a), δ) ⊂ U00. En particulier, on a (ev,0) ∈ U00 pour tout ev ∈ B(ea, δ). Pour un tel point, w = (bg)−1(ev,0) est d´efini, et w est n´ecessairement de la forme w = (ev, z) d’apr`es la forme de g; de plus f(ev, z) est la troisi`eme coordonn´ee de g(w) = (ev,0), donc f(ev, z) = 0. Puisque bg est bijective, z est uniquement d´efini en fonction de v, et on peut posere z = ϕ(ev) : pour tout ev ∈ B(ea, δ), ϕ(ev) est la troisi`eme coordonn´ee de (bg)−1(ev,0).
3.4. D´eriv´ees partielles secondes. Extrema locaux
Soit f : U→ R une fonction de classe C1, o`u U est un ouvert de Rn; pour chaque j = 1, . . . , nil existe unefonction r´eelle d´efinie sur U parv ∈U→(Djf)(v). On peut se demander si cette fonction Djf admet elle-mˆeme des d´eriv´ees partielles.
Si la fonction Djf admet unei`eme d´eriv´ee partielle au pointa∈U, on appelle cette d´eriv´ee partielle la d´eriv´ee partielle seconde Di(Djf)(a) de f au point a, qu’on peut noter encore
∂
∂xi ∂f
∂xj
(a).
On dit quef est de classe C2 dans U sif est de classe C1 dans U et si toutes les fonctions d´eriv´ees partielles Djf, j = 1, . . . , n sont de classe C1 dans U. Autrement dit, f est de classe C2 si toutes les d´eriv´ees partielles secondes Di(Djf)(v) existent pour tout v ∈U, et si toutes ces fonctions v→Di(Djf)(v) sont continues dans U.
Th´eor`eme 3.4.1. Lemme de Schwarz. Soient U un ouvert de Rn, f : U→ R de classe C2 dans U. Pour tous i, j= 1, . . . , n et tout pointa ∈U, on a
∂
∂xi ∂f
∂xj
(a) = ∂
∂xj ∂f
∂xi
(a).
D´emonstration. On pose pour t assez petit
Φ(t) =f(x0+t, y0+t)−f(x0+t, y0)−f(x0, y0+t) +f(x0, y0).
On va montrer que
tlim→0
Φ(t) t2 = ∂
∂y ∂f
∂x
(a).
Comme l’expression Φ(t) est sym´etrique enxety, on pourra montrer de la mˆeme mani`ere que Φ(t)/t2 tend vers ∂x∂ ∂f∂y
(a), et le r´esultat sera ´etabli.
Consid´erons pour t fix´e
g1(s) =f(x0+s, y0+t)−f(x0+s, y0).
Alors
g01(s) = ∂f
∂x(x0+s, y0+t)− ∂f
∂x(x0+s, y0).
et par le th´eor`eme des accroissements finis en dimension un Φ(t) =g1(t)−g1(0) =t g10(c(t)) =t∂f
∂x(x0+c(t), y0+t)− ∂f
∂x(x0+c(t), y0) o`u c(t) est un r´eel entre 0 et t. Posons maintenant
g2(s) = ∂f
∂x(x0+c(t), y0+s).
On a
Φ(t) =t(g2(t)−g2(0)) =t2g02(d(t)) o`u d(t) est un r´eel entre 0 et t, ce qui donne finalement
Φ(t) t2 = ∂
∂y ∂f
∂x
(x0+c(t), y0+d(t))
qui tend vers ∂y∂ ∂f∂x(x0, y0) quandt →0, par la continuit´e des d´eriv´ees partielles secondes, et parce que c(t)→0 et d(t)→0.
Apr`es le lemme de Schwarz, on introduit la notation d´efinitive pour les d´eriv´ees partielles secondes. On posera
∂2f
∂xi∂xj
(a) = Di(Djf)(a) si i 6=j, ∂2f
∂x2i(a) = Di(Dif)(a).
Consid´erons une fonction r´eelle f(x1, x2) de classe C2 dans un ouvert U contenant un pointa = (a1, a2)∈R2, et consid´erons un vecteur h= (h1, h2). Etudions la fonction f en des points a+th de la droite passant par a et de vecteur directeur h, avec t r´eel assez petit pour que a+th∈V. Posons donc
ϕ(t) =f(a1+th1, a2+th2).
On sait que
ϕ0(t) = ∂f
∂x1(a1+th1, a2+th2)h1+ ∂f
∂x2(a1+th1, a2+th2)h2, ce qui nous donnera en d´erivant une fois de plus, en posantat =a+th
ϕ00(t0) = ∂2f
∂x21(at)h21+ ∂2f
∂x2∂x1
(at)h1h2+ ∂2f
∂x1∂x2
(at)h1h2+ ∂2f
∂x22(at)h22 =
∂2f
∂x21(at)h21+ 2 ∂2f
∂x2∂x1(at)h1h2+ ∂2f
∂x22(at)h22. On retiendra cette formule utile,
d2
dt2f(a+th) t=t0
= (hessf)a+t0h(h)
en d´esignant par (hessf)v la forme quadratique dont la matrice dans la base canonique est la matrice des d´eriv´ees partielles secondes def au pointv ∈U. On notera (Hessf)v
cette matrice. On l’appelle la matrice hessienne de f au point v (d’apr`es le nom de Ludwig Otto Hesse, math´ematicien allemand, 1811–1874).
Th´eor`eme 3.4.2. Taylor-Lagrange. Si f est de classe C2 dans un ouvert U contenant le segment [a, a+h], il existe un point c de [a, a+h] tel que
f(a+h) =f(a) + (df)a(h) + 1
2(hessf)c(h).
Si on exprime les choses matriciellement, en introduisant la matrice colonne H des coordonn´ees de h, et en identifiant les matrices 1×1 `a des r´eels, on aura
f(a+h) =f(a) + (Jf)aH + 1 2
tH (Hessf)cH.
Proposition 3.4.1. Taylor-Young. Soient U un ouvert de Rn, a∈ U et f : U→R une fonction de classe C2 dans U; on peut ´ecrire
f(a+h) =f(a) + (df)a(h) + 1
2(hessf)a(h) +khk2ε(h).
D´emonstration. D’apr`es Taylor-Lagrange, il existe un point ch sur le segment [a, a+h]
tel que
f(a+h) =f(a) + (Jf)aH + 1 2
tH (Hessf)chH ce qui permet d’exprimer l’erreur
E(h) =f(a+h)−f(a)−(Jf)aH− 1 2
tH (Hessf)aH dans l’approximation de Taylor-Young par
E(h) = 1 2
tH
(Hessf)ch −(Hessf)a H.
Si on introduit la matrice Mh = (Hessf)ch −(Hessf)a, on voit que cette matrice Mh tend vers 0 quand h →0Rn, parce que les d´eriv´ees partielles secondes sont continues et que ch → a. D’autre part, on utilisant Cauchy-Schwarz et la d´efinition de la norme de matrice,
2|E(h)|=
tH MhH
≤ kHk2kMhHk2 ≤ kMhk kHk22
donc|E(h)| ≤ khk2ε(h) avec ε(h) = 12kMhk qui tend vers 0 lorsqueh →0Rn. 3.4.1. Conditions du second ordre pour un minimum local
On dit que f : U → R admet un maximum local au point a ∈ U s’il existe un voisinage V de a, V ⊂U tel que
∀v∈V, f(v)≤f(a).
Lemme 3.4.1. Si Q est une forme quadratique d´efinie positive sur Rn, il existe une constante δ >0 telle que Q(v)≥δkvk2 pour tout vecteur v∈Rn.
D´emonstration omise.
Proposition 3.4.2. Soient U un ouvert de Rn, a ∈U et f : U →R de classe C2 dans U; On suppose quea est un point critique de f, c’est `a dire que (df)a = 0.
1. Si la forme quadratique (hessf)a est d´efinie positive (c’est `a dire qu’elle est de signature(n,0)) la fonction f admet au pointa un minimum local.
1 bis. Si la forme quadratique (hessf)a est d´efinie n´egative (c’est `a dire qu’elle est de signature(0, n)) la fonction f admet au pointa un maximum local.
2. Si (hessf)a est de signature (s, t) avec s t 6= 0, alors v → f(v)−f(a) change de signe au voisinage dea, doncf n’admet pas d’extremum local au point a.
3. Si (hessf)a est de signature (s,0) avec s < n ou bien (0, t) avec t < n, on NE peut PAS conclure.
D´emonstration. Si (hessf)a est d´efinie positive, il existe un nombre δ > 0 tel que (hessf)a(h) ≥ δkhk2 pour tout h. Ce qui donne avec le DL de Taylor-Young, compte tenu de (df)a = 0
f(a+h)−f(a)≥ khk2(δ+ε(h)),
quantit´e > 0 pour h 6= 0 assez petit. Si (hessf)a est de signature (s, t) avec s t 6= 0, on peut trouver un vecteur v tel que (hessf)a(v) = 1 et un autre vecteur w tel que (hessf)a(w) =−1. Alors pour t petit non nul
f(a+tv)−f(a) = 1
2(hessf)a(tv) +ktvk2ε(tv) = 1
2t2+t2kvk2ε(tv)
est >0 alors que
f(a+tw)−f(a) =−1
2t2+t2kwk2ε(tw) est <0.
Un exemple du cas 3. Consid´erons
f1(x, y) =x4+y4−2(x−y)2, f2(x, y) =−x4−y4−2(x−y)2.
Le point (0,0) est critique pour les deux fonctions, elles ont la mˆeme matrice hessienne au point (0,0),
(Hessf)(0,0) =
−4 4 4 −4
.
La signature est (0,1) ; la seconde fonction a visiblement un maximum local au point (0,0) alors que la premi`ere n’a pas d’extremum en ce mˆeme point. Pourtant les informa- tions sur les d´eriv´ees premi`eres et secondes au point (0,0) sont identiques pour les deux fonctions.