CHAPITRE 3
APPLICATIONS DIFF ´ ERENTIABLES
7. D´efinitions et premi`eres propri´et´es
(1) En guise d’introduction, commen¸cons par un rappel sur les fonctions d´erivables R → R. Soienta∈Ret f :R→Rune fonction d´efinie sur un intervalle ouvertI contenanta. On dit que f estd´erivable enasi la limite
h→0lim
h6=0
f(a+h)−f(a) h
existe ; dans ce cas elle est not´eef′(a) et l’on af(a+h) =f(a) +f′(a)h+hε(h), o`uε:R→Rest une fonctioncontinue et nulle en 0 (i.e. limh→0ε(h) = 0 =ε(0)).
Dans ce cas, connaissantf(a) on peut obtenir une assez bonne approximation def(x) au voisi- nage dea, i.e. de f(a+h) pour hassez petit, en rempla¸cantf(a+h) par la fonction«lin´eaire» h7→f(a) +f′(a)h. Stricto sensu, c’est une application affine, mais comme la valeur en 0 est donn´ee parf(a), «ce qui compte» est l’application lin´eaire h7→ f(a+h)−f(a) =f′(a)h. En r´esum´e, on consid`ere quef :R→R est une «bonne» fonction au voisinage d’un point asi elle poss`ede une «bonne approximation » par une application lin´eaire La : h7→ La(h), la notion de «bonne approximation»ayant le sens pr´ecis que la diff´erence
f(a+h)−f(a)−La(h)
tend vers 0 plus vite que|h|, i.e. quef(a+h) =f(a)+La(h)+|h|ε(h), o`uε:R→Rest une fonction continue et nulle en 0. C’est sous cette forme que la notion de fonction d´erivable va s’´etendre aux fonctionsRn →Rp.
Notations 7.1. — Dans la suite, on munitRn etRp de la normek · k∞ (on pourrait aussi choisir la norme euclidiennek · k2).
On note L(Rn,Rp) l’espace vectoriel (de dimensionnp) des applications lin´eaires Rn → Rp. On rappelle qu’une telle application est lipschitzienne donc continue. D’autre part, L(Rn,Rp) s’identifie `aMp,n(R), l’espace de matrices `aplignes etncolonnes.
En particulier, si n = 1 alors L(R,Rp) = Rp car une application lin´eaire f : R → Rp est d´etermin´ee par la donn´ee du vecteur u = f(1), i.e. on a f(t) = tu pour tout t ∈ R. En termes
(1)v. du 2/12/17 : correction de coquilles dans la d´emo de 9.2 et la d´ef. 10.1, signal´ees par Johan Leydet, Tran Trung Nghiem et Nassim Bourarach, merci `a eux !
matriciels, on aL(R,Rp) =Mp,1(R), ce qui nous conduira dans la suite `a repr´esenter un ´el´ement (y1, . . . , yp) deRp par le vecteurcolonneY =
Öy1
... yp
è
.
D´efinition 7.2 (Limites en 0). — Soitϕ:Rn→Rpune fonction d´efinie sur une boule ouverte B(0, R), sauf en 0, et soitb∈Rp. On ´ecrit
h→0lim
h6=0
ϕ(h) =b
si pour toutε >0 il existeδ >0 tel que pour touth6= 0 v´erifiantkhk< δon aitkϕ(h)−bk< ε.
Dans ce cas, si l’on prolongeϕen 0 en posantϕ(0) =b, on obtient une fonction qui est d´efinie sur B(0, R) et continue en 0. Si de plusb= 0, on dira que la fonction ainsi prolong´ee est«continue et nulle en 0».
D’autre part, si l’on noteϕ1, . . . , ϕp les composantes deϕetb1, . . . , bp celles deb, alors comme kϕ(h)−bk= maxi=1,...,p|ϕi(h)−bi|, on voit que la condition pr´ec´edente ´equivaut `a dire que, pour touti= 1, . . . , p,
h→0lim
h6=0
ϕi(h) =bi.
D´efinition 7.3 (Fonctions d´erivables R→Rp). — Soienta∈ Ret f :R→Rp une fonction
(Q)
d´efinie sur un intervalle ouvertIcontenanta. On«rappelle»quef estd´erivableenasi la limite ℓ= limh→0 h6=0
f(a+h)−f(a) h
existe dans Rp; dans ce cas elle est not´ee f′(a) et l’on a f(a+h) = f(a) +hf′(a) +hε(h), o`u ε:R→Rp est une fonctioncontinue et nulle en 0 (i.e. limh→0ε(h) = 0 =ε(0)).
Notantf1, . . . , fples composantes defetℓ1, . . . , ℓpcelles deℓ, on voit que la condition pr´ec´edente
´equivaut `a dire que, pour touti= 1, . . . , p,
h→0lim
h6=0
fi(a+h)−fi(a)
h =ℓi
i.e. quefiest d´erivable enade d´eriv´eefi′(a) =ℓi. On obtient donc quef est d´erivable enassi les fi le sont, et dans ce cas le vecteur d´eriv´ef′(a) est
f′(a) =
Öf1′(a) ... fp′(a)
è
.
NotantLa(h) l’application lin´eaireR→Rp,h7→hf′(a), on obtient donc que f(a+h)−f(a)−La(h) =hε(h),
o`u ε : R →Rp est une fonction continue et nulle en 0. C’est sous cette forme que la notion de fonction d´erivable s’´etend aux fonctionsRn→Rp, avecn >1.
Commen¸cons par le lemme suivant.
Lemme 7.4. — Soit L:Rn→Rp une application lin´eaire. Si limh→0 h6=0
L(h)
khk = 0alors L= 0.
7. D ´EFINITIONS ET PREMI `ERES PROPRI ´ET´ES 25
D´emonstration. — (2) Fixonsx6= 0 dans Rn. Lorsque le r´eelt >0 tend vers 0, le vecteurtxtend vers 0 et donc, d’apr`es l’hypoth`ese, le vecteurL(tx)/ktxktend vers 0. Or ce vecteur est le vecteur constantL(x)/kxk, d’o`uL(x) = 0.
Terminologie 7.5. — SoientU un ouvert deRn, f une application U →Rp et a∈U. Comme U est ouvert, il existe r > 0 tel que B(a, r) ⊂ U et donc la fonction h 7→ f(a+h)−f(a) est d´efinie pourkhk< r. On utilisera ceci de fa¸con implicite dans la suite quand on dira que certaines fonctions dehsont d´efinies pourh«assez petit».
D´efinition 7.6. — SoientU un ouvert deRn etf une applicationU →Rp.
(Q)
(i) On dit que f est diff´erentiable en un point a de U s’il existe une application lin´eaire La ∈L(Rn,Rp) telle que
(∗) lim
h→0h6=0
f(a+h)−f(a)−La(h) khk = 0.
D’apr`es le lemme pr´ec´edent,Laest uniquement d´etermin´ee si elle existe. Dans ce cas,Laest not´ee df(a) et est appel´eediff´erentielle ouapplication lin´eaire tangentedef ena.
(ii) En posantε(h) =f(a+h)−f(a)−La(h)
khk pour h6= 0 etε(0) = 0, (∗) ´equivaut `a dire que pourhassez petit on a :
(†) f(a+h) =f(a) +df(a)(h) +khkε(h),
avecεcontinue et nulle en 0. On peut r´ecrire cette ´egalit´e avec la notationo() : (‡) f(a+h) =f(a) +df(a)(h) +o(khk),
o`uo(khk) d´esigne une fonctionφ(h) telle que limh→0 h6=0
φ(h)
khk = 0. Avec l’une ou l’autre notation, ceci montre que sif est diff´erentiable ena, elle admet en aun«d´eveloppement de Taylor» `a l’ordre 1, dont le terme lin´eaire estdf(a)(h).
(iii) On dit quef estdiff´erentiable surU si elle est diff´erentiable en tout point deU. Exemples 7.7. — (1) Soit f :Rn →Rp lin´eaire. Alors f est diff´erentiable sur Rn et pour tout
(Q)
a∈Rn on adf(a) =f. En effet, pour touth∈Rn on af(a+h)−f(a) =f(h).(2) L’applicationQ:Rn→R,x7→x·x= (kxk2)2 est diff´erentiable surRn. En effet, pour tout a, h∈Rn on a
Q(a+h) =Q(a) +a·h+h·a+Q(h) =Q(a) + 2a·h+ (khk2)2
donc, notantL(a) :Rn→Rla forme lin´eaireh7→2a·h, on aQ(a+h) =Q(a) +L(a)(h) +o(khk2), ce qui prouve queQest diff´erentiable ena, de diff´erentielledQ(a) =L(a).
(3) L’application de multiplicationm :R2 →R, (x1, x2) 7→x1x2 est diff´erentiable sur R2. En effet, pourx= (x1, x2) eth= (h1, h2) dansR2, on a
(x1+h1)(x2+h2) =x1x2+ (x2h1+x1h2) +h1h2
et |h1h2| ≤ khk2∞, donc dm(x) est la forme lin´eaire Çh1
h2
å
7→x2h1+x1h2, i.e.dm(x) est donn´ee par la matrice ligne (x2, x1).
(2)Indiqu´ee par Laurent Koelblen.
(4) Si n= 1, i.e. si I est un intervalle ouvert deR etf = (f1, . . . , fp) (3) une application de I dansRp, alorsf est diff´erentiable en un point adeI ssif est d´erivable en a(i.e. chaquefi l’est) et dans ce cas pour touth∈Ron a :
df(a)(h) =hf′(a) =h
Öf1′(a) ... fp′(a)
è
.
En effet, on a vu en 7.3 que si f est d´erivable en a elle y est diff´erentiable et df(a) est comme indiqu´e.
R´eciproquement, supposons f diff´erentiable en a. Comme tout L ∈ L(R,Rp) est de la forme h7→hu pour un certainu∈Rp, ceci signifie qu’il existe v∈Rp tel que pour hassez petit on ait f(a+h)−f(a)−hv=|h|ε(h) avecεcontinue et nulle en 0, d’o`u
f(a+h)−f(a)−hv h
=kε(h)k pourh6= 0, et donc
h→0lim
h6=0
f(a+h)−f(a)
h =v.
Ceci montre quef est d´erivable enaetv=f′(a), et donc quedf(a)(h) =hv=hf′(a).
Remarque 7.8. — Sif est diff´erentiable enaelle est continue ena, cardf(a) est continue (´etant lin´eaire) etεest continue en 0.
L’exemple (4) ci-dessus se g´en´eralise comme suit :
Proposition 7.9. — Soient U un ouvert deRn,f = (f1, . . . , fp) (3) une application U →Rp et
(Q)
a∈U. Alors f est diff´erentiable enassi chaque fi l’est, et dans ce cas on a df(a)(h) =Ödf1(a)(h) ... dfp(a)(h)
è
pour touth∈Rn.
D´emonstration. — Se donner une application lin´eaire L:Rn →Rp est «la mˆeme chose» que se donnerpformes lin´eairesLi:Rn→R, i.e. on a
L(h) =
ÖL1(h) ... Lp(h)
è
pour touth∈ Rn. (Du point de vue matriciel, on aL ∈Mp,n(R) et les Li correspondent auxp lignes de cette matrice.) De mˆeme, la fonction ε : Rn → Rp qui apparaˆıt dans la d´efinition 7.6 s’´ecrit
ε(h) =
Öε1(h) ... εp(h)
è
(3)On continue `a ´ecriref= (f1, . . . , fp) pour des raisons typographiques, mais on pense `af(x) comme au vecteur colonnedont les coordonn´ees sont lesfi(x).
7. D ´EFINITIONS ET PREMI `ERES PROPRI ´ET´ES 27
et la condition que ε soit continue et nulle en 0 ´equivaut `a dire que chaque εi l’est. On voit donc que f est diff´erentiable en a ssi il existe des formes lin´eaires L1, . . . , Lp et des fonctions ε1, . . . , εp:Rn→Rcontinues et nulles en 0 telles que
fi(a+h) =fi(a) +Li(a)(h) +khkεi(h),
ce qui ´equivaut `a dire que chaquefi est diff´erentiable enaetLi =dfi(a), et dans ce cas pour tout h∈Rn on a bien
df(a)(h) =
ÖL1(h) ... Lp(h)
è
=
Ödf1(a)(h) ... dfp(a)(h)
è
.
Avant de d´emontrer le th´eor`eme sur la compos´ee d’applications diff´erentiables, introduisons les d´eriv´ees partielles et la matrice jacobienne, qui donneront un aspect plus concret `a la notion de diff´erentielle.
D´efinition 7.10 (D´eriv´ee selon la direction v). — SoitUun ouvert deRn,f une application
(Q)
U → R et a ∈ U. Soit v ∈ Rn non nul. On dit que f admet en a une d´eriv´ee partielle dans la direction vsi la fonction R→R,t7→f(a+tv) est d´erivable ent= 0, i.e. si la limitet→0lim
t6=0
f(a+tv)−f(a) t
existe, auquel cas elle est not´ee ∂f
∂v(a).
Remarque 7.11. — Intuitivement, la d´eriv´ee directionnelle ∂f
∂v(a) mesure les variation de f lorsqu’on se d´eplace au voisinage deadans la directionv`a la vitessekvk.Attention :la terminologie est l´eg`erement abusive, car cette d´eriv´ee d´epend devlui-mˆeme, et pas seulement de la directionRv. En effet, si on remplacevpar un multiple non nulw=λv, alors
∂f
∂w(a) = lim
t→0t6=0
f(a+λtv)−f(a)
t =λ lim
λt→0 t6=0
f(a+λtv)−f(a)
λt =λ∂f
∂v(a).
Ceci explique la remarque«intuitive»plus haut (en prenant pour«unit´e de vitesse»celle donn´ee par le vecteur unitaireu= 1
kvkv).
Conservant les notations pr´ec´edentes, on a en particulier :
D´efinition 7.12 (D´eriv´ees partielles). — Soit (e1, . . . , en) la base canonique deRn. On note,
(Q)
si elle existe, ∂f
∂xi
(a) ou simplement∂if(a) la d´eriv´ee partielle def enadans la directionei, i.e.
∂if(a) = ∂f
∂xi
(a) = lim
t→0t6=0
f(a+tei)−f(a)
t = lim
t→0t6=0
f(a1, . . . , ai−1, ai+t, ai+1, . . . , an)−f(a) t
et l’on dit que c’est la d´eriv´ee partielle def enaselon lai-`eme variable.
Notation 7.13. — Si f admet des d´eriv´ees partielles ∂f
∂xi
(a) en tout point a ∈ U, on obtient ainsi pour tout i= 1, . . . , nune application :
∂f
∂xi
:U→R, a7→ ∂f
∂xi
(a).
Avec la notation ci-dessus, il n’y a pas d’ambigu¨ıt´e, mais souvent on ´ecrita= (x1, . . . , xn), d’o`u l’application
∂f
∂xi
:U→R, (x1, . . . , xn)7→ ∂f
∂xi
(x1, . . . , xn).
On prendra garde que dans cette ´ecriture, lexidans∂xiest un symbole pour d´esigner la d´erivation selon le vecteur ei, tandis que (x1, . . . , xn) est une«variable»qui d´ecrit l’ouvertU.
Le calcul de ∂f
∂xi
(a) consiste donc `a ne d´eriver l’expression def que par rapport `a la variablexi. Exemples 7.14. — (1) Si f :R3→Rest d´efinie par f(x, y, z) =−2xcosy, on a :
∂f
∂x(x, y, z) =−2 cosy, ∂f
∂y(x, y, z) = 2xsiny, ∂f
∂z(x, y, z) = 0.
(2) Soitf :R∗+×R→Rd´efinie parf(x, y) = Arctan(y/x). Comme la d´eriv´ee de Arctan(u) est 1
1 +u2, on a : (†) ∂f
∂x(x, y) = 1 1 + (y/x)2
−y
x2 = −y
x2+y2, ∂f
∂y(x, y) = 1 1 + (y/x)2
1
x = x
x2+y2.
Proposition 7.15. — Soit U un ouvert de Rn et f :U →R. On supposef diff´erentiable en un point a∈U.
(Q)
(i) Alorsf admet des d´eriv´ees partielles ena(4):pour toutv∈Rn−{0}, on a ∂f
∂v(a) =df(a)(v).
(ii) Pour tout h= (h1, . . . , hn)∈Rn on a : df(a)(h) =
Xn j=1
∂f
∂xj
(a)hj.
D´emonstration. — Par hypoth`ese, il existe une fonction ε: Rn → R continue et nulle en 0 telle qu’on ait
f(a+h)−f(a)−df(a)(h) =khkε(h)
pour touth∈Rnde norme assez petite. Fixonsv∈Rn−{0}et appliquons ce qui pr´ec´ede `ah=tv, o`utparcourt un petit intervalle ouvert ]−r, r[. Alors, pour t6= 0 on obtient
f(a+tv)−f(a)
t −df(a)(v) =kvkε(tv) =ϕ(t) et t 7→ϕ(t) est continue et nulle en 0. Ceci montre que la d´eriv´ee partielle ∂f
∂v(a) existe et vaut df(a)(v).
En particulier, pour v =ej on obtient df(a)(ej) = ∂f
∂ej
(a) = ∂f
∂xj
(a). Enfin, commedf(a) est lin´eaire, pourh= (h1, . . . , hn) =P
jhjej on obtient : df(a)(h) =X
j
hjdf(a)(ej) =X
j
∂f
∂xj
(a)hj.
Corollaire 7.16. — Soient U 6= ∅ un ouvert connexe de Rn et f : U → Rp diff´erentiable. Si df(a) = 0pour tout a∈U, alorsf est constante sur U.
(4)On verra dans la section suivante que la r´eciproque est fausse en g´en´eral, mais que sif admet surUdes d´eriv´ees partielles qui sontcontinues, alorsfest diff´erentiable surU.
7. D ´EFINITIONS ET PREMI `ERES PROPRI ´ET´ES 29
D´emonstration. — Soita∈U et c=f(a) ; notonsUc={x∈U |f(x) =c}. Montrons queUc est unouvert. Soitx∈Uc; il exister >0 tel que la boule ouverteB=B(x, r) soit contenue dansU. Pour tout y ∈B, le segment [x, y] est contenu dansB, donc dans U. L’applicationγ :R →Rn, t7→x+t(y−x) est d´erivable etγ([0,1]) = [x, y]. CommeU est ouvert, γ−1(U) est un intervalle ouvertIcontenant [0,1]. D’apr`es le point (iii) du th´eor`eme pr´ec´edent,f◦γ:I→Rpest d´erivable, de d´eriv´ee nulle, donc constante. Il en r´esultef(y) =f(x). Ceci prouve que B est contenue dans Uc, doncUc est ouvert.
Pour tout r´eelµ, le mˆeme raisonnement montre que Uµ={x∈U |f(x) =µ}est un ouvert de U, donc Ω =S
µ6=cUµ est un ouvert deU, disjoint de Uc et tel queU =Uc⊔Ω. Comme U est suppos´e connexe et queUc est non vide (car il contienta), on en d´eduit queU =Uc (et Ω =∅), i.e.f est constante sur U, de valeurc.
Bien entendu, il est n´ecessaire de supposerU connexe. Sinon on peut prendre U =R− {0}et f(x) = 1 si x >0,f(x) =−1 si x <0.
On a vu plus haut (7.15) que si f : Rn → R est diff´erentiable ena, alors df(a) est la forme lin´eaireRn→Rdonn´ee par
df(a)(h) = ∂f
∂x1
(a)h1+· · ·+ ∂f
∂xn
(a)hn
i.e.df(a) est donn´ee par la matriceligne:
(⋆) ∂f
∂x1
(a), . . . , ∂f
∂xn
(a) .
D´efinition 7.17 (Matrice jacobienne). — Soit maintenant f = (f1, . . . , fp) une fonction Rn→Rp. D’apr`es la proposition 7.9,f est diff´erentiable en un pointassi chaquefi l’est, et dans ce cas pour touth∈Rn on a :
df(a)(h) =
Ödf1(a)(h) ... dfp(a)(h)
è
.
Tenant compte de l’expression pour chaque dfi(a)(h) donn´ee en (⋆) plus haut, on obtient que la matrice dedf(a) est la matrice
(Q)
Df(a) = Å∂fi
∂xj
ã
1≤i≤p 1≤j≤n
=
à∂f1
∂x1
(a) · · · ∂f1
∂xn
(a)
... ...
∂fp
∂x1
(a) · · · ∂fp
∂xn
(a) í
dont lai-`eme ligne est donn´ee pardfi(a). Cette matrice est appel´eematrice jacobiennedef en a. Lorsquep=n,Df(a) est une matrice carr´ee et on noteJf(a) son d´eterminant, qu’on appelle le (d´eterminant)jacobiendef ena.
Revenant au casn, parbitraires, rappelons que pour toute application lin´eaireu:Rn→Rp, de matrice A∈ Mp,n(R), l’image paru d’un vecteurx= (x1, . . . , xn) s’obtient en appliquant A au vecteurcolonneX=
Öx1
... xn
è
, i.e. l’´el´ementu(x) deRpest donn´e par le vecteur colonneAX∈Rp.
Th´eor`eme 7.18. — Soient U, V des ouverts de Rn et Rp et f : U → V et g : V → Rq des
(Q)
applications.(i) Sif est diff´erentiable en aetg enf(a), alors g◦f est diff´erentiable en aet l’on a :
(⋆) d(g◦f)(a) =dg(f(a))◦df(a).
(ii) Sif est diff´erentiable sur U etg surV, alors g◦f est diff´erentiable sur U.
(iii) En particulier, sin= 1 etU=I est un intervalle ouvert de R, l’application g◦f :I→Rp est d´erivable et pour toutt∈I on a :
(∗) (g◦f)′(t) =dg(f(t))(f′(t)).
D´emonstration. — (i) Posons b = f(a). Par hypoth`ese, il existe des fonctions η : Rn → Rp et µ:Rp→Rq, continues et nulles en 0, telles que pourh∈Rn eth′∈Rp assez petits, on ait :
f(a+h) =b+df(a)(h) +khkη(h) g(b+h′) =g(b) +dg(b)(h′) +kh′kµ(h′).
Pourhassez petit, posons
k(h) =f(a+h)−f(a) =df(a)(h) +khkη(h).
Alors pourh6= 0 on a
g(f(a+h))−g(b)−dg(b)(df(a)(h))
khk =dg(b)(η(h)) +kk(h)k
khk µ(k(h)).
Montrons que le membre de droite tend vers 0 quand h6= 0 tend vers 0. Pour le premier terme c’est clair, cardg(b) est continue (car lin´eaire) etη est continue et nulle en 0.
Notons ψ(h) le second terme. Comme η est continue et nulle en 0, il existe δ0 > 0 tel que kη(h)k<1 sikhk< δ0. Commedf(a) estL-lipschitzienne, posantC=L+ 1, on obtient que pour touthtel quekhk< δ0, on a
kk(h)k ≤Ckhk et donc kψ(h)k ≤Ckµ(k(h))k. Commeµ◦kest continue et nulle en 0, il en r´esulte que limh→0
h6=0ψ(h) = 0. Ceci prouve (i) et (ii).
D´eduisons-en le cas particulier (iii). D’apr`es 7.7 (4), une applicationφ:I→Rq est diff´erentiable en un pointt ssi elle est d´erivable entet dans ce casdφ(t) est l’application lin´eaireh7→hφ′(t).
Ici, on sait d’apr`es (i), queg◦f est diff´erentiable ent, de diff´erentielledg(f(t))◦df(t). Ordf(t) est l’application lin´eaireR→Rn,h7→hf′(t) et doncd(g◦f)(t) est l’application lin´eaireR→Rn, h7→hdg(f(t))(f′(t)). Il en r´esulte que (g◦f)′(t) =dg(f(t))(f′(t)).
Remarque 7.19. — La d´efinition de la diff´erentiabilit´e et le th´eor`eme pr´ec´edent illustrent un principe g´en´eral en math´ematiques : il a fallu travailler un peu pour ´etablir la d´efinition (i.e. montrer quedf(a) est unique si elle existe) puis pour d´emontrer le th´eor`eme, mais ce travail ayant ´et´e fait une fois pour toutes, on dispose d’une notion qui est facile `a manipuler, comme le montre la jolie formuled(g◦f)(a) =dg(f(a))◦df(a), dont on verra plus bas la traduction en termes de produit de matrices.
Remarque 7.20 (Traduction matricielle). — Le th´eor`eme pr´ec´edent s’´ecrit en termes matri- ciels comme suit. Consid´erons des ouvertsU ⊂Rn et V ⊂Rp et des applications diff´erentiables f :U →V et g:V →Rq. Pour touta∈U, soitA=Df(a)∈Mp,n(R) la matrice jacobienne def enaetB =Dg(f(a))∈Mq,p(R) celle deg enb=f(a). Alors la matrice jacobienne deg◦f ena
(Q)
estD(g◦f)(a) =BA.
7. D ´EFINITIONS ET PREMI `ERES PROPRI ´ET´ES 31
Remarque 7.21(Attention !). — Contrairement aux fonctions d’une seule variable, o`u l’on peut ´ecrire (g◦ f)′(a) = g′(f(a))f′(a) = f′(a)g′(f(a)) (puisque le produit dans Rest commutatif), l’ordre d’apparition des dif- f´erentielles dans la formuled(g◦f)(a) =dg(f(a))◦f(a) est extrˆemement important. En effet,df(a) va deRn→Rp etdg(f(a)) va deRpdansRq, donc on ne peut mˆeme pas les composer dans le«mauvais sens»sin6=q. Et mˆeme sin=p=q, la composition dans le«mauvais sens»ne donne pas le bon r´esultat, puisque la multiplication dans Mn(R) n’est pas commutative.
Remarque 7.22. — ´Ecrivons la diff´erentielle d’une compos´ee Rn f //Rp g //Rq en termes de d´eriv´ees partielles. PosonsA=Df(a) etB =Dg(f(a)), alorsD(g◦f) =BA. Donc pour tout j= 1, . . . , neti= 1, . . . , q, on a
(BA)ij = Xp k=1
BikAkj.
Si l’on note (u1, . . . , up) les coordonn´ees surRp, alors on a Bik= ∂gi
∂uk
(f(a)) et Akj = ∂fk
∂xj
(a) et donc l’´egalit´e pr´ec´edente donne :
(Q)
(†) ∂(g◦f)i
∂xj
(a) = Xp k=1
∂gi
∂uk
(f(a))∂fk
∂xj
(a).
Le calcul consiste donc `a : d´erivergipar rapport `a la variableuket ´evaluer le r´esultat enf(a), puis multiplier par la d´eriv´ee defk par rapport `a la variablexj ´evalu´ee ena, puis sommer par rapport
`ak.
Proposition 7.23. — Soient U un ouvert de Rn,f, g deux applications diff´erentiables U →Rp, eta∈U.
(Q)
(i) Pour toutλ, µ∈R,λf+µg est diff´erentiable en aetd(λf +µg)(a) =λdf(a) +µdg(a).
(ii) Sip= 1, alorsf g est diff´erentiable enaetd(f g)(a) =f(a)dg(a) +g(a)df(a).
D´emonstration. — (i) est laiss´e en exercice ; prouvons (ii). D’apr`es la proposition 7.9, l’application F :Rn→R2,x7→(f(x), g(x)) est diff´erentiable ena, et pour touth∈Rn on a
dF(a)(h) = df(a)(h), dg(a)(h) .
D’autre part, d’apr`es l’exemple 7.7 (3), l’applicationm:R2→R, (x1, x2)7→x1x2, est diff´erentiable surR2 et sa diff´erentielle enF(a) = (f(a), g(a)) est la forme lin´eaire (h1, h2)7→g(a)h1+f(a)h2.
D’apr`es le th´eor`eme 7.18, l’applicationf g=m◦F est donc diff´erentiable ena, de diff´erentielle d(f g)(a) =dm(F(a))◦dF(a), i.e. pour touth∈Rn on a
d(f g)(a)(h) =dm(F(a)) df(a)(h), dg(a)(h)
=g(a)df(a)(h) +f(a)dg(a)(h) i.e.d(f g)(a) est la forme lin´eaireg(a)df(a) +f(a)dg(a).
Apr`es ces g´en´eralit´es sur les applications diff´erentiables, donnons un crit`ere concret et utile de diff´erentiabilit´e, qui sera v´erifi´e par la plupart des fonctions consid´er´ees dans ce cours.
D´efinition 7.24 (Fonctions de classe C1). — Soient U ⊂ Rn un ouvert et f : U → R une application. On dit que f est de classe C1 sur U si f admet des d´eriv´ees partielles ∂jf pour j= 1, . . . , net si celles-ci sontcontinuessurU.
(Q)
De mˆeme, pourf = (f1, . . . , fp) :U →Rp on dit quef est de classeC1 si chaquefi l’est : ceci
´equivaut `a dire que l’application
Φ :U →Mp,n(R), a7→
à∂f1
∂x1
(a) · · · ∂f1
∂xn
(a)
... ...
∂fp
∂x1
(a) · · · ∂fp
∂xn
(a) í
estcontinue.
On noteraC1(U,Rp) l’ensemble des fonctions de classeC1 surU `a valeurs dansRp.
Th´eor`eme 7.25. — SoientU ⊂Rn un ouvert et f ∈C1(U,Rp). Alors f est diff´erentiable sur U
(Q)
et l’applicationDf :U →Mp,n(R), a7→Df(a) est une application continue.
D´emonstration. — D’abord, en consid´erant les composantes f1, . . . , fp def, il suffit de traiter le le cas p= 1. Faisons alors la d´emonstration pour p= 1 et n = 3, ce qui est suffisant pour bien comprendre l’id´ee. On utilise la normek · k∞. Soita∈U. Quitte `a faire le changement de variable x′ =a+x, on peut supposer a= 0, ce qui va permettre d’all´eger l’´ecriture. Fixonsε >0.
Soit r > 0 tel que B(a, r) ⊂ U. Pourj = 1,2,3, comme ∂jf est continue en a = 0, il existe δj ∈]0, r[ tel que |∂jf(x)−∂jf(0)|< ε/3 si kxk < δj. Posons δ= mini=1,2,3δi, alors pour tout x∈B(0, δ) on a
(∗) |∂jf(x)−∂jf(0)|<ε
3.
Soit h = (h1, h2, h3) ∈ B(0, δ), alors (h1, h2,0) et (h1,0,0) sont aussi dans B(0, δ). Comme f est d´erivable par rapport `a la variable x3 au point (h1, h2,0) alors, d’apr`es le th´eor`eme des accroissements finis en une variable, il existe un r´eelθ3∈[0,1] (d´ependant deh1, h2eth3) tel que(5)
f(h1, h2, h3)−f(h1, h2,0) =∂3f(h1, h2, θ3h3)h3. De mˆeme, il existeθ2∈[0,1] (d´ependant deh1eth2) tel que
f(h1, h2,0)−f(h1,0,0) =∂2f(h1, θ2h2,0)h2
etθ1∈[0,1] (d´ependant deh1) tel que
f(h1,0,0)−f(0,0,0) =∂1f(θ1h1,0,0)h1. En sommant ces trois ´egalit´es, soustrayantL(h) =P3
i=1∂if(0,0,0)hi et utilisant (∗), on obtient f(h)−f(0)−L(h)≤ε
3 X3 i=1
|hi| ≤εkhk∞.
Ceci prouve quef est diff´erentiable ena= 0, de diff´erentielle la forme lin´eaire L: (h1, h2, h3)7→
X3 j=1
∂f
∂xj
(a)hj.
(5)C’est la formulef(b)−f(a) = (b−a)f′(c) pour unc∈[a, b] que l’on ´ecritc=a+θ(b−a) avecθ∈[0,1].
7. D ´EFINITIONS ET PREMI `ERES PROPRI ´ET´ES 33
De plus, l’application df : U → L(R3,R) = M1,3(R) (matrices `a une ligne et 3 colonnes) est donn´ee par
a7→ ∂1f(a), ∂2f(a), ∂3f(a)
donc est continue. De mˆeme, pourpet narbitraires, l’application Df :U →Mp,n(R) associe `a a la matrice
Å∂fi
∂xj
(a) ã
dont la composante d’indice (i, j) est ∂fi
∂xj
qui est continue sur U, doncDf est bien continue. Ceci ach`eve la preuve du th´eor`eme.
Remarque 7.26(Attention !). — Il faut se garder de croire que l’application U → Mp,n(R), a 7→ Df(a) est lin´eaire : en effet, chaque coefficient d’indice (i, j) de la matriceDf(a) est donn´e par ∂fi
∂xj
(a), qui en g´en´eral n’est pas une fonction lin´eaire deaet peut ˆetre arbitrairement compliqu´ee. Par exemple, pourU = Retf :R→R, x7→xn, c’est l’applicationU→M1,1(R) qui `a touta∈Uassocie la matrice (nan−1).
Ou bien, si l’on pr´ef`ere, soitf :R2 →R2, (x, y)7→(x3+y4, x5+y6). Alorsf est de classeC1 et pour tout (x, y)∈R2, on a
Df(x, y) =
Å3x2 4y3 5x4 6y5
ã
.
Remarques 7.27. — 1) Une fonction dont toutes les d´eriv´ees partielles existent n’est pas n´ecessairement diff´erentiable. Par exemple, soitf:R2→Rd´efinie, pour tout (x, y)∈R2, par
f(x, y) =
xy(x+y)
x2+y2 si (x, y)6= (0,0), 0 si (x, y) = (0,0).
Alors,f est de classeC1 surU =R2− {(0,0)}. De plus, pour tout (x, y) on a max(|x|,|y|)≤p x2+y2 donc|f(x, y)| ≤2p
x2+y2doncfest continue en 0 = (0,0).(6)De plus, pour tout vecteur non nulv= ab et toutt6= 0, on a
f(0 +tv)−f(0)
t =t3ab(a+b)
t3(a2+b2) = ab(a+b) a2+b2 , doncfest d´erivable en 0 dans la directionv. En particulier, pourv= 10
=e1(resp. 01
=e2) on obtient (∂f /∂x1)(0) = 0 (resp. (∂f /∂x2)(0) = 0). Doncfadmet en 0 des d´eriv´ees dans toutes les directions. Mais f n’est pas diff´erentiable en 0. En effet, si elle l’´etait alors d’apr`es la proposition 7.15 on auraitdf(0) = 0 et donc le rapport
f(x, y)−f(0) k(x, y)k2
= xy(x+y) (x2+y2)3/2
devrait tendre vers 0 quand (x, y) tend vers 0. Mais ceci n’est pas le cas : si ce rapport est bien nul sur les droiteske1 etke2 (et aussi sur la droite d’´equationx+y= 0), sur chaque droitey=µxon a pourx6= 0 :
xy(x+y)
(x2+y2)3/2 = x3µ(1 +µ)
|x|3(1 +µ2)3/2 =
µ(1 +µ)
(1 +µ2)3/2 six >0,
−µ(1 +µ)
(1 +µ2)3/2 six <0.
2) D’autre part, la fonctionR→Rd´efinie parf(0) = 0 etf(x) =x2sin(1/x) est d´erivable surRmais sa d´eriv´ee n’est pas continue en 0. On a donc, lorsqueU est un ouvert deRn avecn≥2, des inclusions strictes :
C1(U,R)⊂ {fonctions diff´erentiables surU} ⊂ {fonctionsf:U →Radmettant des d´eriv´ees partielles}
(6)Pour (x, y)6= (0,0) on peut aussi passer en coordonn´ees polaires :f(r, θ) =rcos(θ) sin(θ)(cos(θ) + sin(θ))≤2r.
Exercice 7.28. — SoitU l’ouvertR2− {(x,0)|x≤0}. Soientr:R2− {(0,0)} →Retg:U →R les fonctions d´efinies parr(x, y) =p
x2+y2 etg(x, y) = 2 Arctan y x+r(x, y)
. On rappelle que la d´eriv´ee de Arctan(t) est Arctan′(t) = 1/(1 +t2). Calculer les d´eriv´ees partielles ∂xret ∂yr sur R2− {(0,0)} et les d´eriv´ees partielles∂xg et ∂yg sur U. Montrer que l’applicationF :U →R2, (x, y)7→(r(x, y), g(x, y)) est de classeC1.
R´eponse partielle : ∂g
∂x(x, y) = −y
x2+y2 et ∂g
∂y(x, y) = x x2+y2.
Signalons au passage la proposition suivante. Comme les d´eriv´ees partielles s’obtiennent en d´erivant par rapport `a une seule variable, elles jouissent des mˆemes propri´et´es que celles connues pour les fonctions d’une seule variable ; la d´emonstration est donc omise.
Proposition 7.29. — Soient f, g : Rn → R deux fonctions admettant en a une d´eriv´ee partielle par rapport `a la variablexi.
(i) Pour toutλ, µ∈R,λf+µgadmet enaune d´eriv´ee partielle par rapport `a la variablexiet
∂(λf+µg)
∂xi
(a) =λ∂f
∂xi
(a) +µ∂g
∂xi
(a).
(ii) f gadmet une d´eriv´ee partielle en apar rapport `a la variablexiet
∂(f g)
∂xi
(a) =f(a)∂g
∂xi
(a) +g(a)∂f
∂xi
(a).
(iii) Sif(a)6= 0alors1/f admet une d´eriv´ee partielle ena par rapport `a la variablexi et
∂(1/f)
∂xi
(a) = −1 f(a)2
∂f
∂xi
(a).
8. Diff´eomorphismes. Exemple des coordonn´ees polaires, cylindriques et sph´eriques D´efinition 8.1. — Soient U un ouvert de Rn et f :U →Rn une application de classe C1. On dit quef est unC1-diff´eomorphismede U sur son image si les trois conditions suivantes sont v´erifi´ees :
(Q)
a) f est injective.
b) V =f(U) est un ouvert deRn.
c) La bijection r´eciproquef−1:V →U est de classeC1.
Alors les ´egalit´esf−1(f(x)) =xpour tout x∈U et f(f−1(y)) =y pour touty∈V entraˆınent, d’apr`es la formule de diff´erentiation des fonctions compos´ees (Th. 7.18), les ´egalit´es :
d(f−1)(f(x))◦df(x) = id, df(f−1(y))◦d(f−1)(y) = id pour toutx∈U,y∈V. Ceci montre que les conditions (a,b,c) ci-dessus entraˆınent :
d) Chaque df(x) est inversible et la diff´erentielle de f−1 en f(x) est l’application lin´eaire df(x)−1. En termes matriciels, ceci signifie que la matrice jacobienne Df−1(f(x)) est la matrice inverse de la matriceDf(x).
Donc, la condition d) que chaquedf(x) soit inversible est une conditionn´ecessairepour quef soit un diff´eomorphisme. Elle n’est pas suffisante, car elle n’entraˆıne pas quef soit injective : on le verra plus bas lors de l’introduction des coordonn´ees polaires. Donnons ici un autre exemple, d’ailleurs
8. DIFF ´EOMORPHISMES. COORDONN ´EES POLAIRES, CYLINDRIQUES ET SPH ´ERIQUES 35
li´e aux coordonn´ees polaires. Soitf :R2→R2l’application d´efinie parf(x, y) = (excosy, exsiny).
La matrice jacobienne
Df(x, y) =
Çexcosy −exsiny exsiny excosy
å
a pour d´eterminant e2x donc est inversible pour tout (x, y) ∈R2. Mais f n’est pas injective car f(x, y+2π) =f(x, y). On peut montrer (cf. les coordonn´ees polaires plus bas) quef(R2) est l’ouvert R2−{(0,0)}.(7)Mais, d’apr`es un th´eor`eme que l’on verra plus loin (le th´eor`eme d’inversion locale), on a le r´esultat suivant, que nous admettrons pour le moment.
Corollaire 8.2 (du th. d’inversion locale). — SoientU un ouvert deRn etf :U →Rn une application injectivede classeC1telle quedf(x)soit inversible pour toutx∈U. AlorsV =f(U)est un ouvert deRnetf est unC1-diff´eomorphisme deU surV, i.e. l’application inversef−1:V →U est de classe C1.
D´efinition 8.3 (Coordonn´ees polaires). — L’application f : R∗
+ × R → R2, (r, θ) 7→
(rcosθ, rsinθ) est de classeC1 : sa matrice jacobienne en tout point (r, θ) est
(Q)
Df(r, θ) =
Çcosθ −rsinθ sinθ rcosθ
å .
Le d´eterminant jacobien est ´egal `a r > 0, doncDf(r, θ) est inversible. Tout point (x, y)6= (0,0) s’´ecrit (rcosθ, rsinθ) o`urest d´etermin´e parr=p
x2+y2etθest unique modulo 2π. Donc, pour que f soit injective il faut la restreindre `a R∗
+×I, o`u I est un intervalle ouvert ]α, α+ 2π[ de longueur 2π; on obtient alors que f induit une bijection deR∗+×I sur l’ouvertVα=R2 priv´e de la demi-droiteDα={r(cosα,sinα)|r∈R+}. Un choix usuel est de prendreα=−π. On obtient ainsi un C1-diff´eomorphisme entreU =R∗+× ]−π, π[ et l’ouvert V =R2 priv´e de la demi-droite ferm´ee form´ee des r´eels≤0. On obtient ainsi les«coordonn´ees polaires»(r, θ) surV, i.e. pour tout pointM = (x, y) deV, ses coordonn´ees polaires sont l’unique couple (r, θ)∈U tel quex=rcosθ ety=rsinθ.(8)
x y
θ r
M
O
Exemple 8.4. — ´Etudions le diff´eomorphisme inverseφ=V →U, (x, y)7→(r, θ). Il est clair que r=r(x, y) =p
x2+y2. Pour exprimerθ, si l’on se place dans le demi-plan d’´equation x >0, on peut ´ecrire queθ= Arctan(y/x). On a des formules analogues dans chacun des demi-plansx <0,
(7)Exercice. Via l’identificationC=R2, `a quoi correspond l’applicationf?
(8)Les figures qui suivent sont dues `a Laurent Koelblen.
y >0 ouy <0. Mais on peut obtenir une formule uniforme en utilisant l’astuce suivante. Comme 1 + cosθ= 2 cos2(θ/2) et sinθ= 2 sin(θ/2) cos(θ/2), on a pour−π < θ < π:
tan(θ/2) = sinθ
1 + cosθ = y
r+x = y
x+p x2+y2 d’o`uθ= 2 Arctan y
x+p x2+y2
=g(x, y).
Au point (x, y) =f(r, θ), on sait que Dφ(x, y) =Df(r, θ)−1=
Çcosθ −rsinθ sinθ rcosθ
å−1
=1 r
Çrcosθ rsinθ
−sinθ cosθ å
.
On en d´eduit, sans calcul suppl´ementaire, que :
∂r
∂x(x, y) = cosθ= x
px2+y2, ∂r
∂y(x, y) = sinθ= y px2+y2
et ∂g
∂x(x, y) =−sinθ
r = −y
x2+y2, ∂g
∂y(x, y) =cosθ
r = x
x2+y2. On retrouve ainsi les r´esultats d’un exercice pr´ec´edent.
D´efinition 8.5 (Coordonn´ees cylindriques). — L’applicationf :R∗+×R2 →R3, (r, θ, z)7→
(rcosθ, rsinθ, z) est de classeC1: sa matrice jacobienne en tout point (r, θ, z) est
(Q)
Df(r, θ, z) =
Ñcosθ −rsinθ 0 sinθ rcosθ 0
0 0 1
é .
Le d´eterminant jacobien est ´egal `a r >0, doncDf(r, θ, z) est inversible. ToutM = (x, y, z) deR3 avec (x, y)6= (0,0) (i.e.M 6∈Oz) s’´ecrit (rcosθ, rsinθ, z) o`urest d´etermin´e parr=p
x2+y2et θ est unique modulo 2π. Comme pr´ec´edemment, pour que f soit injective il faut la restreindre `a R∗+×I×R, o`uIest un intervalle ouvert ]α, α+ 2π[ de longueur 2π; on obtient alors quef induit une bijection deR∗+×I×R sur l’ouvertVα=R3 priv´e du demi-plan Hα ={(rcosα, rsinα, z)| r∈R+, z∈R}. Un choix usuel est de prendreα=−π. On obtient ainsi unC1-diff´eomorphisme entreU =R∗+×]−π, π[×Ret l’ouvertV =R3 priv´e du demi-plan ferm´eH ={(x,0, z)|x≤0}. On obtient ainsi les«coordonn´ees cylindriques» (r, θ, z) surV, i.e. pour tout pointM = (x, y, z) deV, ses coordonn´ees cylindriques sont l’unique triplet (r, θ, z)∈U tel quex=rcosθ,y=rsinθ etz=z.
x y
z
θ r
M
M′ I
O
8. DIFF ´EOMORPHISMES. COORDONN ´EES POLAIRES, CYLINDRIQUES ET SPH ´ERIQUES 37
D´efinition 8.6 (Coordonn´ees sph´eriques). — Dans R3, on introduit les coordonn´ees sph´e- riques comme suit. Posons O = (0,0,0). Pour tout M = (x, y, z) 6= O on pose r = OM = px2+y2+z2 et l’on noteθ l’unique ´el´ement de [0, π] tel que z=rcosθ. SiM n’appartient pas
`a la droiteOz, i.e. si 0 < θ < π, alors notantM′ le projet´e orthogonal de M sur le planOxy et ρ=OM′ =rsinθ >0, on a M′ =ρ(cosϕ,sinϕ,0), avecϕ unique modulo 2π. On dit alors que (r, θ, ϕ) sont les«coordonn´ees sph´eriques»deM.
Autrement dit, l’applicationf :R∗
+×]0, π[×R→R3,
(Q)
(r, θ, ϕ)7→(rsinθcosϕ, rsinθsinϕ, rcosθ) est de classeC1, sa matrice jacobienne en un point (r, θ, ϕ) est
Df(r, θ, ϕ) =
Ñsinθcosϕ rcosθcosϕ −rsinθsinϕ sinθsinϕ rcosθsinϕ rsinθcosϕ
cosθ −rsinθ 0
é
et son d´eterminant jacobien vautr2sinθ, qui est>0. D’apr`es ce qui pr´ec`ede, pour tout intervalle ouvertI= ]α, α+2π[ de longueur 2π,f induit une bijection deR∗
+×]0, π[×Isur l’ouvertVα=R3 priv´e du demi-plan Hα = {(rcosα, rsinα, z) | r ∈ R+, z ∈ R}. Le choix usuel est de prendre α = −π. On obtient ainsi un C1-diff´eomorphisme entre U = R∗+× ]0, π[ × ]−π, π[ et l’ouvert V = R3 priv´e du demi-plan ferm´e H = {(x,0, z) | x ≤ 0}. On obtient ainsi les« coordonn´ees sph´eriques» (r, θ, ϕ) sur V, i.e. pour tout point M = (x, y, z) de V, ses coordonn´ees sph´eriques sont l’unique triplet (r, θ, ϕ)∈U tel quex=rsinθcosϕ,y =rsinθsinϕet z=rcosθ.
x y
z
ϕ θ
r M
M′ I
O
Remarque 8.7. — Le diff´eomorphisme inverse est donn´e parr =p
x2+y2+z2,θ= Arccos(z/r) et ϕ est donn´e par la mˆeme formule que pour les coordonn´ees polaires dans le planOxy.
Remarque. — Les coordonn´ees sph´eriques diff`erent des coordonn´ees«g´eographiques», o`uθ∈[−π/2, π/2] est d´efini parz=rsinθ, i.e. dans ces coordonn´ees on mesureθ(variant entre−90 et +90 degr´es) `a partir de l’´equateur, tandis que dans les coordonn´ees sph´eriques on mesureθ(en radians) `a partir du pˆole Nord.
Remarque 8.8. — Pour que les coordonn´ees polaires dans R2 soient les restrictions `a R2 des coordonn´ees sph´eriques dans R3 (et que les notations des coordonn´ees cylindriques et sph´eriques soient compatibles), il serait plus astucieux d’utiliser la notation (ρ, ϕ) (resp. (ρ, ϕ, z)) pour les coordonn´ees polaires (resp. cylindriques). C’est d’ailleurs la convention adopt´ee en physique :
x y z
ϕ ρ
M
M′ I
O
Terminons cette section avec la d´efinition du gradient def puis la notion de point critique.
D´efinition 8.9 (gradient). — Soient U un ouvert de Rn et f : U → R une application dif- f´erentiable. On a vu que pour tout a ∈ U, df(a) est une forme lin´eaire sur Rn. Comme il est psychologiquement plus facile (et plus visuel) de travailler avec des vecteurs que des formes li- n´eaires, on fait ce qui suit.
(1) On munit Rn du produit scalaire standardx·y = P
ixiyi et l’on munit d´esormais, sauf mention du contraire,Rn de la norme euclidiennek · k2, qu’on notera simplementk · k.
(2) Le produit scalaire induit un isomorphismeθentreRnet son dual, donn´e parθ(x)(h) =x·h pour toutx, h ∈Rn. Par cons´equent, pour toute forme lin´eaireφ :Rn →R, il existe un unique vecteuru=uφ tel que φ(h) =u·hpour touth∈Rn.
(3) Le vecteur colonne deRn correspondant `a la forme lin´eairedf(a) est not´e∇f(a) et appel´e legradientdef ena; on a donc :
(Q)
∇f(a) =
Ö∂1f(a) ...
∂nf(a) è
et df(a)(h) =∇f(a)·h= Xn i=1
∂if(a)hi
pour touth= (h1, . . . , hn).
D´efinitions 8.10 (Extrema locaux). — Soient U un ouvert de Rn,f une applicationU →R eta∈U.
(i) On dit que f admet en a un minimum (resp. maximum) local s’il existe r > 0 tel que B(a, r)⊂U et f(a)≤f(x) (resp.f(a)≥f(x)) pour toutx∈B(a, r).
(ii) On dit quef admet enaun minimum (resp. maximum) global sif(a)≤f(x) (resp.f(a)≥ f(x)) pour toutx∈U.
(iii) On utilisera le mot «extremum»(9) (local ou global) pour d´esigner sans distinction un maximum ou un minimum (local ou global).
(iv) Il est clair qu’un extremum global esta fortiori un extremum local. Mais il se peut que f admette des extrema locaux mais aucun extremum global. Par exemple, siP(x) est un polynˆome de degr´e 3 ayant trois racines r´eelles, par exempleP(x) =x(x2−1), alorsP admet un maximum local et un mininum local (en les points o`u le polynˆome d´eriv´eP′(x) s’annule) mais aucun extremum global.
(9)Le pluriel estextrema.
9. IN ´EGALIT´E DES ACCROISSEMENTS FINIS 39
D´efinition 8.11. — SoientU un ouvert deRn et f :U →Rune application diff´erentiable. On dit que a ∈ U est un point critique de f si df(a) = 0, ce qui ´equivaut `a dire que le gradient
∇f(a) est nul.
Proposition 8.12. — Soient U un ouvert de Rn etf :U →R une application diff´erentiable. Si
(Q)
f admet un extremum local en a∈U, alorsa est un point critique de f (i.e.df(a) = 0).D´emonstration. — Supposons par exemple quef ait un minimal local ena. Il exister >0 tel que f(a+h) ≥ f(a) pour touth ∈ Rn v´erifiant khk < 2r. Fixons un tel h, posons I = ]−1,1[ et consid´erons la fonctiong:I→Rd´efinie parg(t) =f(a+th). Alors gest d´erivable surI et
g′(t) =df(a+th)(h)
pour toutt∈I; en particulier g′(0) =df(a)(h). D’autre part, commeg a un minimum local en 0, on ag′(0) = 0. Rappelons la d´emonstration : pour toutt∈I on ag(t)−g(0)≥0 donc
t→0lim−
g(t)−g(0)
t ≤0≤ lim
t→0+
g(t)−g(0) t
et doncg′(0), qui est la valeur commune des deux limites, est nul. On a donc df(a)(h) = 0 pour tout hv´erifiantkhk<2r. Comme on l’a d´ej`a vu, ceci entraˆıne queL=df(a) est nulle : en effet, pour h6= 0 arbitraire, posonsλ=khk/r et h′ = (1/λ)h, alorskh′k =r <2r doncL(h′) = 0, et commeh=λh′ on aL(h) =λL(h′) = 0.
Etre un point critique est donc une condition n´ecessaire pour ˆetre un extremum. Elle n’estˆ cependant pas suffisante au regard des exemples suivants.
Exemples 8.13. — (1) Soit f : R2 → R la fonction d´efinie par f(x, y) = x2 −y2 pour tout (x, y)∈R2. Elle est diff´erentiable puisque c’est un polynˆome. Pour tout (x, y)∈R2,df(x, y) est la forme lin´eaire donn´ee par la matrice ligne :
Å∂f
∂x(x, y),∂f
∂y(x, y) ã
= (2x,−2y)
qui s’annule en (0,0) (et en ce point uniquement). Donc (0,0) est un point critique def. Mais,f(0,0) = 0 et pour toutε6= 0 on a
f(ε,0) =ε2> f(0,0)>−ε2=f(0, ε) doncf n’a pas enade maximum ou minimum local.
(2) Un autre exemple est donn´e parf :R→R, x7→x3. La d´eriv´eef′(x) = 3x2 s’annule en 0 maisf n’a pas en 0 un extremum local carf(x)> f(0)> f(−x) pour toutx >0.
Pour avoir plus d’information afin de d´ecider si un point critiqueadef est un extremum local, on supposera dans la section 10 quef admet des d´eriv´ees partielles d’ordre 2 et l’on consid´erera la matrice hessienne def ena.
9. In´egalit´e des accroissements finis
Dans cette section on va d´emontrer l’important th´eor`eme des accroissements finis, qui utilise la notion de convexit´e. Avant d’´enoncer le th´eor`eme, il est utile d’introduire la d´efinition suivante.
D´efinition 9.1 (Norme d’op´erateur). — On munitE=Rn(resp.F =Rp) d’une normek·kE
(resp.k · kF). On d´efinit alors surL(E, F) la norme suivante, appel´ee la norme d’op´erateur(10)(ou norme matricielle)subordonn´ee aux normes choisies surEet F. Pour toutφ∈L(E, F), on note
|||φ|||= max
kxkE=1kφ(x)kF = max
x6=0
kφ(x)kF
kxkE
la constante de Lipschitz deφ. On v´erifie facilement que c’est bien une norme.
Donnons quelques exemples, d’abord lorsqueF =R(muni de la valeur absolue). Dans ce cas, L(E,R) est le dualE∗ deE=Rn, i.e. l’espace des matrices lignesL= (a1, . . . , an)
(1) SiE est muni de la normek · k∞, alors
|||L|||= max
|xi|=1
Xn i=1
aixi
≤
Xn i=1
|ai|
et l’´egalit´e est obtenue sixi=εi, o`uεi=±1 est le signe deai(on prend +1 siai= 0). Donc dans ce cas la norme d’op´erateur surE∗ est la normekLk1=Pn
i=1|ai|.
(2) SiE est muni de la norme euclidiennek · k2, l’in´egalit´e de Cauchy-Schwarz donne :
|||L|||= max
kxk2=1
Xn i=1
aixi
≤ kLk2 et l’on a ´egalit´e siL= 0 ou si x= 1
kLk2 Öa1
... an
è
. Donc dans ce cas la norme d’op´erateur sur E∗ est la norme euclidiennek · k2.(11)
(3) Si l’on munitRn et Rp de la norme k · k∞, alors la norme d’op´erateur d’une matrice A= (aij)1≤i≤p
1≤j≤n
est le max des normesk · k1 des lignes, i.e.|||A|||= maxi=1,...,nPn j=1|aij|. (4) Si l’on munitRnetRpde la norme euclidienne, alors pourA= (aij)1≤i≤p
1≤j≤n
etx∈Rn, l’in´egalit´e de Cauchy-Schwarz donne :
kAxk2= ÇXp
i=1
(Li·x)2 å1/2
≤ kxk2 X
i,j
a2ij
!1/2
donc la norme d’op´erateur deAest major´ee par la norme de Frobenius P
i,ja2ij1/2
, mais cette in´egalit´e est en g´en´eral stricte. Par exemple, sip=net siAest la matrice identit´eIn, sa norme d’op´erateur est 1 tandis que sa norme de Frobenius est√n.
Th´eor`eme 9.2 (In´egalit´e des accroissements finis). — Soit U ⊂ Rn un ouvert convexe et f : U → Rp de classe C1. Soient a, b ∈ U. Comme l’application U → Mp,n(R), z 7→ df(z) est continue, l’application U →R,z 7→ |||df(z)||| l’est aussi, donc elle est born´ee sur le compact [a, b].
PosantM = maxz∈[a,b]|||df(z)|||, on a alors :
kf(b)−f(a)k ≤Mkb−ak.
(10)En analyse, une application lin´eaire entre deux evnEetF est souvent appel´ee un«op´erateur lin´eaire», d’o`u le nom«norme d’op´erateur».
(11)De fa¸con g´en´erale, on peut montrer que siE=Rnest muni de la normek · kpavecp∈[1,+∞], alors la norme d’op´erateur surE∗est la normek · kq o`u 1
q+1 p= 1.