Chap. 3

(1)

CHAPITRE 3

APPLICATIONS DIFF ´ ERENTIABLES

7. Définitions et premières propriétés

(1) En guise d’introduction, commen¸cons par un rappel sur les fonctions dérivables R → R. Soienta∈Ret f :R→Rune fonction définie sur un intervalle ouvertI contenanta. On dit que f estdérivable enasi la limite

h→0lim

h6=0

f(a+h)−f(a) h

existe ; dans ce cas elle est not´eef^′(a) et l’on af(a+h) =f(a) +f^′(a)h+hε(h), o`uε:R→Rest une fonctioncontinue et nulle en 0 (i.e. limh→0ε(h) = 0 =ε(0)).

Dans ce cas, connaissantf(a) on peut obtenir une assez bonne approximation def(x) au voisinage dea, i.e. de f(a+h) pour hassez petit, en rempla¸cantf(a+h) par la fonction«linéaire» h7→f(a) +f^′(a)h. Stricto sensu, c’est une application affine, mais comme la valeur en 0 est donnée parf(a), «ce qui compte» est l’application linéaire h7→ f(a+h)−f(a) =f^′(a)h. En résumé, on considère quef :R→R est une «bonne» fonction au voisinage d’un point asi elle possède une «bonne approximation » par une application linéaire La : h7→ La(h), la notion de «bonne approximation»ayant le sens précis que la différence

f(a+h)−f(a)−La(h)

tend vers 0 plus vite que|h|, i.e. quef(a+h) =f(a)+La(h)+|h|ε(h), oùε:R→Rest une fonction continue et nulle en 0. C’est sous cette forme que la notion de fonction dérivable va s’étendre aux fonctionsRⁿ →R^p.

Notations 7.1. — Dans la suite, on munitRⁿ etR^p de la normek · k∞ (on pourrait aussi choisir la norme euclidiennek · k2).

On note L(Rⁿ,R^p) l’espace vectoriel (de dimensionnp) des applications linéaires Rⁿ → R^p. On rappelle qu’une telle application est lipschitzienne donc continue. D’autre part, L(Rⁿ,R^p) s’identifie àMp,n(R), l’espace de matrices àplignes etncolonnes.

En particulier, si n = 1 alors L(R,R^p) = R^p car une application linéaire f : R → R^p est déterminée par la donnée du vecteur u = f(1), i.e. on a f(t) = tu pour tout t ∈ R. En termes

(1)v. du 2/12/17 : correction de coquilles dans la démo de 9.2 et la déf. 10.1, signalées par Johan Leydet, Tran Trung Nghiem et Nassim Bourarach, merci à eux !

(2)

matriciels, on aL(R,R^p) =Mp,1(R), ce qui nous conduira dans la suite à représenter un élément (y1, . . . , yp) deR^p par le vecteurcolonneY =

Öy1

... yp

è

.

Définition 7.2 (Limites en 0). — Soitϕ:Rⁿ→R^pune fonction définie sur une boule ouverte B(0, R), sauf en 0, et soitb∈R^p. On écrit

h→0lim

h6=0

ϕ(h) =b

si pour toutε >0 il existeδ >0 tel que pour touth6= 0 v´erifiantkhk< δon aitkϕ(h)−bk< ε.

Dans ce cas, si l’on prolongeϕen 0 en posantϕ(0) =b, on obtient une fonction qui est d´efinie sur B(0, R) et continue en 0. Si de plusb= 0, on dira que la fonction ainsi prolong´ee est«continue et nulle en 0».

D’autre part, si l’on noteϕ1, . . . , ϕp les composantes deϕetb1, . . . , bp celles deb, alors comme kϕ(h)−bk= maxi=1,...,p|ϕi(h)−bi|, on voit que la condition précédente équivaut à dire que, pour touti= 1, . . . , p,

h→0lim

h6=0

ϕi(h) =bi.

D´efinition 7.3 (Fonctions d´erivables R→R^p). — Soienta∈ Ret f :R→R^p une fonction

(Q)

d´efinie sur un intervalle ouvertIcontenanta. On«rappelle»quef estd´erivableenasi la limite ℓ= lim

h→0 h6=0

f(a+h)−f(a) h

existe dans R^p; dans ce cas elle est not´ee f^′(a) et l’on a f(a+h) = f(a) +hf^′(a) +hε(h), o`u ε:R→R^p est une fonctioncontinue et nulle en 0 (i.e. limh→0ε(h) = 0 =ε(0)).

Notantf1, . . . , fples composantes defetℓ1, . . . , ℓpcelles deℓ, on voit que la condition pr´ec´edente

´equivaut `a dire que, pour touti= 1, . . . , p,

h→0lim

h6=0

fi(a+h)−fi(a)

h =ℓi

i.e. quefiest dérivable enade dérivéef_i^′(a) =ℓi. On obtient donc quef est dérivable enassi les fi le sont, et dans ce cas le vecteur dérivéf^′(a) est

f^′(a) =

Öf₁^′(a) ... f_p^′(a)

è

.

NotantLa(h) l’application lin´eaireR→R^p,h7→hf^′(a), on obtient donc que f(a+h)−f(a)−La(h) =hε(h),

où ε : R →R^p est une fonction continue et nulle en 0. C’est sous cette forme que la notion de fonction dérivable s’étend aux fonctionsRⁿ→R^p, avecn >1.

Commen¸cons par le lemme suivant.

Lemme 7.4. — Soit L:Rⁿ→R^p une application lin´eaire. Si limh→0 h6=0

L(h)

khk = 0alors L= 0.

(3)

7. D ÉFINITIONS ET PREMI ÈRES PROPRI ÉTÉS 25

Démonstration. — ⁽²⁾ Fixonsx6= 0 dans Rⁿ. Lorsque le réelt >0 tend vers 0, le vecteurtxtend vers 0 et donc, d’après l’hypothèse, le vecteurL(tx)/ktxktend vers 0. Or ce vecteur est le vecteur constantL(x)/kxk, d’oùL(x) = 0.

Terminologie 7.5. — SoientU un ouvert deRⁿ, f une application U →R^p et a∈U. Comme U est ouvert, il existe r > 0 tel que B(a, r) ⊂ U et donc la fonction h 7→ f(a+h)−f(a) est d´efinie pourkhk< r. On utilisera ceci de fa¸con implicite dans la suite quand on dira que certaines fonctions dehsont d´efinies pourh«assez petit».

D´efinition 7.6. — SoientU un ouvert deRⁿ etf une applicationU →R^p.

(Q)

(i) On dit que f est diff´erentiable en un point a de U s’il existe une application lin´eaire La ∈L(Rⁿ,R^p) telle que

(∗) lim

h→0h6=0

f(a+h)−f(a)−La(h) khk = 0.

D’après le lemme précédent,Laest uniquement déterminée si elle existe. Dans ce cas,Laest notée df(a) et est appeléedifférentielle ouapplication linéaire tangentedef ena.

(ii) En posantε(h) =f(a+h)−f(a)−La(h)

khk pour h6= 0 etε(0) = 0, (∗) ´equivaut `a dire que pourhassez petit on a :

(†) f(a+h) =f(a) +df(a)(h) +khkε(h),

avecεcontinue et nulle en 0. On peut récrire cette égalité avec la notationo() : (‡) f(a+h) =f(a) +df(a)(h) +o(khk),

o`uo(khk) d´esigne une fonctionφ(h) telle que limh→0 h6=0

φ(h)

khk = 0. Avec l’une ou l’autre notation, ceci montre que sif est différentiable ena, elle admet en aun«développement de Taylor» à l’ordre 1, dont le terme linéaire estdf(a)(h).

(iii) On dit quef estdifférentiable surU si elle est différentiable en tout point deU. Exemples 7.7. — (1) Soit f :Rⁿ →R^p linéaire. Alors f est différentiable sur Rⁿ et pour tout

(Q)

a∈Rⁿ on adf(a) =f. En effet, pour touth∈Rⁿ on af(a+h)−f(a) =f(h).

(2) L’applicationQ:Rⁿ→R,x7→x·x= (kxk2)² est diff´erentiable surRⁿ. En effet, pour tout a, h∈Rⁿ on a

Q(a+h) =Q(a) +a·h+h·a+Q(h) =Q(a) + 2a·h+ (khk2)²

donc, notantL(a) :Rⁿ→Rla forme linéaireh7→2a·h, on aQ(a+h) =Q(a) +L(a)(h) +o(khk2), ce qui prouve queQest différentiable ena, de différentielledQ(a) =L(a).

(3) L’application de multiplicationm :R² →R, (x1, x2) 7→x1x2 est diff´erentiable sur R². En effet, pourx= (x1, x2) eth= (h1, h2) dansR², on a

(x1+h1)(x2+h2) =x1x2+ (x2h1+x1h2) +h1h2

et |h1h2| ≤ khk²∞, donc dm(x) est la forme lin´eaire Çh1

h2

å

7→x2h1+x1h2, i.e.dm(x) est donn´ee par la matrice ligne (x2, x1).

(2)Indiqu´ee par Laurent Koelblen.

(4)

(4) Si n= 1, i.e. si I est un intervalle ouvert deR etf = (f1, . . . , fp) ⁽³⁾ une application de I dansR^p, alorsf est diff´erentiable en un point adeI ssif est d´erivable en a(i.e. chaquefi l’est) et dans ce cas pour touth∈Ron a :

df(a)(h) =hf^′(a) =h

Öf₁^′(a) ... f_p^′(a)

è

.

En effet, on a vu en 7.3 que si f est dérivable en a elle y est différentiable et df(a) est comme indiqué.

Réciproquement, supposons f différentiable en a. Comme tout L ∈ L(R,R^p) est de la forme h7→hu pour un certainu∈R^p, ceci signifie qu’il existe v∈R^p tel que pour hassez petit on ait f(a+h)−f(a)−hv=|h|ε(h) avecεcontinue et nulle en 0, d’où

f(a+h)−f(a)−hv h

=kε(h)k pourh6= 0, et donc

h→0lim

h6=0

f(a+h)−f(a)

h =v.

Ceci montre quef est d´erivable enaetv=f^′(a), et donc quedf(a)(h) =hv=hf^′(a).

Remarque 7.8. — Sif est différentiable enaelle est continue ena, cardf(a) est continue (étant linéaire) etεest continue en 0.

L’exemple (4) ci-dessus se g´en´eralise comme suit :

Proposition 7.9. — Soient U un ouvert deRⁿ,f = (f1, . . . , fp) ⁽³⁾ une application U →R^p et

(Q)

a∈U. Alors f est diff´erentiable enassi chaque fi l’est, et dans ce cas on a df(a)(h) =

Ödf1(a)(h) ... dfp(a)(h)

è

pour touth∈Rⁿ.

Démonstration. — Se donner une application linéaire L:Rⁿ →R^p est «la même chose» que se donnerpformes linéairesLi:Rⁿ→R, i.e. on a

L(h) =

ÖL1(h) ... Lp(h)

è

pour touth∈ Rⁿ. (Du point de vue matriciel, on aL ∈Mp,n(R) et les Li correspondent auxp lignes de cette matrice.) De même, la fonction ε : Rⁿ → R^p qui apparaˆıt dans la définition 7.6 s’écrit

ε(h) =

Öε1(h) ... εp(h)

è

(3)On continue à écriref= (f1, . . . , fp) pour des raisons typographiques, mais on pense àf(x) comme au vecteur colonnedont les coordonnées sont lesfi(x).

(5)

et la condition que ε soit continue et nulle en 0 équivaut à dire que chaque εi l’est. On voit donc que f est différentiable en a ssi il existe des formes linéaires L1, . . . , Lp et des fonctions ε1, . . . , εp:Rⁿ→Rcontinues et nulles en 0 telles que

fi(a+h) =fi(a) +Li(a)(h) +khkεi(h),

ce qui équivaut à dire que chaquefi est différentiable enaetLi =dfi(a), et dans ce cas pour tout h∈Rⁿ on a bien

df(a)(h) =

ÖL1(h) ... Lp(h)

è

=

è

.

Avant de démontrer le théorème sur la composée d’applications différentiables, introduisons les dérivées partielles et la matrice jacobienne, qui donneront un aspect plus concret à la notion de différentielle.

Définition 7.10 (Dérivée selon la direction v). — SoitUun ouvert deRⁿ,f une application

(Q)

U → R et a ∈ U. Soit v ∈ Rⁿ non nul. On dit que f admet en a une dérivée partielle dans la direction vsi la fonction R→R,t7→f(a+tv) est dérivable ent= 0, i.e. si la limite

t→0lim

t6=0

f(a+tv)−f(a) t

existe, auquel cas elle est not´ee ∂f

∂v(a).

Remarque 7.11. — Intuitivement, la d´eriv´ee directionnelle ∂f

∂v(a) mesure les variation de f lorsqu’on se déplace au voisinage deadans la directionvà la vitessekvk.Attention :la terminologie est légèrement abusive, car cette dérivée dépend devlui-même, et pas seulement de la directionRv. En effet, si on remplacevpar un multiple non nulw=λv, alors

∂f

∂w(a) = lim

t→0t6=0

f(a+λtv)−f(a)

t =λ lim

λt→0 t6=0

f(a+λtv)−f(a)

λt =λ∂f

∂v(a).

Ceci explique la remarque«intuitive»plus haut (en prenant pour«unit´e de vitesse»celle donn´ee par le vecteur unitaireu= 1

kvkv).

Conservant les notations pr´ec´edentes, on a en particulier :

Définition 7.12 (Dérivées partielles). — Soit (e1, . . . , en) la base canonique deRⁿ. On note,

(Q)

si elle existe, ∂f

∂xi

(a) ou simplement∂if(a) la d´eriv´ee partielle def enadans la directionei, i.e.

∂if(a) = ∂f

∂xi

(a) = lim

t→0t6=0

f(a+tei)−f(a)

t = lim

t→0t6=0

f(a1, . . . , ai−1, ai+t, ai+1, . . . , an)−f(a) t

et l’on dit que c’est la dérivée partielle def enaselon lai-ème variable.

Notation 7.13. — Si f admet des d´eriv´ees partielles ∂f

∂xi

(a) en tout point a ∈ U, on obtient ainsi pour tout i= 1, . . . , nune application :

∂f

∂xi

:U→R, a7→ ∂f

∂xi

(a).

(6)

Avec la notation ci-dessus, il n’y a pas d’ambigu¨ıté, mais souvent on écrita= (x1, . . . , xn), d’où l’application

∂f

∂xi

:U→R, (x1, . . . , xn)7→ ∂f

∂xi

(x1, . . . , xn).

On prendra garde que dans cette écriture, lexidans∂xiest un symbole pour désigner la dérivation selon le vecteur ei, tandis que (x1, . . . , xn) est une«variable»qui décrit l’ouvertU.

Le calcul de ∂f

∂xi

(a) consiste donc à ne dériver l’expression def que par rapport à la variablexi. Exemples 7.14. — (1) Si f :R³→Rest définie par f(x, y, z) =−2xcosy, on a :

∂f

∂x(x, y, z) =−2 cosy, ∂f

∂y(x, y, z) = 2xsiny, ∂f

∂z(x, y, z) = 0.

(2) Soitf :R^∗₊×R→Rdéfinie parf(x, y) = Arctan(y/x). Comme la dérivée de Arctan(u) est 1

1 +u², on a : (†) ∂f

∂x(x, y) = 1 1 + (y/x)²

−y

x² = −y

x²+y², ∂f

∂y(x, y) = 1 1 + (y/x)²

1

x = x

x²+y².

Proposition 7.15. — Soit U un ouvert de Rⁿ et f :U →R. On supposef diff´erentiable en un point a∈U.

(Q)

(i) Alorsf admet des d´eriv´ees partielles ena⁽⁴⁾:pour toutv∈Rⁿ−{0}, on a ∂f

∂v(a) =df(a)(v).

(ii) Pour tout h= (h1, . . . , hn)∈Rⁿ on a : df(a)(h) =

Xn j=1

∂f

∂xj

(a)hj.

D´emonstration. — Par hypoth`ese, il existe une fonction ε: Rⁿ → R continue et nulle en 0 telle qu’on ait

f(a+h)−f(a)−df(a)(h) =khkε(h)

pour touth∈Rⁿde norme assez petite. Fixonsv∈Rⁿ−{0}et appliquons ce qui précéde àh=tv, oùtparcourt un petit intervalle ouvert ]−r, r[. Alors, pour t6= 0 on obtient

f(a+tv)−f(a)

t −df(a)(v) =kvkε(tv) =ϕ(t) et t 7→ϕ(t) est continue et nulle en 0. Ceci montre que la d´eriv´ee partielle ∂f

∂v(a) existe et vaut df(a)(v).

En particulier, pour v =ej on obtient df(a)(ej) = ∂f

∂ej

(a) = ∂f

∂xj

(a). Enfin, commedf(a) est lin´eaire, pourh= (h1, . . . , hn) =P

jhjej on obtient : df(a)(h) =X

j

hjdf(a)(ej) =X

j

∂f

∂xj

(a)hj.

Corollaire 7.16. — Soient U 6= ∅ un ouvert connexe de Rⁿ et f : U → R^p diff´erentiable. Si df(a) = 0pour tout a∈U, alorsf est constante sur U.

(4)On verra dans la section suivante que la réciproque est fausse en général, mais que sif admet surUdes dérivées partielles qui sontcontinues, alorsfest différentiable surU.

(7)

Démonstration. — Soita∈U et c=f(a) ; notonsUc={x∈U |f(x) =c}. Montrons queUc est unouvert. Soitx∈Uc; il exister >0 tel que la boule ouverteB=B(x, r) soit contenue dansU. Pour tout y ∈B, le segment [x, y] est contenu dansB, donc dans U. L’applicationγ :R →Rⁿ, t7→x+t(y−x) est dérivable etγ([0,1]) = [x, y]. CommeU est ouvert, γ⁻¹(U) est un intervalle ouvertIcontenant [0,1]. D’après le point (iii) du théorème précédent,f◦γ:I→R^pest dérivable, de dérivée nulle, donc constante. Il en résultef(y) =f(x). Ceci prouve que B est contenue dans Uc, doncUc est ouvert.

Pour tout r´eelµ, le mˆeme raisonnement montre que Uµ={x∈U |f(x) =µ}est un ouvert de U, donc Ω =S

µ6=cUµ est un ouvert deU, disjoint de Uc et tel queU =Uc⊔Ω. Comme U est suppos´e connexe et queUc est non vide (car il contienta), on en d´eduit queU =Uc (et Ω =∅), i.e.f est constante sur U, de valeurc.

Bien entendu, il est n´ecessaire de supposerU connexe. Sinon on peut prendre U =R− {0}et f(x) = 1 si x >0,f(x) =−1 si x <0.

On a vu plus haut (7.15) que si f : Rⁿ → R est différentiable ena, alors df(a) est la forme linéaireRⁿ→Rdonnée par

df(a)(h) = ∂f

∂x1

(a)h1+· · ·+ ∂f

∂xn

(a)hn

i.e.df(a) est donn´ee par la matriceligne:

(⋆) ∂f

∂x1

(a), . . . , ∂f

∂xn

(a) .

Définition 7.17 (Matrice jacobienne). — Soit maintenant f = (f1, . . . , fp) une fonction Rⁿ→R^p. D’après la proposition 7.9,f est différentiable en un pointassi chaquefi l’est, et dans ce cas pour touth∈Rⁿ on a :

df(a)(h) =

è

.

Tenant compte de l’expression pour chaque dfi(a)(h) donn´ee en (⋆) plus haut, on obtient que la matrice dedf(a) est la matrice

(Q)

Df(a) = Å∂fi

∂xj

ã

1≤i≤p 1≤j≤n

=

à∂f1

∂x1

(a) · · · ∂f1

∂xn

(a)

... ...

∂fp

∂x1

(a) · · · ∂fp

∂xn

(a) í

dont lai-ème ligne est donnée pardfi(a). Cette matrice est appeléematrice jacobiennedef en a. Lorsquep=n,Df(a) est une matrice carrée et on noteJf(a) son déterminant, qu’on appelle le (déterminant)jacobiendef ena.

Revenant au casn, parbitraires, rappelons que pour toute application lin´eaireu:Rⁿ→R^p, de matrice A∈ Mp,n(R), l’image paru d’un vecteurx= (x1, . . . , xn) s’obtient en appliquant A au vecteurcolonneX=

Öx1

... xn

è

, i.e. l’élémentu(x) deR^pest donné par le vecteur colonneAX∈R^p.

(8)

Th´eor`eme 7.18. — Soient U, V des ouverts de Rⁿ et R^p et f : U → V et g : V → R^q des

(Q)

applications.

(i) Sif est diff´erentiable en aetg enf(a), alors g◦f est diff´erentiable en aet l’on a :

(⋆) d(g◦f)(a) =dg(f(a))◦df(a).

(ii) Sif est diff´erentiable sur U etg surV, alors g◦f est diff´erentiable sur U.

(iii) En particulier, sin= 1 etU=I est un intervalle ouvert de R, l’application g◦f :I→R^p est d´erivable et pour toutt∈I on a :

(∗) (g◦f)^′(t) =dg(f(t))(f^′(t)).

D´emonstration. — (i) Posons b = f(a). Par hypoth`ese, il existe des fonctions η : Rⁿ → R^p et µ:R^p→R^q, continues et nulles en 0, telles que pourh∈Rⁿ eth^′∈R^p assez petits, on ait :

f(a+h) =b+df(a)(h) +khkη(h) g(b+h^′) =g(b) +dg(b)(h^′) +kh^′kµ(h^′).

Pourhassez petit, posons

k(h) =f(a+h)−f(a) =df(a)(h) +khkη(h).

Alors pourh6= 0 on a

g(f(a+h))−g(b)−dg(b)(df(a)(h))

khk =dg(b)(η(h)) +kk(h)k

khk µ(k(h)).

Montrons que le membre de droite tend vers 0 quand h6= 0 tend vers 0. Pour le premier terme c’est clair, cardg(b) est continue (car lin´eaire) etη est continue et nulle en 0.

Notons ψ(h) le second terme. Comme η est continue et nulle en 0, il existe δ0 > 0 tel que kη(h)k<1 sikhk< δ0. Commedf(a) estL-lipschitzienne, posantC=L+ 1, on obtient que pour touthtel quekhk< δ0, on a

kk(h)k ≤Ckhk et donc kψ(h)k ≤Ckµ(k(h))k. Commeµ◦kest continue et nulle en 0, il en r´esulte que limh→0

h6=0ψ(h) = 0. Ceci prouve (i) et (ii).

Déduisons-en le cas particulier (iii). D’après 7.7 (4), une applicationφ:I→R^q est différentiable en un pointt ssi elle est dérivable entet dans ce casdφ(t) est l’application linéaireh7→hφ^′(t).

Ici, on sait d’après (i), queg◦f est différentiable ent, de différentielledg(f(t))◦df(t). Ordf(t) est l’application linéaireR→Rⁿ,h7→hf^′(t) et doncd(g◦f)(t) est l’application linéaireR→Rⁿ, h7→hdg(f(t))(f^′(t)). Il en résulte que (g◦f)^′(t) =dg(f(t))(f^′(t)).

Remarque 7.19. — La définition de la différentiabilité et le théorème précédent illustrent un principe général en mathématiques : il a fallu travailler un peu pour établir la définition (i.e. montrer quedf(a) est unique si elle existe) puis pour démontrer le théorème, mais ce travail ayant été fait une fois pour toutes, on dispose d’une notion qui est facile à manipuler, comme le montre la jolie formuled(g◦f)(a) =dg(f(a))◦df(a), dont on verra plus bas la traduction en termes de produit de matrices.

Remarque 7.20 (Traduction matricielle). — Le théorème précédent s’écrit en termes matriciels comme suit. Considérons des ouvertsU ⊂Rⁿ et V ⊂R^p et des applications différentiables f :U →V et g:V →R^q. Pour touta∈U, soitA=Df(a)∈Mp,n(R) la matrice jacobienne def enaetB =Dg(f(a))∈Mq,p(R) celle deg enb=f(a). Alors la matrice jacobienne deg◦f ena

(Q)

est

D(g◦f)(a) =BA.

(9)

Remarque 7.21(Attention !). — Contrairement aux fonctions d’une seule variable, où l’on peut écrire (g◦ f)^′(a) = g^′(f(a))f^′(a) = f^′(a)g^′(f(a)) (puisque le produit dans Rest commutatif), l’ordre d’apparition des dif- férentielles dans la formuled(g◦f)(a) =dg(f(a))◦f(a) est extrêmement important. En effet,df(a) va deRⁿ→R^p etdg(f(a)) va deR^pdansR^q, donc on ne peut même pas les composer dans le«mauvais sens»sin6=q. Et même sin=p=q, la composition dans le«mauvais sens»ne donne pas le bon résultat, puisque la multiplication dans Mn(R) n’est pas commutative.

Remarque 7.22. — Écrivons la différentielle d’une composée Rⁿ ^f //R^p ^g //R^q en termes de dérivées partielles. PosonsA=Df(a) etB =Dg(f(a)), alorsD(g◦f) =BA. Donc pour tout j= 1, . . . , neti= 1, . . . , q, on a

(BA)ij = Xp k=1

BikAkj.

Si l’on note (u1, . . . , up) les coordonn´ees surR^p, alors on a Bik= ∂gi

∂uk

(f(a)) et Akj = ∂fk

∂xj

(a) et donc l’égalité précédente donne :

(Q)

(†) ∂(g◦f)i

∂xj

(a) = Xp k=1

∂gi

∂uk

(f(a))∂fk

∂xj

(a).

Le calcul consiste donc à : dérivergipar rapport à la variableuket évaluer le résultat enf(a), puis multiplier par la dérivée defk par rapport à la variablexj évaluée ena, puis sommer par rapport

`ak.

Proposition 7.23. — Soient U un ouvert de Rⁿ,f, g deux applications diff´erentiables U →R^p, eta∈U.

(Q)

(i) Pour toutλ, µ∈R,λf+µg est diff´erentiable en aetd(λf +µg)(a) =λdf(a) +µdg(a).

(ii) Sip= 1, alorsf g est diff´erentiable enaetd(f g)(a) =f(a)dg(a) +g(a)df(a).

Démonstration. — (i) est laissé en exercice ; prouvons (ii). D’après la proposition 7.9, l’application F :Rⁿ→R²,x7→(f(x), g(x)) est différentiable ena, et pour touth∈Rⁿ on a

dF(a)(h) = df(a)(h), dg(a)(h) .

D’autre part, d’après l’exemple 7.7 (3), l’applicationm:R²→R, (x1, x2)7→x1x2, est différentiable surR² et sa différentielle enF(a) = (f(a), g(a)) est la forme linéaire (h1, h2)7→g(a)h1+f(a)h2.

D’après le théorème 7.18, l’applicationf g=m◦F est donc différentiable ena, de différentielle d(f g)(a) =dm(F(a))◦dF(a), i.e. pour touth∈Rⁿ on a

d(f g)(a)(h) =dm(F(a)) df(a)(h), dg(a)(h)

=g(a)df(a)(h) +f(a)dg(a)(h) i.e.d(f g)(a) est la forme lin´eaireg(a)df(a) +f(a)dg(a).

Après ces généralités sur les applications différentiables, donnons un critère concret et utile de différentiabilité, qui sera vérifié par la plupart des fonctions considérées dans ce cours.

Définition 7.24 (Fonctions de classe C¹). — Soient U ⊂ Rⁿ un ouvert et f : U → R une application. On dit que f est de classe C¹ sur U si f admet des dérivées partielles ∂jf pour j= 1, . . . , net si celles-ci sontcontinuessurU.

(Q)

(10)

De mˆeme, pourf = (f1, . . . , fp) :U →R^p on dit quef est de classeC¹ si chaquefi l’est : ceci

´equivaut `a dire que l’application

Φ :U →Mp,n(R), a7→

à∂f1

∂x1

(a) · · · ∂f1

∂xn

(a)

... ...

∂fp

∂x1

(a) · · · ∂fp

∂xn

(a) í

estcontinue.

On noteraC¹(U,R^p) l’ensemble des fonctions de classeC¹ surU `a valeurs dansR^p.

Théorème 7.25. — SoientU ⊂Rⁿ un ouvert et f ∈C¹(U,R^p). Alors f est différentiable sur U

(Q)

et l’application

Df :U →Mp,n(R), a7→Df(a) est une application continue.

Démonstration. — D’abord, en considérant les composantes f1, . . . , fp def, il suffit de traiter le le cas p= 1. Faisons alors la démonstration pour p= 1 et n = 3, ce qui est suffisant pour bien comprendre l’idée. On utilise la normek · k^∞. Soita∈U. Quitte à faire le changement de variable x^′ =a+x, on peut supposer a= 0, ce qui va permettre d’alléger l’écriture. Fixonsε >0.

Soit r > 0 tel que B(a, r) ⊂ U. Pourj = 1,2,3, comme ∂jf est continue en a = 0, il existe δj ∈]0, r[ tel que |∂jf(x)−∂jf(0)|< ε/3 si kxk < δj. Posons δ= mini=1,2,3δi, alors pour tout x∈B(0, δ) on a

(∗) |∂jf(x)−∂jf(0)|<ε

3.

Soit h = (h1, h2, h3) ∈ B(0, δ), alors (h1, h2,0) et (h1,0,0) sont aussi dans B(0, δ). Comme f est dérivable par rapport à la variable x3 au point (h1, h2,0) alors, d’après le théorème des accroissements finis en une variable, il existe un réelθ3∈[0,1] (dépendant deh1, h2eth3) tel que⁽⁵⁾

f(h1, h2, h3)−f(h1, h2,0) =∂3f(h1, h2, θ3h3)h3. De mˆeme, il existeθ2∈[0,1] (d´ependant deh1eth2) tel que

f(h1, h2,0)−f(h1,0,0) =∂2f(h1, θ2h2,0)h2

etθ1∈[0,1] (d´ependant deh1) tel que

f(h1,0,0)−f(0,0,0) =∂1f(θ1h1,0,0)h1. En sommant ces trois ´egalit´es, soustrayantL(h) =P3

i=1∂if(0,0,0)hi et utilisant (∗), on obtient f(h)−f(0)−L(h)≤ε

3 X3 i=1

|hi| ≤εkhk^∞.

Ceci prouve quef est différentiable ena= 0, de différentielle la forme linéaire L: (h1, h2, h3)7→

X3 j=1

∂f

∂xj

(a)hj.

(5)C’est la formulef(b)−f(a) = (b−a)f^′(c) pour unc∈[a, b] que l’on ´ecritc=a+θ(b−a) avecθ∈[0,1].

(11)

De plus, l’application df : U → L(R³,R) = M1,3(R) (matrices `a une ligne et 3 colonnes) est donn´ee par

a7→ ∂1f(a), ∂2f(a), ∂3f(a)

donc est continue. De mˆeme, pourpet narbitraires, l’application Df :U →Mp,n(R) associe `a a la matrice

Å∂fi

∂xj

(a) ã

dont la composante d’indice (i, j) est ∂fi

∂xj

qui est continue sur U, doncDf est bien continue. Ceci achève la preuve du théorème.

Remarque 7.26(Attention !). — Il faut se garder de croire que l’application U → Mp,n(R), a 7→ Df(a) est lin´eaire : en effet, chaque coefficient d’indice (i, j) de la matriceDf(a) est donn´e par ∂fi

∂xj

(a), qui en général n’est pas une fonction linéaire deaet peut être arbitrairement compliquée. Par exemple, pourU = Retf :R→R, x7→xⁿ, c’est l’applicationU→M1,1(R) qui à touta∈Uassocie la matrice (naⁿ⁻¹).

Ou bien, si l’on pr´ef`ere, soitf :R² →R², (x, y)7→(x³+y⁴, x⁵+y⁶). Alorsf est de classeC¹ et pour tout (x, y)∈R², on a

Df(x, y) =

Å3x² 4y³ 5x⁴ 6y⁵

ã

.

Remarques 7.27. — 1) Une fonction dont toutes les dérivées partielles existent n’est pas nécessairement différentiable. Par exemple, soitf:R²→Rdéfinie, pour tout (x, y)∈R², par

f(x, y) =





xy(x+y)

x²+y² si (x, y)6= (0,0), 0 si (x, y) = (0,0).

Alors,f est de classeC¹ surU =R²− {(0,0)}. De plus, pour tout (x, y) on a max(|x|,|y|)≤p x²+y² donc|f(x, y)| ≤2p

x²+y²doncfest continue en 0 = (0,0).⁽⁶⁾De plus, pour tout vecteur non nulv= ^a_b et toutt6= 0, on a

f(0 +tv)−f(0)

t =t³ab(a+b)

t³(a²+b²) = ab(a+b) a²+b² , doncfest d´erivable en 0 dans la directionv. En particulier, pourv= ¹₀

=e1(resp. ⁰₁

=e2) on obtient (∂f /∂x1)(0) = 0 (resp. (∂f /∂x2)(0) = 0). Doncfadmet en 0 des dérivées dans toutes les directions. Mais f n’est pas différentiable en 0. En effet, si elle l’était alors d’après la proposition 7.15 on auraitdf(0) = 0 et donc le rapport

f(x, y)−f(0) k(x, y)k2

= xy(x+y) (x²+y²)^3/2

devrait tendre vers 0 quand (x, y) tend vers 0. Mais ceci n’est pas le cas : si ce rapport est bien nul sur les droiteske1 etke2 (et aussi sur la droite d’´equationx+y= 0), sur chaque droitey=µxon a pourx6= 0 :

xy(x+y)

(x²+y²)^3/2 = x³µ(1 +µ)

|x|³(1 +µ²)^3/2 =









µ(1 +µ)

(1 +µ²)^3/2 six >0,

−µ(1 +µ)

(1 +µ²)^3/2 six <0.

2) D’autre part, la fonctionR→Rdéfinie parf(0) = 0 etf(x) =x²sin(1/x) est dérivable surRmais sa dérivée n’est pas continue en 0. On a donc, lorsqueU est un ouvert deRⁿ avecn≥2, des inclusions strictes :

C¹(U,R)⊂ {fonctions différentiables surU} ⊂ {fonctionsf:U →Radmettant des dérivées partielles}

(6)Pour (x, y)6= (0,0) on peut aussi passer en coordonn´ees polaires :f(r, θ) =rcos(θ) sin(θ)(cos(θ) + sin(θ))≤2r.

(12)

Exercice 7.28. — SoitU l’ouvertR²− {(x,0)|x≤0}. Soientr:R²− {(0,0)} →Retg:U →R les fonctions d´efinies parr(x, y) =p

x²+y² etg(x, y) = 2 Arctan y x+r(x, y)

. On rappelle que la dérivée de Arctan(t) est Arctan^′(t) = 1/(1 +t²). Calculer les dérivées partielles ∂xret ∂yr sur R²− {(0,0)} et les dérivées partielles∂xg et ∂yg sur U. Montrer que l’applicationF :U →R², (x, y)7→(r(x, y), g(x, y)) est de classeC¹.

R´eponse partielle : ∂g

∂x(x, y) = −y

x²+y² et ∂g

∂y(x, y) = x x²+y².

Signalons au passage la proposition suivante. Comme les dérivées partielles s’obtiennent en dérivant par rapport à une seule variable, elles jouissent des mêmes propriétés que celles connues pour les fonctions d’une seule variable ; la démonstration est donc omise.

Proposition 7.29. — Soient f, g : Rⁿ → R deux fonctions admettant en a une dérivée partielle par rapport à la variablexi.

(i) Pour toutλ, µ∈R,λf+µgadmet enaune dérivée partielle par rapport à la variablexiet

∂(λf+µg)

∂xi

(a) =λ∂f

∂xi

(a) +µ∂g

∂xi

(a).

(ii) f gadmet une dérivée partielle en apar rapport à la variablexiet

∂(f g)

∂xi

(a) =f(a)∂g

∂xi

(a) +g(a)∂f

∂xi

(a).

(iii) Sif(a)6= 0alors1/f admet une dérivée partielle ena par rapport à la variablexi et

∂(1/f)

∂xi

(a) = −1 f(a)²

∂f

∂xi

(a).

8. Difféomorphismes. Exemple des coordonnées polaires, cylindriques et sphériques Définition 8.1. — Soient U un ouvert de Rⁿ et f :U →Rⁿ une application de classe C¹. On dit quef est unC¹-difféomorphismede U sur son image si les trois conditions suivantes sont vérifiées :

(Q)

a) f est injective.

b) V =f(U) est un ouvert deRⁿ.

c) La bijection r´eciproquef⁻¹:V →U est de classeC¹.

Alors les égalitésf⁻¹(f(x)) =xpour tout x∈U et f(f⁻¹(y)) =y pour touty∈V entraˆınent, d’après la formule de différentiation des fonctions composées (Th. 7.18), les égalités :

d(f⁻¹)(f(x))◦df(x) = id, df(f⁻¹(y))◦d(f⁻¹)(y) = id pour toutx∈U,y∈V. Ceci montre que les conditions (a,b,c) ci-dessus entraˆınent :

d) Chaque df(x) est inversible et la diff´erentielle de f⁻¹ en f(x) est l’application lin´eaire df(x)⁻¹. En termes matriciels, ceci signifie que la matrice jacobienne Df⁻¹(f(x)) est la matrice inverse de la matriceDf(x).

Donc, la condition d) que chaquedf(x) soit inversible est une conditionnécessairepour quef soit un difféomorphisme. Elle n’est pas suffisante, car elle n’entraˆıne pas quef soit injective : on le verra plus bas lors de l’introduction des coordonnées polaires. Donnons ici un autre exemple, d’ailleurs

(13)

8. DIFF ÉOMORPHISMES. COORDONN ÉES POLAIRES, CYLINDRIQUES ET SPH ÉRIQUES 35

lié aux coordonnées polaires. Soitf :R²→R²l’application définie parf(x, y) = (e^xcosy, e^xsiny).

La matrice jacobienne

Df(x, y) =

Çe^xcosy −e^xsiny e^xsiny e^xcosy

å

a pour déterminant e^2x donc est inversible pour tout (x, y) ∈R². Mais f n’est pas injective car f(x, y+2π) =f(x, y). On peut montrer (cf. les coordonnées polaires plus bas) quef(R²) est l’ouvert R²−{(0,0)}.⁽⁷⁾Mais, d’après un théorème que l’on verra plus loin (le théorème d’inversion locale), on a le résultat suivant, que nous admettrons pour le moment.

Corollaire 8.2 (du th. d’inversion locale). — SoientU un ouvert deRⁿ etf :U →Rⁿ une application injectivede classeC¹telle quedf(x)soit inversible pour toutx∈U. AlorsV =f(U)est un ouvert deRⁿetf est unC¹-diff´eomorphisme deU surV, i.e. l’application inversef⁻¹:V →U est de classe C¹.

D´efinition 8.3 (Coordonn´ees polaires). — L’application f : R^∗

+ × R → R², (r, θ) 7→

(rcosθ, rsinθ) est de classeC¹ : sa matrice jacobienne en tout point (r, θ) est

(Q)

Df(r, θ) =

Çcosθ −rsinθ sinθ rcosθ

å .

Le déterminant jacobien est égal à r > 0, doncDf(r, θ) est inversible. Tout point (x, y)6= (0,0) s’écrit (rcosθ, rsinθ) oùrest déterminé parr=p

x²+y²etθest unique modulo 2π. Donc, pour que f soit injective il faut la restreindre `a R^∗

+×I, où I est un intervalle ouvert ]α, α+ 2π[ de longueur 2π; on obtient alors que f induit une bijection deR^∗₊×I sur l’ouvertVα=R² privé de la demi-droiteDα={r(cosα,sinα)|r∈R₊}. Un choix usuel est de prendreα=−π. On obtient ainsi un C¹-difféomorphisme entreU =R^∗₊× ]−π, π[ et l’ouvert V =R² privé de la demi-droite fermée formée des réels≤0. On obtient ainsi les«coordonnées polaires»(r, θ) surV, i.e. pour tout pointM = (x, y) deV, ses coordonnées polaires sont l’unique couple (r, θ)∈U tel quex=rcosθ ety=rsinθ.⁽⁸⁾

x y

θ r

M

O

Exemple 8.4. — ´Etudions le diff´eomorphisme inverseφ=V →U, (x, y)7→(r, θ). Il est clair que r=r(x, y) =p

x²+y². Pour exprimerθ, si l’on se place dans le demi-plan d’´equation x >0, on peut ´ecrire queθ= Arctan(y/x). On a des formules analogues dans chacun des demi-plansx <0,

(7)Exercice. Via l’identificationC=R², `a quoi correspond l’applicationf?

(8)Les figures qui suivent sont dues `a Laurent Koelblen.

(14)

y >0 ouy <0. Mais on peut obtenir une formule uniforme en utilisant l’astuce suivante. Comme 1 + cosθ= 2 cos²(θ/2) et sinθ= 2 sin(θ/2) cos(θ/2), on a pour−π < θ < π:

tan(θ/2) = sinθ

1 + cosθ = y

r+x = y

x+p x²+y² d’o`uθ= 2 Arctan y

x+p x²+y²

=g(x, y).

Au point (x, y) =f(r, θ), on sait que Dφ(x, y) =Df(r, θ)⁻¹=

Çcosθ −rsinθ sinθ rcosθ

å−1

=1 r

Çrcosθ rsinθ

−sinθ cosθ å

.

On en d´eduit, sans calcul suppl´ementaire, que :

∂r

∂x(x, y) = cosθ= x

px²+y², ∂r

∂y(x, y) = sinθ= y px²+y²

et ∂g

∂x(x, y) =−sinθ

r = −y

x²+y², ∂g

∂y(x, y) =cosθ

r = x

x²+y². On retrouve ainsi les résultats d’un exercice précédent.

D´efinition 8.5 (Coordonn´ees cylindriques). — L’applicationf :R^∗₊×R² →R³, (r, θ, z)7→

(rcosθ, rsinθ, z) est de classeC¹: sa matrice jacobienne en tout point (r, θ, z) est

(Q)

Df(r, θ, z) =

Ñcosθ −rsinθ 0 sinθ rcosθ 0

0 0 1

é .

Le déterminant jacobien est égal à r >0, doncDf(r, θ, z) est inversible. ToutM = (x, y, z) deR³ avec (x, y)6= (0,0) (i.e.M 6∈Oz) s’écrit (rcosθ, rsinθ, z) oùrest déterminé parr=p

x²+y²et θ est unique modulo 2π. Comme précédemment, pour que f soit injective il faut la restreindre à R^∗₊×I×R, oùIest un intervalle ouvert ]α, α+ 2π[ de longueur 2π; on obtient alors quef induit une bijection deR^∗₊×I×R sur l’ouvertVα=R³ privé du demi-plan Hα ={(rcosα, rsinα, z)| r∈R₊, z∈R}. Un choix usuel est de prendreα=−π. On obtient ainsi unC¹-difféomorphisme entreU =R^∗₊×]−π, π[×Ret l’ouvertV =R³ privé du demi-plan ferméH ={(x,0, z)|x≤0}. On obtient ainsi les«coordonnées cylindriques» (r, θ, z) surV, i.e. pour tout pointM = (x, y, z) deV, ses coordonnées cylindriques sont l’unique triplet (r, θ, z)∈U tel quex=rcosθ,y=rsinθ etz=z.

x y

z

θ r

M

M^′ I

O

(15)

8. DIFF ÉOMORPHISMES. COORDONN ÉES POLAIRES, CYLINDRIQUES ET SPH ÉRIQUES 37

Définition 8.6 (Coordonnées sphériques). — Dans R³, on introduit les coordonnées sphé- riques comme suit. Posons O = (0,0,0). Pour tout M = (x, y, z) 6= O on pose r = OM = px²+y²+z² et l’on noteθ l’unique élément de [0, π] tel que z=rcosθ. SiM n’appartient pas

à la droiteOz, i.e. si 0 < θ < π, alors notantM^′ le projeté orthogonal de M sur le planOxy et ρ=OM^′ =rsinθ >0, on a M^′ =ρ(cosϕ,sinϕ,0), avecϕ unique modulo 2π. On dit alors que (r, θ, ϕ) sont les«coordonnées sphériques»deM.

Autrement dit, l’applicationf :R^∗

+×]0, π[×R→R³,

(Q)

(r, θ, ϕ)7→(rsinθcosϕ, rsinθsinϕ, rcosθ) est de classeC¹, sa matrice jacobienne en un point (r, θ, ϕ) est

Df(r, θ, ϕ) =

Ñsinθcosϕ rcosθcosϕ −rsinθsinϕ sinθsinϕ rcosθsinϕ rsinθcosϕ

cosθ −rsinθ 0

é

et son déterminant jacobien vautr²sinθ, qui est>0. D’après ce qui précède, pour tout intervalle ouvertI= ]α, α+2π[ de longueur 2π,f induit une bijection deR^∗

+×]0, π[×Isur l’ouvertVα=R³ privé du demi-plan Hα = {(rcosα, rsinα, z) | r ∈ R₊, z ∈ R}. Le choix usuel est de prendre α = −π. On obtient ainsi un C¹-difféomorphisme entre U = R^∗₊× ]0, π[ × ]−π, π[ et l’ouvert V = R³ privé du demi-plan fermé H = {(x,0, z) | x ≤ 0}. On obtient ainsi les« coordonnées sphériques» (r, θ, ϕ) sur V, i.e. pour tout point M = (x, y, z) de V, ses coordonnées sphériques sont l’unique triplet (r, θ, ϕ)∈U tel quex=rsinθcosϕ,y =rsinθsinϕet z=rcosθ.

x y

z

ϕ θ

r M

M^′ I

O

Remarque 8.7. — Le diff´eomorphisme inverse est donn´e parr =p

x²+y²+z²,θ= Arccos(z/r) et ϕ est donné par la même formule que pour les coordonnées polaires dans le planOxy.

Remarque. — Les coordonnées sphériques diffèrent des coordonnées«géographiques», oùθ∈[−π/2, π/2] est défini parz=rsinθ, i.e. dans ces coordonnées on mesureθ(variant entre−90 et +90 degrés) à partir de l’équateur, tandis que dans les coordonnées sphériques on mesureθ(en radians) à partir du pôle Nord.

Remarque 8.8. — Pour que les coordonnées polaires dans R² soient les restrictions à R² des coordonnées sphériques dans R³ (et que les notations des coordonnées cylindriques et sphériques soient compatibles), il serait plus astucieux d’utiliser la notation (ρ, ϕ) (resp. (ρ, ϕ, z)) pour les coordonnées polaires (resp. cylindriques). C’est d’ailleurs la convention adoptée en physique :

(16)

x y z

ϕ ρ

M

M^′ I

O

Terminons cette section avec la d´efinition du gradient def puis la notion de point critique.

Définition 8.9 (gradient). — Soient U un ouvert de Rⁿ et f : U → R une application dif- férentiable. On a vu que pour tout a ∈ U, df(a) est une forme linéaire sur Rⁿ. Comme il est psychologiquement plus facile (et plus visuel) de travailler avec des vecteurs que des formes li- néaires, on fait ce qui suit.

(1) On munit Rⁿ du produit scalaire standardx·y = P

ixiyi et l’on munit d´esormais, sauf mention du contraire,Rⁿ de la norme euclidiennek · k², qu’on notera simplementk · k.

(2) Le produit scalaire induit un isomorphismeθentreRⁿet son dual, donné parθ(x)(h) =x·h pour toutx, h ∈Rⁿ. Par conséquent, pour toute forme linéaireφ :Rⁿ →R, il existe un unique vecteuru=uφ tel que φ(h) =u·hpour touth∈Rⁿ.

(3) Le vecteur colonne deRⁿ correspondant à la forme linéairedf(a) est noté∇f(a) et appelé legradientdef ena; on a donc :

(Q)

∇f(a) =

Ö∂1f(a) ...

∂nf(a) è

et df(a)(h) =∇f(a)·h= Xn i=1

∂if(a)hi

pour touth= (h1, . . . , hn).

D´efinitions 8.10 (Extrema locaux). — Soient U un ouvert de Rⁿ,f une applicationU →R eta∈U.

(i) On dit que f admet en a un minimum (resp. maximum) local s’il existe r > 0 tel que B(a, r)⊂U et f(a)≤f(x) (resp.f(a)≥f(x)) pour toutx∈B(a, r).

(ii) On dit quef admet enaun minimum (resp. maximum) global sif(a)≤f(x) (resp.f(a)≥ f(x)) pour toutx∈U.

(iii) On utilisera le mot «extremum»⁽⁹⁾ (local ou global) pour d´esigner sans distinction un maximum ou un minimum (local ou global).

(iv) Il est clair qu’un extremum global esta fortiori un extremum local. Mais il se peut que f admette des extrema locaux mais aucun extremum global. Par exemple, siP(x) est un polynôme de degré 3 ayant trois racines réelles, par exempleP(x) =x(x²−1), alorsP admet un maximum local et un mininum local (en les points où le polynôme dérivéP^′(x) s’annule) mais aucun extremum global.

(9)Le pluriel estextrema.

(17)

9. IN ´EGALIT´E DES ACCROISSEMENTS FINIS 39

Définition 8.11. — SoientU un ouvert deRⁿ et f :U →Rune application différentiable. On dit que a ∈ U est un point critique de f si df(a) = 0, ce qui équivaut à dire que le gradient

∇f(a) est nul.

Proposition 8.12. — Soient U un ouvert de Rⁿ etf :U →R une application diff´erentiable. Si

(Q)

f admet un extremum local en a∈U, alorsa est un point critique de f (i.e.df(a) = 0).

Démonstration. — Supposons par exemple quef ait un minimal local ena. Il exister >0 tel que f(a+h) ≥ f(a) pour touth ∈ Rⁿ vérifiant khk < 2r. Fixons un tel h, posons I = ]−1,1[ et considérons la fonctiong:I→Rdéfinie parg(t) =f(a+th). Alors gest dérivable surI et

g^′(t) =df(a+th)(h)

pour toutt∈I; en particulier g^′(0) =df(a)(h). D’autre part, commeg a un minimum local en 0, on ag^′(0) = 0. Rappelons la d´emonstration : pour toutt∈I on ag(t)−g(0)≥0 donc

t→0lim⁻

g(t)−g(0)

t ≤0≤ lim

t→0⁺

g(t)−g(0) t

et doncg^′(0), qui est la valeur commune des deux limites, est nul. On a donc df(a)(h) = 0 pour tout hvérifiantkhk<2r. Comme on l’a déjà vu, ceci entraˆıne queL=df(a) est nulle : en effet, pour h6= 0 arbitraire, posonsλ=khk/r et h^′ = (1/λ)h, alorskh^′k =r <2r doncL(h^′) = 0, et commeh=λh^′ on aL(h) =λL(h^′) = 0.

Etre un point critique est donc une condition n´ecessaire pour ˆetre un extremum. Elle n’estˆ cependant pas suffisante au regard des exemples suivants.

Exemples 8.13. — (1) Soit f : R² → R la fonction définie par f(x, y) = x² −y² pour tout (x, y)∈R². Elle est différentiable puisque c’est un polynôme. Pour tout (x, y)∈R²,df(x, y) est la forme linéaire donnée par la matrice ligne :

Å∂f

∂x(x, y),∂f

∂y(x, y) ã

= (2x,−2y)

qui s’annule en (0,0) (et en ce point uniquement). Donc (0,0) est un point critique def. Mais,f(0,0) = 0 et pour toutε6= 0 on a

f(ε,0) =ε²> f(0,0)>−ε²=f(0, ε) doncf n’a pas enade maximum ou minimum local.

(2) Un autre exemple est donné parf :R→R, x7→x³. La dérivéef^′(x) = 3x² s’annule en 0 maisf n’a pas en 0 un extremum local carf(x)> f(0)> f(−x) pour toutx >0.

Pour avoir plus d’information afin de décider si un point critiqueadef est un extremum local, on supposera dans la section 10 quef admet des dérivées partielles d’ordre 2 et l’on considérera la matrice hessienne def ena.

9. In´egalit´e des accroissements finis

Dans cette section on va démontrer l’important théorème des accroissements finis, qui utilise la notion de convexité. Avant d’énoncer le théorème, il est utile d’introduire la définition suivante.

(18)

D´efinition 9.1 (Norme d’op´erateur). — On munitE=Rⁿ(resp.F =R^p) d’une normek·kE

(resp.k · kF). On définit alors surL(E, F) la norme suivante, appelée la norme d’opérateur⁽¹⁰⁾(ou norme matricielle)subordonnée aux normes choisies surEet F. Pour toutφ∈L(E, F), on note

|||φ|||= max

kxkE=1kφ(x)kF = max

x6=0

kφ(x)kF

kxkE

la constante de Lipschitz deφ. On v´erifie facilement que c’est bien une norme.

Donnons quelques exemples, d’abord lorsqueF =R(muni de la valeur absolue). Dans ce cas, L(E,R) est le dualE^∗ deE=Rⁿ, i.e. l’espace des matrices lignesL= (a1, . . . , an)

(1) SiE est muni de la normek · k∞, alors

|||L|||= max

|xi|=1

Xn i=1

aixi

≤

Xn i=1

|a_i|

et l’égalité est obtenue sixi=εi, oùεi=±1 est le signe deai(on prend +1 siai= 0). Donc dans ce cas la norme d’opérateur surE^∗ est la normekLk¹=Pn

i=1|ai|.

(2) SiE est muni de la norme euclidiennek · k2, l’in´egalit´e de Cauchy-Schwarz donne :

|||L|||= max

kxk2=1

Xn i=1

aixi

≤ kLk² et l’on a ´egalit´e siL= 0 ou si x= 1

kLk² Öa1

... an

è

. Donc dans ce cas la norme d’op´erateur sur E^∗ est la norme euclidiennek · k².⁽¹¹⁾

(3) Si l’on munitRⁿ et R^p de la norme k · k^∞, alors la norme d’op´erateur d’une matrice A= (aij)1≤i≤p

1≤j≤n

est le max des normesk · k1 des lignes, i.e.|||A|||= maxi=1,...,nPn j=1|aij|. (4) Si l’on munitRⁿetR^pde la norme euclidienne, alors pourA= (aij)1≤i≤p

1≤j≤n

etx∈Rⁿ, l’in´egalit´e de Cauchy-Schwarz donne :

kAxk²= ÇXp

i=1

(Li·x)² å1/2

≤ kxk² X

i,j

a²ij

!1/2

donc la norme d’op´erateur deAest major´ee par la norme de Frobenius P

i,ja²_ij1/2

, mais cette inégalité est en général stricte. Par exemple, sip=net siAest la matrice identitéIn, sa norme d’opérateur est 1 tandis que sa norme de Frobenius est√n.

Théorème 9.2 (Inégalité des accroissements finis). — Soit U ⊂ Rⁿ un ouvert convexe et f : U → R^p de classe C¹. Soient a, b ∈ U. Comme l’application U → Mp,n(R), z 7→ df(z) est continue, l’application U →R,z 7→ |||df(z)||| l’est aussi, donc elle est bornée sur le compact [a, b].

PosantM = maxz∈[a,b]|||df(z)|||, on a alors :

kf(b)−f(a)k ≤Mkb−ak.

(10)En analyse, une application linéaire entre deux evnEetF est souvent appelée un«opérateur linéaire», d’où le nom«norme d’opérateur».

(11)De fa¸con générale, on peut montrer que siE=Rⁿest muni de la normek · kpavecp∈[1,+∞], alors la norme d’opérateur surE^∗est la normek · kq où 1

q+1 p= 1.