Faculté des Sciences de TOURS Préparation à l’Agrégation ANALYSE
Mini-cours de calcul différentiel par l’exercice
1 Calcul de dérivées et mise sous forme exploitable
Le problème du calcul différentiel c’est moins de savoir si une fonction est différentiable (ou dérivable) – car il existe des théorèmes simples pour vérifier cette propriété – que de savoir calculer la dérivée et surtout d’être capable de la mettre sous une forme exploitable.
Car calculer une dérivée n’est pas un but en soi, ce n’est qu’une étape qui peut être suivie d’une (ou de plusieurs) autre(s) où la manipulation de la dérivée sera nécessaire. Il est donc important de maîtriser le sens de la dérivée [ici la difficulté est algébrique] voire de décider sous quelle forme on l’appréhende.
La première définition de la dérivabilité d’une fonction f : O → Rp, où O est un ouvert de Rn, en un point x0 ∈ O est la suivante :
“f est dérivable en O s’il existe une application linéaire L:Rn →Rp telle que : f(x0+h) = f(x0) +L(h) +o(h),
où, si| · | désigne une norme sur Rn, o(h) est une quantité telle que o(h)/|h| →0 quand h→0.
Outre le côté un peu austère de cette définition, plusieurs remarques en découle :
— Cette définition est un développement limité def au voisinage de x0. Alors pour- quoi ne pas calculer L de cette manière quand cela s’y prête ?
— Le fait que L soit une application linéaire suggère que l’on peut soit utiliser L tel quel (approche “intrinsèque” où l’on ne choisit pas de bases), soit choisir des bases de Rn et Rp [en général les bases canoniques de ces espaces] et considérer la matrice de L dans ces bases (en toute rigueur, il faut alors remplacer x, h par X, H les matrices colonnes de leurs coordonnées). Une dernière possibilité, dans le cas oùp= 1 est d’utiliser le “théorème de représentation” qui nous dit qu’il existe a∈Rn tel que L(h) =ha, hisi h·,·i est un produit scalaire surRn.
Ces deux remarques conduisent aux deux méthodes directes de calcul de la différen- tielles : soit via un développement limité que le lecteur pourra tester sur les exemples :
(i)x∈RN 7→ 12hAx, xi − hb, xi oùA est une matrice N ×N etb∈RN, (ii) M ∈GLN(R)7→M−1,
Pour l’exercice (i), il est important de bien déterminer l’application linéaireLnotéef0(x0) dans la suite, la matrice jacobienneDf(x0) et le gradient ∇f(x0), c’est-à-dire le vecteur a ci-dessus et de bien sentir la différence entre ces objets.
Le calcul des dérivées partielles, donc de la matrice de l’application linéaire L (dite matrice jacobienne), est plus classique et nous ne proposons pas d’exemple d’exercice sauf dans le cadre de la troisième méthode, qui est l’utilisation du théorème de composition que l’on pourra tester sur les exemples :
(iii) x ∈R 7→ Rhh2(x)
1(x) f(x, t)dt si h1, h2 : R →R et f :R2 → R sont des fonctions de classeC1.
(iv) Si f : R2 → R est une fonction dérivable, calculer les dérivées partielles de l’applicationg :R2 →R définie par :
g(r, θ) = f(rcos(θ), rsin(θ)).
On pourra soit calculer directement les dérivées partielles soit repasser par les matrices jacobiennes.
Il est à noter que, pour la dérivée seconde, on peut procéder de même, en privilégiant quand c’est possible l’utilisation des dérivées partielles. Ce qui n’exclut pas de mettre la matrice (symétrique) :
D2f(x) := ∂2f
∂xi∂xj
!
i,j
,
sous une forme utilisable. Exemple d’utilisation :
(v) Soit f :R→R une fonction de classeC2, croissante et convexe. On note ||x||2 =
Pn
i=1x2i. Montrer que la fonction g :Rn→R définie par : g(x) =f(||x||2), est convexe, i.e.hD2g(x)h, hi ≥0 pour tout x, h∈Rn .
Il est néanmoins des exemples où le dévellopement limité semble nécessaire :
(vi) Si S+ est l’ouvert convexe1 des matrices n ×n symétriques définies positives, prouver que l’applicationψde S+×Rn dans R définie par :
ψ(M, p) =hM−1p, pi
est convexe.
2 Le théorème des Accroissements Finis (TAF)
La première difficulté du TAF est de bien comprendre ce qu’est une norme d’applica- tion linéaire. Une première étape (simple) est de remarquer que siL :Rn →Rp est une application linéaire et si | · |, || · ||, sont des normes sur Rn et Rp respectivement alors il existe une constante C telle que :
||L(x)|| ≤C|x| pour tout x∈Rn .
1. on pourra démontrer cette affirmation
La preuve de cette inégalité est simple en écrivant x = x1e1 +x2e2 +· · ·+xnen où les ei sont les vecteurs de la base canonique de Rn et les xi sont les coordonnées de x dans cette base. Alors, grâce à la linéarité deL et l’inégalité triangulaire :
||L(x)|| = ||x1L(e1) +x2L(e2) +· · ·+xnL(en)||
≤ |x1|.||L(e1)||+|x2|.||L(e2)||+· · ·+|xn|.||L(en)||
≤ ||x||∞(||L(e1)||+||L(e2)||+· · ·+||L(en)||)
puisque ||x||∞ = maxi(|xi|). Donc quand | · | est la norme infinie, l’inégalité est réalisée pourC=||L(e1)||+||L(e2)||+· · ·+||L(en)||. Dans les autres cas, on utilise l’équivalence des normes.
On peut alors introduire :
|||L|||:= sup
x6=0
||L(x)||
|x| ,
qui est une norme d’application linéaire (exo ?). Il est à noter que, dans l’utilisation du TAF, et même si l’énoncé fait souvent référence à cette norme||| · |||, on n’a besoin dans 99% des cas que de l’inégalité obtenue ci-dessus (de manière assez simple ?) sans avoir à manipuler (et surtout sans avoir à calculer des normes ||| · |||). Mais nous introduisons cette notion pour nous simplifier la vie ( !) puisque nous nous restreindrons ici au cas des fonctions de classeC1, i.e. des fonctions dérivables surO telles quex7→f0(x) est continu, ce qui signifie que :
|||f0(x)−f0(x0)||| →0 quand x→x0 , pour toutx0 ∈ O.
L’avantage quand on suppose que f est de classe C1 est de pouvoir écrire : f(y)−f(x) =
Z 1 0
d
dt[f(ty+ (1−t)x)]dt=
Z 1 0
f0(ty+ (1−t)x)(y−x)dt .
Évidemment ceci présuppose que tous les points de la forme ty+ (1−t)x pour t∈ [0,1]
(qui est, par définition, l’intervalle [x, y]) sont dans O : c’est l’hypothèse géométrique du TAF.
Il en résulte ensuite, par l’inégalité triangulaire, que :
|f(y)−f(x)| ≤
Z 1
0
|f0(ty+ (1−t)x)(y−x)|dt .
Si on sait que |||f0(z)||| ≤ M pour tout z ∈ [x, y] ou ||f0(z)(h)|| ≤ M.|h| pour tous z∈[x, y] et h∈Rn alors :
|f(y)−f(x)| ≤M|y−x|.
Il faut réinsister sur le fait que dans 99% des cas, seule l’inégalité “banale” ||f0(z)(h)|| ≤ M.|h| est utile. On n’a donc pas besoin d’avoir un recours fin à la norme d’application linéaire.
Quelques exercices d’applications : (i) Soitf :Rn →R définie par :
f(x) = exp(−||x||2),
où||x||2 =Pni=1x2i. Démontrer que, pour tous x, y ∈Rn :
|f(x)−f(y)| ≤C|x−y|,
pour une certaine constanteC. Déterminer la meilleure constante C possible.
(ii) En utilisant la fonction g(x) =||x|| et le théorème des accroissements finis, redé- montrer la deuxième inégalité triangulaire pour la norme euclidienne standard.
(iii) Soit f :Rn\ {0} →R une fonction dérivable. On suppose que f se prolonge par continuité en 0 et on note ˜f ce prolongement. Montrer que, si l’on a de plus :
x→0limf0(x) = L, alors ˜f est dérivable en 0 et ˜f0(0) =L. Application ?
(iv) Soit Ω un ouvert connexe par arc deRN etf : Ω→Rp une fonction de classeC1. Six, y ∈Ω et si γ : [0,1]→Ω est un chemin tel que γ(0) =x et γ(1) =y, prouver que :
|f(x)−f(y)| ≤ sup
z∈γ([0,1])
|||f0(z)|||.l(γ),
oùl(γ) est la longueur du chemin γ, i.e. R01|γ(t)|dt.˙
(v) [Plus délicat] Soitf :O ⊂Rn→Rn une fonction de classe C1 et ¯x∈ O un point où f0(¯x) [application linéaire de Rn dans Rn] est inversible. On introduit la fonction T :O →Rn définie par :
T(x) =x−[f0(¯x)]−1f(x).
On suppose d’abord que f(¯x) = 0. Prouver qu’il existe r >0 tel que, si |x0−x|¯ < r, la suite définie par la relation de récurrence
xk+1 =T(xk), converge vers ¯x. Estimer précisément |xk−x|.¯
Maintenant, on veut plus supposer que f(¯x) = 0. Prouver que s’il existe r, M > 0, 0< b <1 tels que, pour tous x, y ∈B(x0, r), on ait :
|||[f0(x)]−1||| ≤M , |||f0(x)−f0(y)||| ≤ b
M et |f(¯x)|< r(1−b)/M , alors l’équationf(x) = 0 a une solution unique dans B(x0, r). Application ?
3 Formule de Taylor et applications
La meilleure façon d’appréhender la formule de Taylor est sans doute sous sa forme avec reste intégral. Dans R, on écrit le théorème fondamental de l’Analyse :
f(x+h) = f(x) +
Z h 0
f0(x+t)dt ,
puis on intègre par parties. Par exemple, sif est de classeC2, on écritf0(x+t) = 1.f0(x+t), on intègre le 1 en (t−a) où a est une constante d’intégration et on dérive f0(x+t), ce qui donne :
f(x+h) = f(x) + (h−a)f0(x+h) +af0(x)−
Z h 0
(t−a)f00(x+t)dt .
Comme on ne veut pas qu’il apparaisse de dérivées au pointx+h, le bon choix esta=h, ce qui donne :
f(x+h) =f(x) +f0(x)h−
Z h 0
(t−h)f00(x+t)dt .
Pour obtenir la formule de Taylor à l’ordre 2, on fait apparaître f00(x) dans l’intégrale :
−
Z h 0
(t−h)f00(x+t)dt=−
Z h 0
(t−h)(f00(x+t)−f00(x))dt−
Z h 0
(t−h)f00(x)dt , ce qui conduit en calculant la derniere intégrale à l’expression bien connue :
f(x+h) =f(x) +f0(x)h+ 1
2f00(x)h2−
Z h 0
(t−h)(f00(x+t)−f00(x))dt .
L’intérêt de cette formule de Taylor est (évidemment) que l’on a explicitement le reste sous forme d’une intégrale facile à estimer.
DansRn, rien ne change : on utilise simplement l’idée mise en place ci-dessus dans le cadre du TAF en considérant la fonctiont7→f(x+th) où x∈ O, h∈Rn (suffisamment petit) ett ∈[0,1] ce qui donne :
f(x+h)−f(x) =
Z 1 0
f0(x+th)hdt .
L’intégration par partie se fait de manière analogue puisqu’on a affaire à une fonction de la variable réelle t. Exo : le faire !
Applications :
(i) Soit f : O → R une fonction de classe C2 et x0 ∈ O un point de minimum local de f. Prouver que f0(x0) = 0 [ou Df(x0) = 0 ou ∇f(x0) = 0] et que D2f(x0) ≥ 0. Puis prouver réciproquement que six0 est un point de Ooùf0(x0) = 0 etD2f(x0)≥ηIdpour un certainη >0 alors x0 ∈ O un point de minimum local de f.
(ii) Soitf :R →R une fonction de classe C∞. Montrer que, pour tout x∈R, h >0 :
|f(x+h) +f(x−h)−2f(x)| ≤Ch2M(x, h), oùC est une constante à expliciter et M(x, h) = sup[x−h,x+h]|f(2)(t)|.
(iii) Soit f :Rn →R une fonction de classe C2. On suppose que f,∇f, D2f sont bornés surRn et on pose :
M0 := sup
x∈Rn
|f(x)|, M1 := sup
x∈Rn
|∇f(x)|, M2 := sup
x∈Rn
|||D2f(x)|||,
où la norme||| · ||| est celle de la matrice en tant qu’application linéaire. Prouver que : M12 ≤4M0.M2.
4 Théorème des fonctions implicites
Le but de ce théorème est de prouver que, sous certaines conditions et localement, l’ensemble des points où :
F(x, y) = 0, peut s’écrire sous la forme plus explicite :
y=f(x). Mais comment retenir les conditions ?
La fonction F doit être suffisamment régulière, i.e. de classe C1. C’est une condition naturelle car on va vouloir dériver. Ensuite on écrit que, si c’est le cas :
F(x, f(x)) = 0. Et on dérive :
DxF(x, f(x)) +DyF(x, f(x)).Df(x) = 0 .
C’est un bon exercice de se convaincre du bien fondé de cette égalité et du bon ordre des termes car les "matrices"DyF(x, f(x)) et Df(x) ne commutent pas. Deux manières : composerF et x7→(x, f(x) en calculant les matrices jacobiennes (leurs formes) ou faire un DL !
Ensuite si on veut avoir Df(x), il faut pouvoir résoudre et donc écrire : Df(x) = −[DyF(x, f(x))]−1.DxF(x, f(x)).
Pour cela, il est mieux en général queDyF(x, f(x)) soit inversible...
Pratique :
(i) Faire un développement limité pour a proche de 0 de la solution x(a) [proche de 10]
de l’équation :
xe−ax= 10 .
On calculera les premiers termes puis on expliquera comme obtenir les autres.
(ii) Étudier les solutions de l’équation :
x3+px+ 1 = 0 pourp proche de 0.
Un exercice pour les “wizards” : inf-convolution.
Soit u : Rn → R une fonction de classe C2. On suppose que u, Du et D2u sont bornés surRn. On pose :
uε(x) = inf
y∈Rn{u(y) + |x−y|2 ε2 }.
Le but est de montrer que uε est de classe C2 pour ε assez petit et on pourra proceder comme suit :
(i) Étudier le problème d’optimisation pour xfixé (on pourra se rapporter au mini-cours d’optimisation) : montrer que l’infimum est atteint en un seul point y(x) si ε est assez petit.
(ii) Utiliser le théorème des fonctions implicites pour prouver que x7→y(x) est de classe C1 (la première question à se poser est : quelle équation satisfait y(x) ?).
(iii) En déduire le résultat.
5 Une incursion vers les formes différentielles
Le but de cette section est de discuter la question suivante : sig = (g1,· · ·, gn) est une fonction de classe C1 surRn, existe-t-il une fonction f telle queg =∇f?
La réponse est généralement non car, g étant C1, f est de classe C2 et le Théorème de Schwartz implique que :
∂2f
∂xi∂xj
(x) = ∂2f
∂xi∂xj
(x),
pour toutx∈Rn et 1≤i, j ≤n ce qui donne des conditions nécessaires surg :
∂gj
∂xi(x) = ∂gi
∂xj(x), pour toutx∈Rn et 1≤i, j ≤n.
Cet ensemble de conditions nécessaires est-il suffisant ? Dans Rn (ou dans un ouvert étoilé), la réponse est oui !
On choisit arbitrairement le point 0 comme point de base. Sif existe, on devrait avoir : f(x)−f(0) =
Z 1 0
h∇f(tx), xidt =
Z 1 0
hg(tx), xidt .
Et donc on va montrer que cette formule donne effectivement une fonction de classe C1 [ce qui est clair ?] dont le gradient estg. Pour cela, on commence par calculer ∂x∂f
i :
∂f
∂xi(x) =
Z 1 0
n
X
k=1
∂gk
∂xi(tx)txkdt+
Z 1 0
gi(tx)dt . Puis on utilise la condition nécessaire qui conduit à :
∂f
∂xi(x) =
Z 1 0
n
X
k=1
∂gi
∂xk(tx)txkdt+
Z 1 0
gi(tx)dt .
Enfin on remarque que l’intégrande pour les deux intégrales vaut exactement dtd[tgi(tx)].
Ce qui donne le résultat.
Exercice : Prouver (sans utiliser le résultat) que, si γ : [0,1] → Rn est un lacet de classeC1 alors l’intégrale :
Z 1 0
hg(γ(t)), γ0(t)idt = 0.
(on pourra penser à une intégration par partie). À quelle autre théorie mathématique cette propriété vous fait-elle penser ?
NB : Dans cette section, on a manipulé sans le dire la forme différentielle : dω = g1(x)dx1+g2(x)dx2· · ·+gn(x)dxnet l’intégrale de cette forme sur un cheminγ : [a, b] → Rn :
Z
γ
dω :=
Z b a
[g1(γ(t))γ10(t) +g2(γ(t))γ20(t)· · ·+gn(γ(t))γ0n(t)]dt.